"지난 10년간 신산업 육성에 실패한 결과 우리의 디지털 전환은 실패했습니다. 데이터가 나라에 쌓이지 않으니 인공지능(AI) 개발은 출발선부터 난항을 겪을 수밖에 없습니다."
구태언 법무법인 린 변호사는 25일 과학기술정보통신부 주최로 열린 'AI 3대 강국을 위한 데이터 규제 혁신 간담회'에서 '데이터 규제 혁신 방안'을 주제로 발제하며 이같이 말했다. 그는 한국 경제의 저성장 원인이 신산업 부재에 있으며 그 근간에는 경직된 규제로 인한 데이터 흐름 단절이 자리 잡고 있다고 진단했다.
구 변호사는 데이터 편중, 산업별 규제 장벽, 경직된 데이터 보호법 등 '3대 문제'로 인해 국내에는 빅테크 기업이 성장하지 못했다고 분석했다. 그 결과 자체 파운데이션 모델(LLM) 개발이 미국과 중국에 비해 뒤처진 현실에 직면했으며 이는 AI 경쟁력의 심각한 저하로 이어진다고 비판했다.

이날 간담회 토론 세션은 구 변호사의 문제 제기를 시작으로, AI 산업을 가로막는 데이터 규제의 현실을 진단하고 실질적인 해법을 모색하기 위해 마련됐다. 류제명 과기정통부 제2차관이 주재한 이 자리에는 AI 기업 대표, 법률 및 학계 전문가들이 참석해 열띤 토론을 벌였다.
"韓, 데이터 갈라파고스…美·中·日은 AI 위해 질주 중"
구태언 변호사는 한국이 데이터 규제에 갇혀 뒤처지는 동안 주요 경쟁국들은 AI 패권을 잡기 위해 규제 패러다임을 발 빠르게 전환하고 있다고 역설했다. 그는 미국, 중국, 일본, 심지어 유럽연합(EU)까지 각자의 방식으로 데이터의 빗장을 풀며 AI 산업 육성에 사활을 거는 현실을 직시해야 한다고 강조했다.
구 변호사에 따르면 AI 최강국 미국은 연방 차원의 포괄적인 개인정보보호법이 없는 대신 의료정보보호법(HIPAA)처럼 분야별로 합리적인 규제를 적용하고 있다. 특히 HIPAA의 '세이프 하버' 조항은 18개 특정 식별자만 제거하면 의료 정보도 자유롭게 비식별 정보로 유통할 수 있도록 명확한 기준을 제시해 의료 AI 발전의 기틀을 마련했다.
중국은 국가 주도로 '데이터댐'을 구축하며 미국을 맹추격하고 있다. 자율주행 기술 확보를 위해 도로 영상 데이터를 적극 수집하고 자국 기업이 데이터를 해외로 유출하지 못하게 막는 방식으로 자국 AI 생태계를 키우고 있다.
구 변호사는 "중국 우한에 가면 자율주행 택시가 수백 대 돌아다니고 있다"며 "도로를 찍지 않고서 어떻게 자율주행차가 나올 수 있겠는가"라고 반문했다.
과거 경직된 개인정보보호 규정(GDPR)을 만들었던 EU조차 최근 AI 기술 격차에 위기감을 느끼고 규제 완화에 나섰다. 일본은 유연한 개인정보보호법과 AI 학습을 허용하는 저작권법 개정을 통해 빠르게 경쟁력을 회복하고 있다. 구 변호사는 이를 '디지털 메이지 유신'에 비유했다.

반대로 한국의 현실은 '과잉 규제'로 요약된다. 구 변호사는 공공과 민간에 동일한 잣대를 들이대는 단일 법체계가 가장 큰 문제라고 지적했다.
그는 "민간은 계약 기반이라 소비자가 해지하면 그만"이라며 "인권침해 우려가 큰 정부 부문에 적용할 논리를 민간 기업에 그대로 적용하고 있다"고 비판했다.
특히 비식별정보에 대한 명확한 기준이 없고 식별 가능성을 지나치게 넓게 해석하는 점, 그리고 AI 학습 자체를 개인정보 '처리'로 간주하는 경향이 데이터 활용의 발목을 잡고 있다고 설명했다.
여기에 더해 그는 "일본도 개인정보보호법 위반은 형사처벌하지 않고 위원회 시정명령에 불복할 때 형사처벌한다"며 "우리는 동의 없는 제3자 제공 등을 형사처벌하고 있어 굉장히 큰 차이가 있다"고 지적했다.
이러한 규제 환경은 결국 스타트업의 데이터 확보를 원천적으로 어렵게 만든다. 대기업은 자체 수집한 데이터를 활용할 수 있지만 데이터 유통 시장이 막힌 상황에서 스타트업은 AI 개발에 필요한 데이터를 구할 길이 없다. 이에 나라 전체적으로 돈은 많이 쓰는데 뛰어난 AI는 안 나오는 비효율적인 중복 투자로 이어질 우려가 있다.
구 변호사는 해법으로 '디지털 대전환'과 '명확한 기준 제시'를 제안했다. 그는 모든 산업의 디지털 전환을 통해 플랫폼을 육성해야 거대한 '데이터댐'이 만들어질 수 있다고 강조했다. 또 당장 입법이 어렵다면 정부의 유권해석을 통해서라도 '구별'과 '식별'의 개념을 명확히 하고 '공공누리 2~4유형 데이터'나 공공 저작물을 AI 학습에 활용할 수 있도록 길을 열어주는 것이 시급하다고 밝혔다.
구태언 변호사는 "법 개정이 어려운 현실을 감안할 때 ICT 규제 샌드박스를 통해 글로벌 표준에 맞는 합리적 규제를 실증하고 사회적 합의를 만들어나가는 것이 현실적인 대안이 될 수 있다"고 강조했다.
업계 "데이터 족쇄, 이렇게 풀어달라"
구태언 변호사의 발제 이후 이어진 토론에서는 AI 산업 현장의 기업인들과 법률·학계 전문가들의 생생한 고충과 현실적인 제언이 쏟아졌다. 참석자들은 데이터 확보의 어려움, 저작권 문제, 경직된 규제의 한계를 지적하며 저마다의 해법을 제시했다.
유성원 루닛 최고기술책임자(CTO)는 한국이 의료정보 전산화에서는 미국보다 앞섰음에도 데이터 활용이 더딘 이유로 모호한 법제와 가이드라인을 꼽았다. 그는 현행 보건의료 데이터 가이드라인이 비식별화된 데이터마저 개인정보로 간주하는 경향이 있어 데이터 제공자와 사용자 모두를 보수적으로 만들어 산업 발전을 저해한다고 지적했다.
유 CTO는 "모호한 가이드라인 때문에 데이터 제공자와 사용자 모두 가능하면 데이터를 공유하지 않으려 하고 제한된 환경에서만 공유하려는 경향이 생긴다"며 "결과적으로 우리가 전산화에는 앞섰지만 데이터를 활용한 산업이나 AI 발전은 더뎌졌다"고 말했다.
김성훈 업스테이지 대표는 양질의 데이터 확보가 불가능에 가까운 현실을 토로했다. 그는 '한국의 얼'이 담긴 교과서나 수능, 공무원 시험 데이터를 구하려 해도 저작권 기관이 가격조차 매기지 못하는 상황을 설명했다.

김 대표는 "음악저작권협회처럼 정부가 '데이터 연금 풀' 같은 것을 만들어주면 우리는 오늘부터라도 데이터를 가져다 쓰고 나중에 수익이 발생했을 때 정산하고 싶다"며 "좋은 글을 쓴 기자나 창작자들도 자신의 데이터로 연금을 받을 수 있는 선순환 시스템을 만들자"고 제안했다.
김세엽 셀렉트스타 대표는 저작권자와 AI 개발사 사이의 간극을 지적했다. 그는 저작권자는 모델 상용화 시 발생할 미래 수익의 분배까지 요구하는데 비해 개발사는 불확실한 미래 가치를 두고 협상하기 어려워 데이터 거래 자체가 막히고 있다고 설명했다. 이 배경에는 AI 모델을 '2차 저작물'로 보는 인식의 차이가 있다고 분석했다.
김 대표는 "기술적으로 AI 모델은 원본을 복제한 2차 저작물이 아니라 학습 후 남은 특징을 활용하는 지능"이라며 "정부 차원에서 'AI 모델은 2차 저작물이 아니다'라는 원칙을 명확히 중재해줘야 정해진 범위 안에서 현실적인 비용 논의가 이뤄질 수 있다"고 말했다.
송호철 더존비즈온 대표는 모든 데이터를 하나로 묶어 논의하는 방식에서 벗어나 데이터의 종류에 따라 구체적으로 나눠 해결책을 찾아야 한다고 제안했다. 그는 CCTV 같은 센싱 데이터, 블로그 같은 창작물, 기업의 전사적 자원관리(ERP) 데이터 등은 저작권과 개인정보 침해 정도가 모두 다르므로 세분화된 접근이 필요하다고 강조했다.
송 대표는 "지금까지 개인정보 보호 측면만 너무 강조되는데 사실 돈이 되는 것은 기업들이 어떤 일을 하고 있는지에 대한 '산업 데이터'"라며 "이 데이터가 유통되지 못하는 이유는 '해도 되나'를 모르기 때문으로, 이 애매함을 해소하는 논의가 필요하다"고 밝혔다.
정진우 트웰브랩스 이사는 데이터 확보, 구축, 활용 각 단계의 어려움을 호소했다. 그는 모델 성능 고도화를 위해 방송사 원본 영상이나 CCTV 같은 고품질 원본 데이터가 필수적이지만 영상 비식별화 기준이 없어 사실상 확보가 불가능하다고 말했다. 또 정부 데이터 안심구역은 대규모 컴퓨팅 자원이 필요한 파운데이션 모델 학습에는 부적합하다고 지적했다.
정 이사는 "지금까지 구축된 고품질 데이터가 어디에 있는지조차 알 수 없다"며 "정부가 데이터 카탈로그를 만들어 양성화하고 파운데이션 모델 개발사가 활용하는 민간 클라우드 위에서 안전하게 학습할 수 있도록 '안심구역'의 패러다임을 전환해달라"고 제언했다.
관련기사
- [현장] 류제명 차관, 취임 후 매주 현장으로…"AI 데이터 규제, 이번엔 끝장 본다"2025.07.25
- "한국형 GPT의 필수요소"…정부, AI 학습용 데이터 민간서 직접 모은다2025.06.23
- "우승하면 최대 30억"…과기정통부, AI R&D 전쟁에 불 지폈다2025.06.18
- 과기정통부, 메타·로블록스 손잡고 '가상융합 개발자' 키운다2025.05.12

장시간 이어진 토론을 경청한 류 차관은 이날 제시된 아이디어들을 직접 메모했다고 언급하며 조속한 해결 의지를 재차 강조했다. 그는 불확실성이라는 '캄캄한 터널' 속에서 기업들이 달리게 할 수는 없다며 이번 간담회가 끝이 아닌 시작임을 분명히 하고 지속적인 소통을 약속했다.
류제명 제2차관은 "기업들이 마음껏 달려야 하는데 불투명하고 캄캄한 터널을 뛰어가게 할 수는 없다"며 "수시로 의견을 주고받을 수 있는 상시적인 공론의 장을 바로 만들어 제기된 걸림돌들을 하나씩 해결해 나가겠다"고 말했다.