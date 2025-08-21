오픈AI ‘챗GPT’ 등장으로 인공지능(AI) 시대가 본격 도래하면서 데이터의 전략적 가치가 점차 커지고 있다. 유럽 일반개인정보보호법(GDPR), 중국 데이터보안법, 미국 클라우드 액트 등 주요국은 데이터 주권을 강화하기 위해 규제를 잇따라 도입하고 있고, 데이터가 국경을 넘어 이동하는 것을 제한하거나 특정 산업 데이터를 국내에 보관하도록 하는 정책도 확산되고 있다. 특히 개인 정보와 산업 기술, AI 학습 데이터는 국가 경쟁력과 직결되는 자산으로 간주되고 있다. 이에 따라 데이터 주권은 단순한 법률 문제가 아니라 외교, 무역, 안보, 기술 전략까지 아우르는 핵심 의제로 부상했다. 향후 데이터 주권이 국가 간 협력과 갈등을 동시에 촉발하는 핵심 변수가 될 것이란 전망이 나온 가운데 지디넷코리아는 글로벌 AI 경쟁에서 한국이 어떻게 대응해야 할 지에 대해 심도있게 살펴보고자 한다. [편집자주]

AI 시대의 핵심 자산인 데이터 활용과 보호를 둘러싼 정책 방향이 여전히 모호하다는 지적이 나온다. 기술과 인프라는 앞서 있지만 이를 뒷받침할 통합적인 데이터 전략은 부재하다는 우려다.

21일 업계에 따르면 우리나라는 세계 상위권 수준의 통신망과 데이터센터 인프라를 갖추고 있음에도 데이터를 효과적으로 관리·활용하기 위한 국가 차원의 전략은 여전히 부족하다는 평가가 제기된다.

양적 성장에는 성공했지만 데이터 주권 확보를 위한 제도적·정책적 성숙도는 여전히 미흡하다는 지적이다.

우리나라의 데이터 활용·관리 정책과 거버넌스가 미흡하다는 지적이 제기된다. (사진=챗GPT 제작)

글로벌 상위권 디지털 인프라…정작 방향성은 '실종'

우리나라는 초고속 통신망을 기반으로 전국 단위 5G망, 다수의 하이퍼스케일 데이터센터, 안정적인 전력 공급 인프라를 보유하고 있다. 수도권은 물론 지방 거점도시까지 아우르는 분산형 구조도 갖추고 있어 디지털 인프라 측면에서는 기술 역량이 충분하다는 평가를 받는다.

마이크로소프트(MS)·아마존웹서비스(AWS)·구글 등 글로벌 빅테크들이 한국을 동북아 AI 거점으로 낙점한 배경에도 이러한 통신망과 인프라가 자리 잡고 있다.

그러나 이 같은 기반 위에 올라설 데이터 전략과 제도는 여전히 불투명한 것으로 평가된다. 정부 관계자는 "한국은 인프라 측면에서는 강하지만 데이터를 자원화하고 전략적으로 활용하기 위한 로드맵은 부족하다"고 말했다.

업계 우려도 비슷하다. 한 소프트웨어(SW) 기업 대표는 "데이터센터가 늘고 AI 클러스터 조성이 활발히 진행 중이지만 데이터를 수집하고 분석·교환할 수 있는 정책적 운영 체계는 여전히 파편적"이라며 "통합적인 체계가 없다면 글로벌 플랫폼의 하청 기지로 전락할 수 있다"고 지적했다.

많은 데이터보다 '쓸 수 있는 데이터'가 없다

정부는 2013년부터 공공데이터포털을 통해 10만 건 이상의 데이터를 개방하고 OECD 공공데이터 개방지수에서 4년 연속 1위를 차지하는 등 외형적인 성과를 거뒀다.

하지만 정작 산업 현장에서 활용 가능한 수준의 고품질 데이터는 여전히 부족하다는 목소리가 나온다. 공공기관마다 데이터 형식이 달라 통합 분석이 어렵고 메타데이터와 활용 가이드라인도 미비해 실제 분석에 착수하기까지 며칠이 걸리는 경우도 있다.

공공데이터포털 메인화면 (사진=공공데이터포털)

엑셀·PDF·스캔 이미지 등 비정형 형태의 원시 데이터가 많고 API 연결도 불안정해 자동화된 활용이 어렵다는 점도 문제로 지적된다.

업계에서는 많은 기관이 데이터를 자산으로 인식하지 않아 이를 보존하거나 재활용하는 체계를 갖추지 못한 점을 원인으로 꼽는다. 이로 인해 AI 학습이나 과학적 분석을 위한 기반 구축이 제대로 이뤄지지 않는다는 설명이다.

글로벌은 ‘데이터 스페이스’로…한국은 여전히 ‘각개전투’

해외 주요국은 민관 협력 기반의 '데이터 스페이스' 전략을 본격적으로 추진하고 있다. 유럽연합(EU)은 제조·헬스케어·에너지 등 산업별로 데이터 공유 플랫폼을 운영 중이며 일본은 전기차 배터리, 바이오 산업 등에서 정부와 기업이 공동으로 데이터를 축적·활용하는 구조를 마련했다.

반면 우리나라는 정부 부처와 지자체, 공공기관이 각각 데이터를 보유·관리하고 있어 통합적인 거버넌스가 부재하다는 평가다. 업계 관계자들은 "데이터가 어디에 있는지도 모른다", "책임 주체가 없어 품질 관리가 어렵다"는 등의 문제를 제기하고 있다.

정부는 이를 해결하기 위해 최근 '국가 데이터 인프라 고도화 사업'을 시작했다. 이 사업은 데이터 식별·정산·검색 시스템 고도화, AI 기반 의미 검색, 블록체인 기반 거래 이력 관리 체계 도입 등을 포함한다. 그러나 총사업 규모가 15억원 수준에 불과해 전체 구조적 전환을 이끌기에는 제한적이라는 분석도 나온다.

"데이터 정제 없으면 AI도 없다…민관 협업 체계 마련 시급"

AI 산업은 현재 범용 모델에서 산업 현장 맞춤형 응용 AI로 빠르게 전환되고 있다. 이 같은 전환에는 현장의 맥락과 특수성이 반영된 고품질 학습 데이터가 절실하다.

하지만 국내 공공 데이터는 정제 수준이 낮아 AI 개발을 위한 기초 데이터로서 활용이 어렵다는 지적이 제기된다. 실제로 AI 허브, 데이터 댐 사업 등에서 라벨링 오류, 형식 불일치, 최신성 부족 문제가 반복된 바 있다.

데이터 주권 확보를 위한 정책 방향과 민관 협업 체계가 마련돼야 한다는 목소리가 나온다. (사진=픽사베이)

한 AI 스타트업 대표는 "AI 시대에는 얼마나 많은 데이터를 개방했느냐보다 얼마나 정제된 데이터를 확보했느냐가 중요하다"며 "정부가 데이터 정제와 품질 검증을 위한 민관 협력 생태계를 구축하지 않으면 민간의 혁신도 더뎌질 수밖에 없다"고 말했다.

또다른 업계 관계자는 "글로벌 플랫폼은 방대한 데이터를 바탕으로 AI 플랫폼을 키우고 있지만 우리는 여전히 각 부처가 데이터를 보관하는 데 그치고 있다"며 "이대로 가면 AI 경쟁국이 아닌 데이터 종속국이 될 수 있다"고 우려했다.

이어 "AI 강국으로 가기 위해서는 기술 인프라 못지않게 데이터 주권 확보를 위한 정책 방향과 민관 협업 체계가 시급히 마련돼야 한다"고 강조했다.