[기고] AI 경쟁력 새 기준, 데이터 라이선싱

챗GPT 등장 이후 인공지능(AI)과 신기술, 혁신적인 서비스의 개발을 해하지 않으면서도 이용자의 권리와 개인정보를 보호하려면 어떤 것을 고려해야 할 지에 대한 논의가 최근 활발해진 분위기다. 급변하는 정보사회에서 AI와 개인정보 보호에 있어 우리 사회가 취해야 할 균형 잡힌 자세가 어떤 것인지에 대해 법무법인 태평양 AI팀에서 [AI 컨택]을 통해 2주 마다 다뤄보고자 한다. [편집자주]

AI 데이터 학습을 둘러싼 저작권 논의는 기술 혁신을 위한 공정 이용과 창작자 권리 침해라는 이분법에 갇혀 있었다. 최근 글로벌 저작권 소송과 빅테크들의 데이터 계약 움직임은 이같은 접근 자체가 바뀌어야 함을 보여준다. AI 발전을 멈추거나 창작권을 희생하는 문제를 넘어, 데이터를 어떻게 안전하게 지속 가능한 방식으로 확보할 것인가라는 현실적인 질문에 답하고 있어서다.

AI는 이미 기업의 핵심 인프라로 자리 잡고 있다. 거대언어모델의 고도화부터 특정 도메인에 특화된 버티컬 AI 에이전트의 구축에 이르기까지 서비스의 본질적 기능 상당 부분이 데이터 품질을 기반으로 재편되고 있다. 글로벌 주요 언론사와 콘텐츠 플랫폼들이 무단 크롤링에 제동을 걸며 데이터의 정당한 대가를 강조하는 배경 역시 여기에 있다.

그동안 AI 데이터 확보 논의는 주로 위험 통제나 침해 여부에 초점이 맞춰져 왔다. 현장에서는 어떤 데이터를 안심하고 써야 하는지, 향후 발생할 잠재적 저작권 리스크를 실제 운영 단계에서 어떻게 통제해야 하는지에 대한 혼란이 있었다. 기업 입장에서는 기존 개발 비용과 더불어 그 법적 부담감이 상당했던 것도 사실이다. 최근 급부상한 '데이터 라이선싱' 모델은 무분별한 스크래핑 제한보다 신뢰 가능한 데이터 유통 기준 마련에 방점을 찍는다는 점에서 이 간극을 메우려는 시도로 해석된다.

이는 기업 실무 관점에서도 의미가 크다. 기업이 AI 모델을 도입하거나 고도화할 때 가장 어려움을 겪는 부분은 알고리즘 자체의 성능이 아니라 데이터 출처에 따른 사후 책임과 내부 통제에 대한 불확실성이다. 합법적 데이터 라이선싱은 비용 지출 여부를 판단하는 기준을 넘어서 도입 이후 법적 안정성, 데이터의 독점적 사용 범위, 소비자 및 투자자 신뢰 확보 등 기업의 안정적 운영을 위한 관리 방법을 명확히 제시해 준다. 시장의 전향적 변화가 기업 한계를 제한하지 않고 오히려 예측 가능성을 높여 그 발전을 돕고 있는 셈이다.

이같은 접근은 본격 시행에 들어간 AI기본법과 데이터산업법, 저작권법 등 관련 법령 해석과 적용에서도 중요한 시사점을 제공한다. AI기본법이 산업 전반의 거버넌스와 위험관리 체계를 제시하는 보편적 규범이라면, 데이터 라이선싱 계약 표준은 지식재산권이라는 특정 영역의 위험 구조를 반영한 실무적 운영 기준에 가깝다. 향후 AI 생태계가 단일 법률에 의존해 모든 문제를 해결하기보다 공적 법제와 계약 질서가 상호 보완적으로 작동하는 방향으로 발전할 가능성을 시사한다.

AI 경쟁력은 이제 알고리즘 성능이나 자체 기술 규모만으로 결정되지 않는다. AI 도입 과정에서 발생할 수 있는 저작권 분쟁, 영업비밀 유출, 데이터 오염 문제에 대한 제도적·시장적 신뢰가 없다면 빠른 기술 도입은 오히려 리스크다. 한국어 데이터의 절대적 양이 부족하고 자본력이 열세인 국내 AI 산업 특성상, 우리 실정에 맞는 상생 모델이 충분히 고려될 필요가 있다. 데이터 무단 학습 규율은 이 문제의식을 구체화한 결과다.