올해 미국에서 AI의 저작물 학습에 대한 판결이 지속적으로 선고되고 있는 가운데, 문화체육관광부는 이번 달 초 ‘생성형 AI의 저작물 학습에 대한 저작권법상 '공정이용' 안내서 초안을 공개했다. 이 안내서는 우리 저작권법상 어떠한 저작물을 저작자의 허락 없이 이용한 행위가 공정이용에 해당하는지 여부를 판단할 때 고려되는 네 가지 요소 및 대법원이 판례(2021다272001)에서 추가적으로 제시한 고려요소에 입각, 생성형 AI의 저작물 학습의 공정이용 판단 기준을 아래와 같이 구체적으로 제시했다.

먼저 공정이용 판단 시 저작권법상 첫번째로 고려할 요소인 ‘저작물 이용 목적 및 성격’과 관련하여, 학습된 저작물의 표현적 요소가 AI가 생성한 결과물에 반영되지 않고, 결과물이 전혀 다른 용도로 활용되는 경우에는 AI의 저작물 학습이 원저작물을 새로운 표현과 의미로 변경하여 새로운 가치를 부여하는 이른 바, ‘저작물의 변형적 이용’에 해당하여 공정이용 판단에 유리하게 작용할 수 있다.

또한 AI에 "특정 작가의 화풍으로 그려줘"와 같이 이용자가 원저작물과 동일 또는 유사한 결과물을 생성해달라는 스크립트를 입력할 시, 이를 거절하도록 설계한 기술적 조치 역시 AI 모델의 저작물 학습이 공정이용으로 판단되는데 도움이 된다. 그리고 AI의 저작물 학습이 연구·교육 등을 목적으로 하며, 비영리적인 성격으로 행해진다면 공정이용으로 인정될 가능성이 상대적으로 높다.

다음으로 대법원이 공정이용 판단의 추가적인 고려 요소로서 제시하고 있는 저작물 이용의 경위 또는 방법과 관련하여, 유료 제공 저작물의 무단복제물을 취득하거나, 웹사이트의 이용약관을 위배하여 저작물을 취득하는 행위는 공정이용 판단에 불리하게 작용할 수 있다. 로봇 배제 표준(robots.txt)으로 수집이 금지된 저작물을 무단 수집하여 AI 학습에 이용하는 경우도 마찬가지다.

또한 저작권법상 두번째 고려 요소인 ‘저작물의 종류 및 용도’와 관련하여서, 사실 및 정보 전달 등을 목적으로 하는 사실적 저작물은 저작권법에서 보호 대상으로 하는 창작적 표현 요소가 제한되어 있기 때문에 문학·예술적 저작물에 비하여 상대적으로 공정이용에 유리하게 판단될 수 있다. 그리고 비공개되거나 유료로 제공되는 저작물에 비하여 온라인상에 자유롭게 접근가능한 저작물을 학습시키는 경우 또한 공정이용 판단에 유리하게 고려될 수 있다.

한편 저작권법상 세번째 고려 요소인 ‘이용된 부분이 저작물 전체에서 차지하는 비중과 그 중요성’과 관련해서는, 일반적으로 인공지능의 학습에 저작물 전체가 이용되기 때문에 공정이용 판단 시 불리할 수는 있다. 다만, 이 고려요소는 다른 고려 요소들과 종합적으로 고려되어야 하고, 저작물 전체가 이용된다는 사실 자체만으로 공정이용을 부정하는 사유로 삼기는 어렵다고 본다.

황혜진 법무법인 디엘지 변호사

마지막으로 저작권법상 네번째 고려 요소인 ‘저작물의 이용이 기존 저작물의 현재 또는 잠재적인 시장 또는 가치에 미치는 영향’과 관련해서는, AI가 생성한 결과물이 학습된 원저작물의 표현을 직접적으로 재현하지 않으면서, 독립된 효용을 가지고, 원저작물을 대체하지 않는 경우, AI가 생성한 결과물과 원저작물과의 경쟁 관계가 형성되지 않아 공정이용 판단에서 유리한 요소로 인정될 수 있다.

안내서는 생성형 AI 학습을 위한 이용허락 시장은 저작물의 종류나 학습 방식, 모델의 특성에 따라 이미 일부 형성되어 있거나, 향후 합리적으로 예견되거나 개발 가능성이 있는 시장으로 볼 수 있어서, 그러한 이용허락 기회를 명백히 훼손하여 시장을 대체하거나 약화시킬 가능성이 있는 경우 공정이용 판단에 불리하게 고려될 수 있다고 보았다.

이러한 해석은 저작물의 공정이용에 대한 기존의 대법원 판례(2021다272001)를 참고한 것이기는 하나, 잠재적 시장 가능성만으로 공정이용 판단에 불리할 수 있다는 점이 AI 기술 개발 현장에서 과도한 위축 효과를 초래할 우려가 있다.

또한 안내서는 생성형 AI의 저작물 학습에 관한 지침임에도, 정작 공정이용에 해당할 수 있는 구체적 사례로 ‘이공계 논문 데이터를 분석하는 AI 개발’, ‘영상에서 인물의 동작 패턴을 분석하는 AI 모델 개발’을 제시하고 있다. 그러나 이러한 모델들은 학습데이터를 기반으로 새로운 표현물을 생성하기보다 정보와 패턴을 추출하는 분석형 AI에 가깝다는 점에서 아쉬움이 있다. 이는 국회의 입법과 법원의 판단이 부재한 상황에서 챗지피티(ChatGPT), 미드저니(Midjourney) 등 전형적인 생성형 AI 모델을 전제로 한 공정이용 사례 제시에 정책적 부담이 작용한 것으로 해석된다.

이번 안내서는 생성형 AI 학습의 법적 판단 기준을 제시했다는 점에서 산업계와 저작권자 모두에게 큰 의미가 있다. 다만 잠재적 이용허락 시장을 고려하는 접근은, 적법하게 구매한 서적을 이용한 AI 학습이 공정이용에 해당한다고 본 앤트로픽 판결(Bartz v. Anthropic)이나, LLM이 원저작물의 시장을 대체한다는 증거가 없다는 이유로 공정이용을 인정한 메타 판결(Kadrey v. Meta) 등 미국의 비교적 완화된 입장과는 온도 차가 있다.

결국 안내서가 제시한 기준은, 영리적 목적의 생성형 AI 개발에 있어 저작권자로부터 학습 이용허락을 득하여야 한다는 논거에 힘을 실어줄 가능성이 크다. 현재 안내서는 초안이므로 향후 확정된 안내서는 물론, 법원의 관련 판결 또한 지켜보아야 한다. 궁극적으로는 학습데이터 이용과 관련하여 이용 규모 기반 차등 로열티, 분야별 패키지 라이선스, 수익 분배형 라이선스 등 유연한 이용허락 모델을 도입함으로써 한국 AI 산업의 성장과 저작권 보호의 조화를 도모할 필요가 있다.

