"AI 훈련 데이터 논란"…메타, 유튜브 사례로 '공정 이용' 주장

리브젠·Z-라이브러리 불법 자료 사용 소송…저커버그 증언으로 메타 입장 드러나

컴퓨팅입력 :2025/01/17 09:15    수정: 2025/01/17 10:39

메타가 인공지능(AI) 훈련 데이터 소송에서 유튜브의 불법 콘텐츠 관리 사례를 방어 논리로 활용한 사실이 드러났다.

17일 테크크런치에 따르면 메타의 AI 모델 '라마' 시리즈가 저작권이 있는 전자책 데이터세트를 훈련 자료로 사용했다는 소송은 지난 2023년 말 시작됐다. 이 소송에서 지난해 말 마크 저커버그 메타 대표는 법정 증언을 통해 데이터 사용과 공정 이용의 관계에 대해 유튜브 사례를 인용하며 해명했다.

문제가 된 데이터는 '리브젠'으로, 주요 출판사의 저작권 자료를 불법으로 공유해 수차례 법적 조치를 받은 플랫폼이다. 원고 측은 메타가 해당 자료를 라마 모델 훈련에 사용했으며 이를 기반으로 출판사들과 라이선스 협상을 해야한다고 주장했다.

마크 저커버그 메타 대표 (사진=메타 뉴스룸)

최근 수정된 고소장에는 메타가 지난해에도 불법 자료 제공 사이트 'Z-라이브러리'에서 데이터를 사용했다고 적시됐다. Z-라이브러리는 러시아 국적 운영자들이 저작권 침해 혐의로 기소된 사례가 있다.

저커버그는 지난해 말 증언에서 리브젠에 대해 잘 알지 못한다고 답했다. 다만 공정 이용과 관련해 "일부 콘텐츠가 저작권을 침해한다고 해서 플랫폼 전체를 금지하는 것이 항상 적합하지는 않다"고 말했다.

관련기사

또 그는 유튜브가 불법 복제된 콘텐츠를 일정 기간 호스팅할 수 있지만 플랫폼 차원에서 이를 삭제하려는 노력을 기울이고 있다는 점을 강조했다. 플랫폼의 일부 콘텐츠가 저작권 문제를 안고 있다고 해서 전체를 금지하거나 제한하는 것은 과도하다는 점을 시사한 것이다.

테크크런치는 "메타가 진행 중인 소송은 현재 미국 법원에서 진행 중인 AI 기업들과 작가·기타 지식재산권 소유자들 간의 갈등 중 하나"라며 "AI 기업들은 주로 저작권이 있는 콘텐츠를 훈련 데이터로 사용하는 것이 공정 이용에 해당한다고 주장하나 다수의 저작권 소유자는 이에 동의하지 않는다"고 분석했다.