뉴욕타임스, 오픈AI·MS에 저작권 침해소송 제기

컴퓨팅입력 :2023/12/28 10:47

뉴욕타임스가 오픈AI와 마이크로소프트를 상대로 저작권 침해소송을 제기했다. 뉴욕타임스의 기사에 의존해 GPT 모델을 훈련시키고, 답변 생성에 기사를 그대로 노출하며, 잘못된 정보로 자사 명예를 훼손하고 있다는 주장을 담았다.

뉴욕타임스는 27일(현지시간) 오픈AI가 자사의 뉴스 콘텐츠를 무단 사용해 대규모언어모델(LLM)을 학습시키고, 서비스를 운영하고 있다며 저작권 침해 소송을 제기했다.

뉴욕타임스는 오픈AI의 GPT 모델에 인프라를 제공하고, GPT 기반의 생성 AI 서비스를 제공하는 마이크로소프트도 함께 고소했다.

오픈AI

지난 8월 뉴욕타임스가 오픈AI를 상대로 한 저작권 소송에 나설 것이란 보도가 처음 나왔다. 이후 뉴욕타임스와 오픈AI는 협상을 벌였지만 합의 도출에 실패했다.

뉴욕타임스는 오픈AI의 GPT 시리즈 학습에 자사 기사가 막대한 비중을 차지했다고 주장했다. 뉴욕타임스는 "자사 1천600만개 고유 기록에서 나온 정보가 오픈AI의 GPT 교육에 활용됐다"며 "이는 위키피디아와 미국 특허 데이터베이스에 이어 세번째로 가장 많이 참조된 출처"라고 밝혔다.

학습 과정뿐 아니라 사용자에게 답변을 생성하는 과정에서도 뉴욕타임스 기사를 그대로 인용, 요약하거나 사실상 전체를 재현하는 경우가 흔하게 발견된다고 했다. 뉴욕타임스는 소장에서 자사 기사의 대부분을 그대로 재현하는 GPT-4의 사례를 다수 제시했다.

뉴욕타임스는 "유료구독으로 보호되는 콘텐츠를 GPT 기반 시스템에서 제공하는 것이 우스꽝스러울 정도로 쉽다"고 강조했다.

오픈AI를 비롯한 생성AI 개발업체들은 인터넷 상의 데이터를 LLM 학습에 사용하는 것을 '공정 사용'이라고 주장한다. 뉴욕타임스는 이같은 오픈AI의 주장에도 반박했다.

뉴욕타임스는 "공개적으로 피고인들은 생성 AI 모델을 교육하기 위해 저작권있는 콘텐츠를 무면허로 사용하는 것을 새로운 변형의 목적에 부합하기 때문에 공정 사용으로 보호된다고 주장한다"며 "그러나 타임스를 대체하고 청중을 빼앗는 제품을 만들기 위해 지불없이 타임스의 콘텐츠를 사용하는 것에서 '변형적인 것'은 없다"고 밝혔다.

관련기사

뉴욕타임스는 또한 생성 AI의 환각 현상이 자사의 평판과 가치를 훼손한다고 오픈AI를 비난했다. 뉴욕타임스에서 보도된 적 없는 기사를 뉴욕타임스 출처라고 제시하는 글을 작성하는 식으로 명예를 떨어뜨렸다는 것이다.

뉴욕타임스는 오픈AI와 마이크로소프트에게 자사의 자료를 사용해 훈련한 모든 GPT 인스턴스를 삭제하고, 훈련에 사용된 데이터세트를 제거하라고 요구했다. 유사행위 방지를 위한 영구금지 명령도 요청했다. 손해배상, 보상 등의 비용적 청구도 빠뜨리지 않았다.