오픈AI는 저작권 있는 데이터셋에 접근할 수 있어야 챗GPT 같은 인공지능(AI) 도구를 지속적으로 개발할 수 있다고 밝혔다.
더 가디언은 8일(현지시간) 오픈AI가 미국 하원 커뮤니케이션 및 디지털 선정위원회에 제출한 자료에 이같은 내용을 담았다고 보도했다. 저작권 있는 콘텐츠 접근 없이는 어떤 기술 발전도 기대할 수 없다는 내용이다.
AI 학습을 저작권 없는 콘텐츠로 만들면 문제가 발생한다고도 했다. 오픈AI는 "모델 훈련에 저작권 없는 공공 도메인 자료만 사용한다면, 개발사는 수준 낮은 AI 도구만 생성할 것"이라는 점도 덧붙였다. 또 "저작권 없는 콘텐츠는 부적절한 AI 시스템을 만들 수 있다"며 "현대인을 충족할 수 있는 AI 기능을 제공하지 못할 것"이라고 전했다.
자료 내용에 따르면, 현재 저작권은 블로그 게시물, 사진, 포럼 게시물, 소프트웨어(SW) 코드 스크랩, 정부 문서 등에 광범위하게 적용된다. AI 기업 입장에서 저작권 있는 자료를 사용하지 않으면 최신 AI 모델을 개발하는 것이 불가한 셈이다.
해당 자료는 지난해 11월 제출됐다. 당시 오픈AI의 저작권에 대한 입장이 크게 주목받지 못했다. 외신들은 잇따른 오픈AI의 저작권 소송으로 인해 다시 해당 자료를 조명한 셈이다.
관련기사
- "오픈AI, 뉴스 라이선스 비용으로 매년 65억원 지출 계획"2024.01.05
- 오픈AI, 생성형 AI 사업 다각화…"저작권 문제 걸림돌"2024.01.02
- "오픈AI, 챗GPT 전용 기기 제작 본격화"2023.12.28
- 뉴욕타임스, 오픈AI·MS에 저작권 침해소송 제기2023.12.28
지난달 뉴욕타임스(NYT)는 챗GPT 등 제품을 만들기 위해 저작물을 불법적으로 사용했다고 주장하며 오픈AI와 주요 투자자 마이크로소프트를 고소한 바 있다.
올해 초에는 미국 논픽션 작가 니콜라스 배스베인스와 니콜라스 게이지로부터 2명으로부터 맨해튼 연방법원에 저작권 문제로 고소당했다. 이들은 오픈AI가 모델 학습하는 데 자신들의 저작물 여러 권을 무단으로 사용했다고 주장했다.