생성AI의 저작권 침해, 어디까지 허용해야 할까

[김익현의 미디어 읽기] 미국 저작권청과 오픈AI의 두 가지 행보

데스크 칼럼입력 :2023/09/01 14:58    수정: 2023/09/01 16:51

김익현 미디어연구소장 기자 페이지 구독 기자의 다른기사 보기

챗GPT를 비롯한 생성 인공지능(AI)이 세상을 뒤흔들고 있습니다. 인간 고유의 영역이라고 생각했던 창작 분야에까지 영향을 미치고 있기 때문입니다. 생성 AI는 논문 같은 학술적인 글 뿐 아니라 시, 소설 같은 창작 활동도 충분히 해낼 능력이 있습니다.

그러다보니 저작권법이 AI를 어떻게 담아낼 지도 관심사로 떠오르고 있습니다. 쟁점은 크게 두 가지입니다.

첫째. AI 창작물에 대해 저작권을 인정할 것이냐.

둘째. AI의 저작권 침해를 어떻게 다룰 것이냐.

최근 미국 저작권청은 “AI가 만든 그림은 저작권 대상이 아니다”고 판단했습니다.

그렇다면 AI는 저작권을 전혀 인정받지 못할까요? 그렇지는 않습니다. 사람의 노력이 들어가 있을 경우에는 저작권 인정을 받을 수도 있습니다. 그런데 이 문제도 간단하지는 않습니다. “사람이 어느 정도까지 개입했을 때 저작권을 인정해줄 것인가”라는 문제가 남아 있기 때문입니다.

저작권 인정 문제가 공방이 벌어지고 있는 스테판 탈러의 인공지능 예술작품.

요즘 쟁점이 되고 있는 생성 AI의 저작권 침해도 마찬가지입니다. 챗GPT를 비롯한 생성 AI는 기사를 비롯한 각종 자료를 긁어가서 학습하는 것이 문제가 되고 있습니다. 뉴욕타임스를 비롯한 많은 언론들이 오픈AI를 제소한 상태입니다. 법정 공방이 시작되면 AI의 저작권 침해를 어떻게 볼 지 흥미로운 논쟁이 벌어질 것 같습니다. 

이런 문제와 관련해 이번 주 미국에서는 두 가지 의미 있는 움직임이 있었습니다. 그 얘기를 중심으로 AI와 저작권 문제를 한번 생각해보려고 합니다.

■ 오픈AI "저작권법은 사상표현을 보호하지, 사상 자체를 보호하는 건 아니다" 

지금 미국에선 작가들과 생성AI 전문 기업들이 법적 공방을 벌이고 있습니다. 코미디 작가인 사라 실버먼을 비롯해 판타지 소설가 크리스토퍼 골든, 리처드 카드레이 등이 오픈AI와 메타플랫폼스를 제소한 것이죠. 이들은  “오픈AI와 메타가 대규모언어모델(LLM)을 훈련하기 위해 저작권 있는 자료를 무단 도용했다”고 주장하고 있습니다.

그런데 오픈AI가 반격에 나섰습니다. 캘리포니아지역법원에 작가들의 소송을 기각해달라고 요구한 겁니다.

그렇다고 오픈AI가 소송 전체를 기각해야 한다고 주장한 건 아닙니다. 작가들의 주장 중 ‘직접 저작권 침해’를 제외한 나머지 주장들은 법정에서 논의할 가치가 없기 때문에 기각해달라고 요구했습니다.

제가 이 부분에 관심을 갖는 건 오픈AI의 주장에 동의하기 때문은 아닙니다. 앞으로 생성AI의 저작권 침해 공방에서 중요한 쟁점이기 때문입니다.

사진=지디넷닷컴

오픈AI는 작가들의 주장 중 ▲대위 침해(Vicarious Copyright Infringement) ▲디지털밀레니엄저작권법(DMCA) 침해 ▲불공정 경쟁 ▲부당이득 ▲과실책임 주장을 기각해달라고 요청했습니다.

이 중 ‘대위 침해’가 조금 생소할 겁니다. ‘대위침해'는 직접침해를 통제할 수 있는 능력과 권리를 가진 자가 직접침해로 인한 이득을 챙기는 경우에 성립됩니다. ‘대위 침해’는 원조 P2P 사이트 냅스터가 불법 판결을 받을 때 중요하게 적용됐던 조항입니다.

오픈AI는 작가들이 저작권법을 잘못 이해하고 있다고 주장합니다. 챗GPT의 학습 행위는 대용량 언어모델의 혁신을 위한 것이므로 공정 이용으로 인정할 수 있다는 겁니다. 챗GPT 학습 행위는 표절과는 분명한 차이가 있다고 주장합니다. “(대규모언어)모델에게 인간 언어의 기본 원칙을 가르쳐서 일상의 삶을 좀 더 이롭게 하기 위한 행위”라는 겁니다.

이 대목에서 오픈AI가 꺼내든 근거는 앞으로 논쟁을 할 때 중요한 쟁점이 될 것 같습니다. 오픈AI의 논리를 간단하게 요약하면 이렇습니다.

“저작권법이 저자의 사상표현 방식을 보호하는 것은 과학과 유용한 예술의 진보를 장려하기 위한 것이다. 같은 취지에서 근간이 된 사상 자체를 보호하는 것은 아니다. 그런데 챗GPT가 학습한 것은 후자다.”

또 “저자가 자기 책에 대한 저작권을 등록했다 하더라도, ‘단어 빈도, 문장 유형, 주제 표시’ 같은 통계적 정보까지 보호하는 것은 아니다”고 주장했습니다. 특히 오픈AI는 챗GPT 학습 행위가 저작권법 상의 ‘대위침해’에 해당된다는 주장에 대해 강하게 반박하고 있습니다.

오픈AI의 주장을 이런 비유로 바꿔볼 수 있을까요? 

"어떤 건축가가 멋진 집을 지었습니다. 그 집에 대해선 당연히 저작물로 인정해야 합니다. 그런데 집 건축에 사용된 벽돌, 기둥 같은 건축 자재들까지 저작권 보호 대상이 되는 건 아닙니다. 따라서 그 배치 순서를 학습했다고 해서, 그게 저작권 침해에 해당되는 건 아닙니다."

오픈AI는 작가들의 주장 중 '저작권 직접 침해'는 소송을 통해 해결한다는 입장입니다. 아마 법정에선 "작가들의 작품의 통계적 빈도를 학습한 뒤 그대로 재현한 건 아니다"고 주장하지 않을까요? 

법원이 이런 주장을 어떻게 받아들일 지는 지켜볼 대목입니다. 어쨌든, 작가들과 오픈AI가 다투고 있는 문제들은 생성 AI 저작권 논쟁에서 중요한 쟁점이 될 가능성이 많습니다. 미국에서 벌어지고 있는 일이긴 하지만, 충분히 관심을 가질 만한 사안인 것 같습니다.

■ 미국 저작권청이 던진 네 가지 질문…어떤 결론 이끌어낼까

미국 저작권청도 흥미로운 행보를 보였습니다. 저작권청은 이날 생성 AI의 저작권 문제에 대해 일반인들의 의견을 구한다고 공지했습니다.

저작권청은 연방관보에 총 24쪽 분량의 문건을 올렸습니다. 이 문건에 대중들의 의견을 구하는 내용이 담겨 있는데요, 총 4가지 쟁점에 대한 의견을 구하고 있습니다.

  • 첫째. AI 모델을 훈련할 때 저작물을 사용할 경우에 저작권 침해에 해당될까?
  • 둘째. AI가 만든 콘텐츠의 저작권 인정 범위는? 특히 사람이 AI 모델 운영에 어느 정도 개입했을 때 저작물로 인정할 수 있을까?
  • 셋째. AI가 생성한 콘텐츠가 저작권을 침해했을 때는 어떻게 책임을 물어야 할까?
  • 넷째. AI가 저작권을 침해하지는 않았지만, 예술가의 목소리나 스타일을 모방할 경우 인격권 침해나 불공정 경쟁 관련법을 적용할 수 있을까?

오픈AI가 법원에 제출한 문건과 미국 저작권청의 의견을 구한 조항들은 생성AI 시대에 제기될 수 있는 중요한 쟁점들을 담고 있는 것 같습니다.

지금 있는 저작권법은 생성 AI를 상상도 하지 못할 때 만들어진 법입니다. 우리 저작권법도 '인간의 사상 또는 감정을 표현한 창작물’에 한해 저작권을 인정하고 있습니다.

그런데 이제는 AI와 함께 살아가는 방법을 고민해야 할 때가 됐습니다. 법이나 제도 역시 AI 시대에 맞게 정비할 필요가 있다는 겁니다. 생성AI를 둘러싼 저작권 공방은 이런 필요를 잘 보여주는 대표적인 사례입니다.

관련기사

AI 시대 저작권 공방은 앞으로 어떻게 진행될까요? 많은 생성 AI 기업들이 인터넷에 공개된 방대한 자료를 학습시키고 있는데, 이런 행위에 대해 저작권법은 어떤 입장을 취하는 게 좋을까요?

미국에서 진행되고 있는 두 가지 사건은 이 질문에 대한 답을 찾고 있는 과정입니다. 앞으로 그 과정이 어떻게 진행되는 지 좀 더 많은 관심을 가져야겠습니다.

김익현 미디어연구소장sini@zdnet.co.kr