개발자 조차 긴장시킨 '글 너무 잘 쓰는' AI

“4월 어느 화창하고 쌀쌀한 날이었다. 벽시계가 13시를 가리켰다.”

조지 오웰의 화제작 ‘1984’는 이런 문장으로 시작한다. 1949년 출간된 ’1984’는 인간을 감시하는 암울한 미래상을 그려낸 소설로 유명하다.

이 문장을 인공지능(AI)에게 제시했다. 그러자 곧바로 다음과 같은 문장을 만들어냈다.

“나는 차를 타고 시애틀에 있는 새 일자리로 가는 길이었다. 가스를 넣고, 키를 꽂은 뒤 차를 달렸다. 오늘 어떤 날이 펼쳐질 지 상상했다. 지금으로부터 100년 뒤인 2045년. 나는 중국 시골의 한 가난한 지역의 교사다. 중국사와 과학역사로 시작했다.”

똑똑한 AI는 ‘1984’의 두 문장만으로도 작품 분위기를 파악했다. 모호한 미래상을 그린 소설. 그리곤 곧바로 비슷한 이야기를 만들어냈다.

■ 40GB 분량 텍스트 학습…어떤 얘기도 척척 이어줘

화제의 주인공은 비영리단체 오픈AI가 개발한 GPT-2다. 이 정도 능력이면 완벽한 글쓰기 도구로 극찬을 받음직하다. 하지만 이 기술을 개발한 오픈AI는 고민에 빠졌다. ‘가짜뉴스 양산 도구’로 악용될 수 있다는 우려 때문이다.

GPT-2는 문장 생성 전문 AI 플랫폼이다. 간단한 문장만 제시하면 그럴듯한 얘기로 이어준다. 적합한 다음 문장을 찾는 능력 덕분이다.

물론 이 능력을 갖추기까지 엄청난 공부를 했다. 가디언에 따르면 1천만 건 이상의 글을 포함한 데이터세트를 기반으로 훈련했다.

학습 텍스트 선정 과정도 유별났다. 미국 소셜 뉴스 사이트 레딧에서 최소 3표 이상을 받은 링크를 기반으로 학습 자료를 수집했다.

이렇게 학습한 텍스트 분량이 40GB에 이른다. 영문학의 대작 소설로 꼽히는 ‘모비딕’ 3만5천권과 맞먹는 분량이다.

테슬라 창업자인 일런 머스크가 트위터를 통해 오픈AI와 거리두기에 나섰다.

덕분에 GPT-2는 간단한 문장만으로도 작품 전체 분위기와 문체를 파악한다. 그런 다음 방대한 데이터베이스에서 그럴듯한 뒷 이야기를 이어준다.

문제는 GPT-2의 능력이 너무나 뛰어나다는 것. 순식간에 ‘진짜보다 더 진짜 같은 거짓말’을 만들어내는 능력 때문에 엄청난 비판이 쏟아졌다.

당장 연구를 중단해야 한다는 압박이 가해졌다. 오픈AI가 ‘오픈’과 상반된 작업을 하고 있다는 비아냥도 뒤따랐다.

논란이 커지자 일런 머스크조차 오픈AI와 거리두기에 나섰다. “오픈AI와 긴밀한 관계를 갖지 않는지 1년이 지났다”고 해명했다.

놀란 건 외부인들 만이 아니었다. 이 기술을 만들어낸 오픈AI 연구진들조차 깜짝 놀랄 정도였다. 결국 이들은 GPT-2를 전면 공개하지 않기로 했다. 그냥 내놓을 경우 ‘가짜뉴스 양산기’로 악용될 수 있단 우려 때문이었다.

■ 인간이 사악한 걸까? AI 기술이 사악한 걸까?

인류는 200년 전 메리 셸리가 쓴 ‘프랑켄슈타인’ 이래 인간을 지배하는 기계에 대한 원초적 공포를 갖고 있다. (참고로 메리 셸리는 19세기 영국 낭만파 3대 시인 중 한명인 퍼시 셸리의 부인이다.) ‘터미네이터’를 비롯한 수많은 SF 영화들은 이런 공포를 키우는 데 많은 역할을 했다.

하지만 특정 용도에만 초점을 맞춘 AI는 인간을 지배할 능력은 없다. 적어도 지금 시점에선 그렇다.

그런데 GPT-2는 ‘글쓰기에 관한한’ 범용에 가깝다. 인류에 영향을 끼친 수 많은 글들을 섭렵하면서 터득한 글쓰기 능력은 인간의 상상을 뛰어넘기 때문이다.