싱겁게 끝난 번역대결…인간, AI에 완승

NMT 기계번역, 인간 번역사 위협하긴 일러

인터넷입력 :2017/02/21 16:51    수정: 2017/02/23 08:00

손경호 기자

인공신경망(NMT)으로 무장한 기계번역도 인간 번역사 수준엔 한참 못 미치는 것으로 확인됐다.

21일 서울 광진구에 있는 세종대학교 광개토관에선 '인간 vs 인공지능의 번역대결'이 열렸다. 국제통역번역협회와 세종대, 세종사이버대 주관으로 열린 이번 행사는 인공지능이 체스, 바둑에 이어 번역 영역에서까지 인간을 뛰어넘을 수 있을 지에 많은 관심이 쏠렸다.

하지만 이날 대결은 인간 번역사의 완승으로 싱겁게 끝났다. 특히 인간 번역사는 문학 뿐 아니라 실용문으로 구성된 비문학 영역에서도 기계번역을 압도했다.

21일 서울 광진구 세종대학교에서 열린 사람과 인공지능 간의 번역대결에서는 인간 번역사가 완승을 거뒀다. (사진=뉴스1)

3개 기계번역, 정확도-가독성 모두 인간에 크게 뒤져

이날 오후 1시 시작된 번역 대결엔 4명의 전문 (인간) 번역가들이 참여했다. 이들은 문학, 비문학 지문 4개를 놓고 50분 동안 각각 영한, 한영번역을 진행했다. 그런 다음 구글번역, 네이버 파파고, 시스트란의 번역결과가 공개됐다.

영어지문을 한글로 번역한 대결에선 문학, 비문학 모두 인간번역가들이 기계번역을 압도했다. 구글번역, 네이버 파파고, 시스트란으로 번역한 결과는 곳곳에 주술관계가 맞지 않거나 이해하기 힘든 문장들이 섞여 있었다.

대회 시작 전부터 고유 문체나 묘사가 중시되는 문학지문에서 만큼은 인간이 이길 것이라는 예상이 많았다. 하지만 비문학 영역에서도 인간이 기계를 압도했다.

문학 지문 영한 번역 중 인간 번역사가 "스티브가 청바지 꼬마 주머니에 손을 넣더니 최초의 아이폰을 꺼냈지하고 존 도어가 내게 당시 상황을 들려주었다"라고 번역한 부분을 기계 번역과 비교해보면 확연한 차이를 느낄 수 있다.

"스티브는 청바지의 맨 윗주머니에 손을 들어댔고 첫 아이폰을 꺼냈다라고 도어는 나에게 말했다"(A기계번역)

"스티브는 청바지의 주머니에 첫 아이폰을 꺼냈습니다 도어 씨가 나에게" 그리고 그는, 요한, 이 장치는 거의 회사를 위반했다고 말했다"(B기계번역)

"스티브는 청바지의 주머니에 들어가 첫 아이폰을 꺼냈습니다. 두어는 나를 생각 나게했다. 그는 말했다."라는 번역결과를 내놨다.(C기계번역)

세 기계 번역 모두 제대로 된 문장조차 만들어내지 못했다는 걸 알 수 있다.

비문학 지문 영한 번역에서도 결과는 다르지 않았다.

역시 인간 번역가가 "브랜드파이낸스(Brand Finance)는 2017년 세계 500대 기업 브랜드가치평가(Global 500 rankings)를 발표하고, 장난감 블록 제조업체인 레고가 구글을 제치고 세계에서 가장 영향력 있는 브랜드에 다시 등극했다고 밝혔다. 여기에는 에밋(Emmet)이라는 영화 캐릭터가 한몫했다는 게 영화계 인사들의 전언이다"라고 번역한 문장을 기계 번역과 비교해보면 수준 차이가 그대로 드러난다.

"브랜드 파이낸치어스의 2017 년 연간 세계 500 개 순위 보고서에 따르면, 레고는 최근 구글으로부터 자사의 왕관을 '가장 강력한 브랜드'로 가져갔다. 그리고 영화 전문가들은 Emmet 이라는 영화 캐릭터로부터 약간의 도움이 있었다고 말합니다."(A기계번역)

"레고 최근 다시 구글에 세계의 가장 강력한 브랜드로 브랜드 파이낸스의 2017년 연간 글로벌 500rankings 보고서에 따르면 우승했다. 그리고 영화 전문가들은 영화 캐릭터 에밋 이름의 작은 도움을 받고 있다고 말한다."(B기계번역)

"레고 (Lego)는 최근 브랜드 금융의 2017 년 글로벌 500 순위 보고서에 따르면 Google에서 세계에서 가장 강력한 브랜드로 선정했습니다. 영화 전문가들은 Emmet라는 영화 캐릭터가 약간의 도움을 받았다고 말합니다."(C기계번역)

"문학-시사 다뤄 인간 유리"…네이버 "200자 넘어 기존 번역 적용됐다"

대결에 대한 심사위원장을 맡은 한국통역번역사협회 곽중철 회장은 "인간 번역이 단연 우수했다"며 "30점 만점에서 인간 번역사가 25점 내외였고, 3대 기계번역 중 제일 나은 번역기가 15점대, 나머지 2대가 10점 이하를 기록했다"고 말했다. 이어 그는 "문학번역의 경우 기계번역이 문법이 안 맞거나 문장이 안 되는 경우도 있었다"고 설명했다.

이어 "출제문제가 상당히 어려웠다"며 "한번도 번역되지 않고, 저작권이 없는 텍스트로 골랐다"고 덧붙였다.

국제통역번역협회 강대영 국장은 "이 대결은 문학이나 시사쪽을 다뤘기 때문에 인간이 번역 분야에서 가진 강점이 두드러질 수밖에 없었다"며 "이후 더 세밀하게 여러 분야에 대해 번역을 한 결과를 비교했을 때 더 큰 의미를 가질 수 있을 것"이라고 말했다.

때문에 이러한 결과만을 두고 인간과 기계 간 번역대결을 정확히 평가하기에는 무리가 따른다. 더구나 인간은 결국 50분이라는 시간을 채워가며 번역의 완성도를 높인 것과 달리 기계번역은 텍스트를 입력하면 실시간으로 결과를 받아 볼 수 있다는 점에서 여전히 위협적인 존재다.

관련기사

번역기를 돌리는 작업에 참여했던 세종사이버대 김대균 교수는 "기계번역이 토익 정도 문장은 완벽하게 번역할 수 있다"며 "아직 시나 문학과 같이 정서적인 부분은 따라가지 못하지만 업무용 번역에서는 90% 이상 인간 번역사를 대체할 수 있을 것"이라고 말했다.

한편 이날 대결에서 네이버측은 인공신경망 기계번역(NMT)이 적용된 파파고가 아니라 기존 통계기반 번역(SMT)을 통해 번역한 결과가 반영됐다고 설명했다. 때문에 시스트란, 구글 외에 네이버는 NMT가 제대로 적용된 결과로 보기 힘들다. 현재 베타버전으로 제공되는 파파고는 200자를 넘어가게 되면 SMT 방식이 적용된다.