"인간-기계 번역대결, 협업 가능성 점친 계기"

데이터 베이스 구축 위한 정부 역할도 강조

인터넷입력 :2017/02/21 19:37    수정: 2017/02/22 09:13

세간의 이목을 집중시킨 인간과 인공지능(AI) 간 번역대결이 전문 번역가의 승리로 비교적 싱겁게 끝났다.

경기를 지켜본 번역 전문가들은 기계 번역이 인간을 대체할까의 고민보다는, 인간과 기계가 서로 어떻게 하면 효율적으로 협업할 수 있을까를 모색해야 한다고 말했다.

21일 인간 대 인공지능의 번역 대결이 열렸던 세종대학교 광개토관에서는 인간번역사의 번역문 심사가 이뤄지는 동안 패널 토론회가 진행됐다.(▶'싱겁게 끝난 번역대결…인간, AI에 완승' 기사보기)

국제통역번역협회 박미진 사무총장의 사회로 열린 토론회에는 솔트룩스 신석환 부사장, 시스트란 김유석 상무, 허명수 한국번역학회장, 숙명여대 곽성희 교수, 세종대 곽은주 국제학부 교수, 호주 맥쿼리대 아드리안 부소(Adrian Buso) 교수가 패널로 참여했다.

인간 vs 인공지능 번역대결 토론회.

■ 인간 vs AI 번역 대결, 협업 가능성 점검 계기

각 패널들이 공통적으로 강조한 것은 기계 번역의 발전이 인간 번역사를 위협하지 않는다는 것이다. 대신 신석환 솔트룩스 부사장은 결국 어떤 결과가 나오든 인공신경망(NMT)을 어떻게 사용할 것인가가 중요하다고 강조했다.

신 부사장은 “IBM 왓슨의 정확도가 99%라도 사람은 목숨을 기계에게 맡기지 않는다. 오류가 날 수 있는 0.1% 때문에 사람이 관여할 수밖에 없다"며 "인공지능과 사람의 협력, 즉 기계가 더 잘해줄 수 있는 것을 명확히 파악하고, 인간이 더 잘할 수 있는 것을 찾아야 4차 산업혁명에서 앞서갈 수 있다”고 말했다.

시스트란 김유석 상무는 “NMT의 등장으로 기계번역이 사람과 적극적으로 협업 가능한 수준까지 올라왔다”면서 “기계와 사람이 어떻게 효율적으로 협업할지가 마지막 남은 문제”라고 조언했다.

기계번역은 문법 등 명시된 언어 규칙만으로 이해할 수 없는 비언어적 표현이 장애물로 꼽힌다.

이에 허명수 한국번역학회장은 “알파고는 바둑 두는 상대방의 아우라, 기풍, 포커페이스 등 비언어적 표현이 인식되지 않기에 유리했다면 기계번역은 반대”라며 “문화적 차이, 언어유희나 아이러니, 감정 등이 번역에서 중요한 요소라 기계번역이 불리했다”고 말했다. 이어 “AI와 음성인식을 결합한다고 봤을 때 가장 어려운 것이 통역”이라며 “통역 대상의 비언어적 표현을 기계가 이해할 수 없다”고 덧붙였다.

패널로 참석한 곽은주 교수는 앞으로 다양한 상황별 번역기가 고안될 것으로 예측했다.

곽 교수는 “단순 사실적인 정보에 가까운 지시적 의미 전달 욕구가 충족되면 인간은 함축적 의미도 전달하고 싶어할 것”이라며 “인간의 수요에 맞춰 번역기를 만들어낸다면 각각의 텍스트 성격에 맞는 번역기를 만들게 될 것이고, 인간 번역가는 텍스트 종류와 목적에 따라 가장 최적의 번역기를 골라내는, 와인 소믈리에와 유사한 역할을 해야 한다”고 역설했다.

또 그러기 위해서는 번역가가 그만큼 번역기에 대해 잘 알아야 한다고 강조했다.

네이버랩스의 파파고, 구글번역, 시스트란이 제공하는 번역서비스는 모두 인공신경망 기계번역(NMT)을 도입해 더 자연스러운 번역 서비스를 제공한다고 강조한다.

■“정부가 번역에 필요한 공공 데이터 구축해야”

이번 토론회에서는 인공지능을 이용한 번역이 번역 산업을 위협하지 않을 것이라는 전제 하에, 앞으로 인공지능 번역 기술을 어떻게 효과적으로 발전시킬지에 대한 각 패널들의 의견들이 나왔다. 패널들은 기계번역에 필요한 대량의 데이터를 국가 차원에서 마련할 필요성이 있다는 점에 입을 모았다.

김유석 시스트란 상무는 "하드웨어나 소스는 공개돼 있는데 부족한 것은 데이터다. 번역 사업이 매우 유망하고 수요가 많은에도 불구하고 그런 데이터가 축적된 저장소가 많지 않다"며 "기업들이 엔진을 만들어낼 수 있는 기반은 있지만 데이터가 부족한 상황"이라고 지적했다.

관련기사

이에 곽성희 교수는 정부의 지원을 해답으로 제시했다. 곽 교수는 “개인 회사는 절대 데이터베이스를 내놓지 않는다. 기계번역 기술을 갖고 있는 기업들이 성과를 내기 위해서는 충분한 자산을 보유한 정부가 데이터 베이스를 구축해야 한다”고 말했다.

패널 토론에서 신석환 부사장은 “NMT는 질 높은 문장 데이터가 최소 100만 개 이상 필요하다”며 “한국어-영어 데이터 축적은 기업이 할 수 있을지 몰라도 다른 언어는 그럴 수 없다. 한국이 동북아의 중심이 되기 위해서는 정보교환, 취득의 중심인 번역에 투자할 필요가 있다”고 강조했다. 그는 또 “개별 기업이 투자하기에 한계가 있는 데이터 베이스 기반을 구축한 뒤 중소기업, 기관, 학교 등에서 이용할 수 있도록 해야 한다”고 덧붙였다.