"기계번역, 부품처럼 다양하게 활용될 것"

네이버 "딥러닝 통해 비약적인 발전 덕분"

인터넷입력 :2017/03/29 17:04

손경호 기자

"딥러닝으로 비약적인 발전을 거둔 기계번역은 그 자체로도 의미가 있지만 다른 서비스나 플랫폼에 들어가서 가치를 높여주는 부품으로서 역할이 큽니다. 관광이나 전자상거래 등 여러 분야에 긍정적인 영향을 줄 수 있기 때문에 더 많은 관심을 갖는 것 같습니다. 어렸을 때부터 겪었던 영어공부에 대한 스트레스를 줄일 수 있고요."

사람을 대신해 컴퓨터가 번역을 대신해 주는 기계번역은 인공지능(AI) 중 머신러닝 분야, 그 중에서도 특히 딥러닝이라는 기술이 나오면서 눈에 띄게 품질이 좋아졌다. 이제는 스마트폰 하나만 있으면 누구나 자연스럽게 외국인들과 일상적인 대화를 나눌 수 있는 수준까지 왔다.

네이버 파파고 김준석 리더.

29일 지디넷코리아와 국회 4차산업혁명포럼이 서울 코엑스 인터컨티넨탈호텔에서 공동 주최한 '독일 인더스트리 4.0을 통해 본 한국형 4차산업혁명 모델' 컨퍼런스에서 인공신경망 기계번역을 주제로 발표에 나선 네이버 파파고 김준석 리더는 딥러닝을 만나 큰 성과를 거둔 기계번역이 앞으로는 다른 여러 분야와 만나 본격적인 도구로서 역할을 하게될 것이라고 강조했다.

■ 기계번역 품질 개선의 역사

김준석 리더에 따르면 딥러닝이 적용된 여러 분야 중에서도 특히 기계번역의 성과가 좋은 이유는 이미 전 세계 사람들이 수많은 텍스트를 다른 언어로 번역한 결과물들을 올려놨기 때문이다. "다른 영역에 비해 딥러닝을 통해 학습할 데이터가 풍부하다"는 설명이다.

이제 서비스가 나오기 시작한 챗봇과 같은 분야는 처음부터 각 영역에 맞는 학습데이터를 구축해야하는 만큼 시간이나 비용이 많이 들 수밖에 없다. 반면 번역 영역에서는 이미 쌓여있는 데이터를 활용해 어떻게 번역품질을 높일 수 있는가를 고민하면 된다.

김준석 리더는 기계번역을 딥러닝 이전과 이후로 구분했다.

딥러닝이 나오기 이전에는 규칙기반 기계번역(RBMT), 통계기반 기계번역(SMT)이 주류였다. 그는 "십몇년 전 만해도 기계번역기에 번역하려는 문장을 입력하면 이미 확보한 DB에 저장돼 있는 결과만 번역해서 보여줬다"고 말했다. 때문에 입력된 문장들 중 15%~20% 정도에 대해서만 결과를 내놨다. 나머지 80%에 해당한 입력 문장에 대해서는 결과를 내놓지 못한다.

이를 테면 '그녀는 사과를 먹는다<->She eats an apple'라고 DB에 입력돼 있는 경우에만 이 내용에 대한 번역할 수 있다. 그 뒤에는 문장을 쪼개 각 단어들의 뜻을 대입시킨 사전을 활용했다. 그러나 이런 방법도 정확한 번역결과를 내놓기에는 부족했다. 앞 문장에서 그녀가 먹는 것이 사과(apple)인지 사과(apology)인지를 판단하지 못했던 탓이다.

이를 보완하기 위해 등장한 것이 RBMT다. 문장 중에 eat이라는 말이 있으면 사과를 'apple'로 번역하라는 등 규칙을 정해놓는 식이다. 이런 접근법도 해석하기 모호한 단어들을 번역하는데는 한계가 있었다. SMT는 문장 내 구문들이 통계 상 어떤 뜻으로 해석될 확률이 높은지 판단해 번역결과를 제시한다.

그렇다면 딥러닝을 적용한 인공신경망 기계번역은 뭐가 달랐던 것일까? 단어나 구문단위로 쪼개거나 확률적인 방법 대신 기존에 사람들이 번역해 놓은 결과를 가상 공간에 숫자로 만들어 좌표값(벡터)으로 표시한다. 이런 식으로 학습 과정을 거친 뒤에 새로운 문장을 입력하면 이를 다시 좌표값으로 만들어 기존에 학습된 내용과 비교해 가장 비슷한 문장을 참고해 번역결과를 내놓는다.

■ 한국어 잘 이해하는 파파고, 어떤 변화 생기나

딥러닝을 적용한 인공신경망 기계번역 분야에서 구글번역이 가장 많은 데이터를 보유하고 있다면 한국어 콘텐츠에 대해서는 포털검색서비스를 제공 중인 네이버가 풍부한 데이터를 확보하고 있다.

한국어를 가장 잘 이해하는 파파고는 앞으로 어떤 모습으로 진화해나갈까?

김준석 리더는 도구로서 파파고가 더 많은 사용자들을 만나게 하는 것과 동시에 이를 바탕으로 더 높은 번역품질을 유지해나간다는 계획이다.

먼저 이전까지 글자수 200자 제한이 있었던 파파고는 오는 6월 정식 서비스로 바뀌면서 글자수 제한이 없어진다. 또한 현재 영어, 일본어, 중국어를 지원했던 것에 더해 U-20 월드컴 공식 후원 앱으로서 스페인어, 프랑스어로 지원 언어를 확대했다. 올해 안에 동남아 중 베트남, 태국, 인도네시아 등을 포함해 총 10개 언어쌍을 지원한다.

이에 더해 기존 경찰청 이외에 파트너를 확대한다. 경찰청은 파파고와 협업해 국내 방문한 외국인들이 한국어로 민원을 해결할 수 있게 돕는다. 현재 외국인들이 방문할 수 있는 병원, 은행, 편의점 등에 더해 프랜차이즈 미용실 등도 파트너로 끌어 안을 계획이다.

사용자에게 큰 변화는 파파고 전문 커뮤니티가 생긴다는 점이다. 파파고 정식 서비스에 맞춰 개설되는 '파파고랩스네이버닷컴(가칭)'은 일반 개인 사용자들이 번역을 요청하거나 번역결과를 공유하면서 파파고를 개선해 나가는 역할을 하는데 도움을 줄 것으로 예상된다.

관련기사

개발자들은 네이버에서 파파고에 적용된 인공신경망 기계번역 기술을 오픈API 형태로 가져다 쓸 수 있게 된다. 모바일 앱이나 웹서비스 개발자들이 자사 프로그램에서 파파고가 제공하는 번역서비스를 붙일 수 있게 되는 것이다.

김준석 리더는 "이전까지 번역 관련 오픈API는 SMT 방식만 제공했었는데 파파고 정식 서비스 일정에 맞춰 인공신경망 기계번역도 제공할 계획"이라고 밝혔다.