AR기술, '외국어 장벽'까지 무너뜨리나

인공지능 결합하면서 '고품격 번역' 서비스 구현

인터넷입력 :2017/01/04 16:39    수정: 2017/01/04 17:58

손경호 기자

해외 여행 때마다 모르는 언어로 쓰여진 메뉴판을 보고 음식을 주문해야 하는 상황이 당혹스럽다. 길을 찾거나 각종 안내 표지판을 확인할 때도 곤란하긴 마찬가지다.

그래서 해외 여행을 갈 땐 그 나라에서 사용할 수 있는 기본적인 '생존회화'를 익히는 게 필수였다. 그런데 앞으론 그럴 필요가 없게 될 전망이다.

인공지능과 증강현실(AR)이 결합하면서 번역 서비스가 한층 수월해졌기 때문이다.

최근 들어 구글, 네이버 뿐 아니라 다국어 자동 통/번역 서비스를 제공해 왔던 시스트란 인터내셔널과 국내 집단지성 번역 플랫폼 플리토까지 '증강현실(AR) 번역' 서비스를 선보이고 있다.

모바일게임 '포켓몬 고'나 국내 카메라앱 '스노우' 등에 적용된 AR은 카메라에 비치는 현실세계에 여러가지 이미지를 덧대서 처리하는 기술이다. 포켓몬 고를 실행하면 내가 서 있는 곳 주변에 몬스터가 보이고, 스노우를 열어서 덧씌울 이미지를 고른 뒤 카메라로 비치면 내 원래 얼굴에 해당 이미지가 추가된 모습을 볼 수 있다. 2015년 구글이 만든 안경 모양의 헤드업 디스플레이인 '구글글래스'에 비치는 화면도 AR을 응용한 것이다.

네이버랩스의 파파고, 구글번역, 시스트란이 제공하는 번역서비스는 모두 인공신경망 기계번역(NMT)을 도입해 더 자연스러운 번역 서비스를 제공한다고 강조한다.

이러한 AR기술이 가장 큰 파급력을 낼 수 있는 분야 중 하나가 스마트폰을 활용한 번역이다. 온라인 통계 포털인 스태티스타(Statista)에 따르면 지난 해 말 기준으로 스마트폰 사용자수는 21억명을 넘었다. 전 세계 인구가 45억명이라는 점을 고려하면 10명 중 4명~5명 꼴로 스마트폰을 쓰고 있다는 것이다. AR번역이 보다 정교해질 경우 수많은 스마트폰 사용자들이 언어 장벽 없이 해외 여행지나 출장지에서 오프라인 정보를 이용할 수 있게 되는 셈이다.

구글, 네이버, 시스트란-플리토 연합이 AR 번역에 눈독 들이는 것도 이러한 이유다.

모바일앱으로 제공되는 구글번역은 인공지능의 기반이 되는 머신러닝, 딥러닝을 응용한 인공신경망 기계번역(NMT)을 도입했다. 문장 전체를 하나의 단위로 더 자연스럽게 번역할 수 있도록 했다는 설명이다.

특히 주목되는 기능 중 하나는 워드 렌즈와 사진 속 텍스트 번역하기다. 워드 렌즈는 스마트폰에서 구글번역앱을 실행한 뒤 카메라로 텍스트를 비추면 자동으로 번역이 이뤄지는 기능이다. 구글은 28개국 언어에 대한 번역을 지원한다고 했으나 아직 이 기능은 한국어-영어, 한국어-중국어 등 언어쌍 번역을 지원하지는 않는다. 사진 속 텍스트 번역하기의 경우 한국어도 지원하는 기능이다. 이전에 촬영한 사진이나 직접 촬영한 사진을 구글번역앱이 스캔해 광학문자인식(OCR)을 통해 번역하는 기술이다. 그러나 테스트해 본 결과 아직까지는 사진에서 텍스트를 정확하게 인식하지는 못했다.

왼쪽은 구글번역, 오른쪽은 파파고를 실행한 모습.

네이버에서 분사한 기술연구소인 네이버랩스가 개발, 서비스 중인 통/번역앱 파파고도 스마트폰으로 직접 사진을 촬영하거나 촬영한 사진에서 텍스트를 추출해 번역해 주는 서비스를 제공 중이다. 그러나 구글과 마찬가지로 아직은 인식률이 떨어지는 편이다.

AR 번역 분야에서 주목할만한 곳은 시스트란과 플리토다. 두 기업은 구글번역, 파파고와 마찬가지로 OCR을 활용해 사진이나 영상에서 텍스트를 추출해 번역해주는 서비스를 제공하는 한편 사람이 직접 해당 사진을 번역한 내용을 DB로 만들어 동시에 제공한다는 계획이다.

관련기사

시스트란 문상준 부장은 "기존 OCR 방식은 메뉴나 간판을 촬영하더라도 문자를 인식하는 성능이 떨어져 정확한 데이터가 나오지 않는 경우가 많다"며 "이를 보완하기 위해 시스트란이 가진 인공지능 언어처리 플랫폼인 'SYSTRAN.io' API와 플리토가 제공하는 전 세계 번역가들을 활용한 집단지성 번역 플랫폼을 통해 수집한 데이터를 연결시켜 더 정교한 번역을 제공한다는 계획"이라고 말했다.

문 부장에 따르면 두 회사는 기계번역과 집단지성 기반 인간번역 DB를 동시에 활용한다. 예를들어 베트남 하노이에서 사진에 대한 번역을 요청할 경우 기계번역과 인간번역을 통해 사전에 검수를 마친 번역 결과를 보여주도록 한다는 설명이다.