구글이나 네이버가 '쓸만한' 자동번역 기술을 선보이고 있다. 말소리를 알아듣고 글자로 옮겨 주거나 다국어 수십가지를 상호 번역해 주는 서비스를 공짜로 제공하고 있다. 거대 컴퓨팅 인프라와 서비스를 운영하며 수집한 대규모 사용자 데이터를 활용해 만든 결과물이다.
인터넷 업체의 대규모 데이터센터 기반 자동번역 기술은 개인 소비자가 접하는 외국어의 장벽을 크게 낮춰 주고 있다. 보기에 따라선 그간 자체 자동번역 기술을 연구, 개발해 기업 IT솔루션으로 공급했던 시스트란인터내셔널같은 기업의 잠재적인 시장 기회를 빼앗는 모양새다.
시스트란인터내셔널은 자동통번역기술로 수익을 내야 한다. 닮은 기술을 무료 서비스로 제공하는 구글과 네이버가 전문 통번역기술의 수익을 잠식해버리는 건 아닐까. 하지만 김동필 경영총괄 부사장은 "그렇지 않다"고 밝혀다. 오히려 솔루션업체의 역할을 강화해 줄거라 했다.
시스트란인터내셔널은 글로벌 자동번역솔루션 분야 선두업체로, 미국 국방부와 유럽연합(EU)을 비롯한 세계 정부 기관과 기업에 번역 기술 및 솔루션을 제공하고 있다.
시스트란인터내셔널이란 이름은 한국 씨에스엘아이(CSLi)가 1968년 설립된 프랑스 번역솔루션업체 '시스트란(Systran)'을 지난 2014년 550억원에 인수하면서 그 브랜드를 살린 결과다. 기존 시스트란 본사는 인수 후 유럽지사가 됐고, 한국의 CSLi가 본사 역할을 하게 됐다.
전신 격인 CSLi도 앞서 국내에서 여러 번역 소프트웨어(SW) 전문업체가 뭉친 회사다. 지난 1992년 설립된 한일번역SW 개발업체 창신소프트를 모태로, 엘엔아이소프트(LNIsoft)와 유니소프트(Unisoft)가 합병했다.
김동필 부사장은 유니소프트 이사, 일본지사장 출신이다. 콘텐츠 디지털권한관리(DRM) 솔루션업체 한마로, 포털사이트 솔루션업체 구스테크놀로지 대표를 거쳐 2010년 이후 CSLi에 합류했다. 그와 지난 21일 서초구 시스트란인터내셔널 본사에서 인터뷰를 진행했다.
김 부사장은 인터뷰를 통해 자신이 바라보는 번역솔루션 시장에서 시스트란인터내셔널과 거대 인터넷 사업자간의 관계, 회사가 주력하고자하는 시장, 그리고 기술 개발 및 플랫폼 투자 등을 비롯한 경쟁력 강화 방안을 제시했다. 이 내용을 아래 1문 1답으로 정리했다.
-시스트란인터내셔널에 합류하게 된 배경과 현재 역할, 최근 관심사를 알고 싶다
"대학 다닐 때 교수 권유로 번역기를 만들기 시작했다. 대학교 3학년부터 유니소프트에서 일했는데, 어려웠다. 국내 시장에서 이것 하면 다 굶어 죽는다는 얘기가 돌았다. 하다가 유니소프트, 창신소프트, LNI소프트, 3사가 뭉쳐서 CSLi가 됐다. 지창진 (시스트란인터내셔널) 회장이 제대로 한 번 해 보자고 권해 합류했다. 이후 운좋게, 모든 번역회사 '롤모델'이었던 시스트란을 인수할 수 있게 됐다.
시스트란인터내셔널은 오랬동안 자연어처리(NLP) 기술 연구개발을 해왔고, 번역기는 그 부산물이다. 번역기를 잘 만드는 회사가 맞지만, 이것만 하는 게 아니다. 언어지능(language intelligence) 회사다. 음성인식, 번역, 챗봇 기술 앞단에서 내용을 해석, 분석하는 게 언어지능이다. 인공지능의 마지막 보루같은 영역이다.
부사장으로서 내 역할은 이런 회사 그룹의 최고운영책임자(COO)로, 시장 트렌드를 읽고 향후 10년을 내다보며, 글로벌 기업으로 가기 위한 전략을 짜는 일이다. 내 관심사는 언어지능과, 회사가 보유한 언어지능으로 산업표준 플랫폼을 만드는 것이다. 여러 산업에서 활용하고 가치있는 기술, 인간의 삶을 풍요롭고 행복하게 만들 기술을 만드는 게 우리 철학이자 관심사다."
-회사가 다국어 통번역 솔루션 사업자로서 주력하고 있는 시장은 어떤 영역인가
"인수합병을 통해 미국과 유럽 지역 시장을 확보하고 있다. 다만 여기엔 (제품과 서비스를) 사고 팔 곳이 정해져 있다. 새로운 비즈니스를 시도할 이유가 없다. 하지만 본사에서는 항상 새로운 비즈니스모델을 찾고 여러 시도를 한다. 2002년 월드컵 시점에 맞춰 만든 휴대용 한일통역기 '이지토키'를 출시한 적이 있다. 관련된 포괄 특허권도 갖고 있다.
당시 이지토키 관련 기술은 돈이 안 됐지만, 2010년 국내에 스마트폰이 출시된 이후 그 기술을 활용해 모바일 통역 앱을 최초로 내놓을 수 있었다. 이후 한국전자통신연구원(ETRI)과 협력을 통해 제주관광통역서비스 기술을 납품하고 영한번역을 시범 제공했고, 2013년부터 삼성전자 모바일 기기에 선탑재되는 S번역기를 공급하기도 했다.
본사가 주력하려는 지역은 동남아시아와 중국이다. 동남아시아는 (정부가) 인공지능(AI)과 번역출판 쪽에 드라이브를 걸고 있다. 중국에선 시진핑 주석이 '일대일로'라는 21세기 실크로드 정책을 펴고 있다. 중국 시안(西安)에서 유럽까지 오프라인 물류 통관(수출입관리시스템)을 해결하기 위한 기술 중 하나가 음성인식과 번역, 통번역이다. 유럽과 미국에선 본사가 개발한 비즈니스모델로 패러다임 전환을 시도한다."
-국내외 인터넷 업체가 딥러닝 기술을 응용한 신경망기계번역(NMT) 기술로 번역서비스를 내놓으면서, 전통적인 번역솔루션 시장과 역할을 잠식하는 최근 흐름을 어떻게 보나
"기존 번역솔루션 시장을 잠식하고 있는 건 맞다. 하지만 전체 시장 크기를 줄이는 게 아니다. 오히려 더 큰 시장을 열어 주고 있다고 본다. 네이버와 카카오는 돈을 벌려고 그런 기술을 개발하는 게 아니다. 포털 이용자들이 그들 인터넷 서비스에 오래 머물도록, 재미있게 이용하도록 만들려는 필요에서 만든 것이다.
그런 구글과 네이버의 번역기를 기관이나 기업들이 (업무, 사업 용도로) 쓸수 있을까. 못 쓴다. 조직의 내부 데이터, 정보보안 때문이다. 국가정보원이나 국방부같은 곳도 쓰면 좋겠지만, 보안 때문에 못 쓴다. 사용하려면 그 기술을 기관의 데이터센터에 넣어야 하는데, 구글과 네이버의 번역기는 그런 형태로 설계돼있지 않다. 구글과 네이버의 기술은 그 대규모 컴퓨팅 머신에서 동작하도록 만들어졌다.
만일 하드웨어 구축을 포함해서 그들의 번역시스템을 쓰기로 하려고 해도, 의사결정권자는 도입하지 말라고 할 거다. SW가 2억원이라면 하드웨어에 10억원을 써야 할 수도 있다. 배보다 배꼽이 더 커질 수 있는 거다. 시스트란의 번역 기술은 '스몰 컴퓨팅 파워'로 동작할 수 있도록 설계됐다. 2천만원짜리 서버 한 대로 돌릴 수 있다. 이게 우리 경쟁력이다. 주요 정부 기관, 대기업에서 우리 기술을 쓰는 이유다.
과거 완성차 제조사 중 포드가 대형차를 많이 만들었지 않나. 유류 가격이 비싸지 않을 때였다. 유가가 오르면서 대형차가 잘 안 팔린다. 기름먹는 하마니까. 유가가 비싸면 연비 좋은 차가 잘 팔린다. 비유하자면 우리는 이런 '연비 좋은 차'를 만드는 것이다. 다만 (구글이나 네이버는) 시장을 잠식하는 게 아니라 일반 사용자들이 자동번역기를 쓸만하구나 싶게 만들었다. 덕분에 번역기 솔루션 시장을 넓혀 주고 있다."
-더 커진 시장을 잡기 위해 필요한 AI와 NLP분야 핵심인재 확보 전략, 기술개발 방향을 알고 싶다
"한국에서 알고리즘이나 코어 플랫폼을 개발하지 않는다. 이미 AI분야에서 제품과 서비스 개발에 필요한 툴은 다 공개돼 있다. 경쟁력있는 기술 연구 핵심은 축적된 실험 데이터와 최적화 경험이다. 우리 AI 연구팀이 10명이다. 필요한만큼 다 할 수가 없다. 대신 미국, 독일, 프랑스 등 지역별 연구소 소속 연구팀과 협력하고 있다. 실험 데이터와 최적화 경험을 확보하기 위해 필요한 인력은 그 쪽을 통해 충원한다.
나머지 모자라는 지식과 경험은 시스트란과 미국 하버드NLP가 메인컨트리뷰터로 추진 중인 오픈소스 프로젝트(오픈NMT)를 통해 얻는다. 우리 프로젝트에 하루 2천~3천명이 활동하며 경험을 공유하고 있다. 우리는 그걸 디렉션하고 결과를 살피는 과정을 통해 빠르게 습득할 수 있다. 그래서 지난해 캐나다 밴쿠버에서 열린 연례 전산언어학회(ACL 2017)에서 '베스트러너' 상을 받을 수 있었다.
기업들이 언어서비스를 더 효율적으로 다양하게 만들도록 돕는 우리의 '번역플랫폼'을 성장 동력으로 삼을 계획이다. 한국은 시장이 작아 별도로 대상으로 하지 않았지만, 이미 중국에서 2~3년 전부터 기술을 검증했다. 다음달(3월)부터 사용자 1천만명을 보유한 중국 헬로톡(현지 외국어 학습서비스)의 번역서비스를 시작한다. 올해부턴 글로벌 시장을 대상으로 확장도 시작한다."
-이미 AI를 개발하고 관련툴을 공개하는 사례는 많은데, 오픈NMT의 경쟁력이 뭔가
"우리와 하버드NLP라는 연구팀이 프로젝트를 메인컨트리뷰터로 이끌고 있고, 프로젝트 포럼을 운영하면서 수많은 참가자들과 교류하며 참여자를 서포트하고 있다. 오픈NMT 커뮤니티 포럼에는 매일 연구자들이 오류 제보 등 글을 올리고 다른 이들이 자기 경험이나 지식을 제공해 이를 해결해 주기도 한다. 오픈NMT 프로젝트에 ETRI를 비롯 국내외 여러 연구기관과 기업 속 연구원 3천여명이 참여하고 인텔, 엔비디아, 아마존웹서비스가 우리와 협력하는 이유다. 구글같은 회사도 뭔가를 오픈소스로 내놓지만, 그들에게서 이런 지원을 기대할 순 없다.
또 오픈NMT를 통해 제공하는 AI의 기반이 탄탄하다는 점도 꼽을 수 있다. 이 AI를 활용해 번역기든 음성인식기든 빠르게 개발할 수 있다. 시스트란인터내셔널이 번역기술과 음성인식기술을 모두 보유한 덕분이다. 번역 기술과 음성인식 기술은 개발 방식이 다르기 때문에, 구글과 바이두를 제외하면 일반 기업중에는 둘 다 자체 보유한 곳을 찾아 보기 드물다.
우리는 코어기술과 커뮤니티 지원을 맡는 전담팀을 두고 오픈NMT를 번역서비스용 산업표준 플랫폼으로 만들려는 활동을 시작한 것이지만, 오픈소스프로젝트이기 때문에 어느정도 시간이 걸린다는 점을 예상하고 있다. 리눅스도 오픈소스 프로젝트였기 때문에 하나의 운영체제(OS)로 자리매김하기까지 오랜 시간이 걸렸다."
-회사가 말하는 플랫폼의 의미와, 플랫폼을 통해 추구하는 비전은
"플랫폼은 기업과 개발자들이 언어지능 기반 서비스를 좀더 효율적으로, 다양하게 만들 수 있게 해주는 수단과 환경을 가리킨다. 언어지능은 음성인식된 음성언어에 필요한 후처리를 위해 필요하다. 형태소, 구문, 의미, 객체 분석과 날짜인식 등 NLP를 구성하는 20여가지 기술을 아우르는 영역이다. 번역서비스나 음성인식을 만들기 위해 이걸 일일이 사서 쓰려면 개발자나 스타트업에게 비용 부담이 크다.
우리는 언어지능 기반 서비스를 만드는 데 필요한 기술을 '블록'으로 제조하고, 개발자와 스타트업이 그걸 오픈API로 가져다 서비스를 조립할 수 있게 하려고 한다. 플랫폼은 이를 위한 개발지원시스템과 서비스지원시스템을 포함하는 개념이다. 플랫폼을 통해 우리가 직접 다가가지 못하는 틈새시장에 접근하고 거기서 발생하는 데이터를 모을 수 있다. 장기적으론 시스트란인터내셔널의 언어지능을 키울 수 있다.
세계 시장에서 번역플랫폼 기술을 활용한 언어 서비스의 비중이 '수십조' 수준으로 성장하고 있다. AI 시장의 성장세에 맞춰, 시스트란인터내셔널의 언어 서비스 분야 시장 점유율도 함께 가져갈 계획이다. 향후 사물인터넷, 모바일, 제조, 금융, 콘텐츠, 교육, 여행 등 여러 산업분야 플랫폼을 제공하며 글로벌 넘버원 언어지능 분야 선도업체가 되는 게 목표다. 이런 비전 아래에 향후 10년간의 로드맵을 짜고 있다."
관련기사
- 시스트란 "오픈NMT, 글로벌업체 번역환경 개선"2018.02.28
- 시스트란, 인공지능 고전문헌 자동번역시스템 구축2018.02.28
- 시스트란, 중국 헬로톡과 번역기술 개선 MOU2018.02.28
- 시스트란, 증권사에 음성인식 공급 "말소리 겹쳐도 OK"2018.02.28
-시스트란인터내셔널은 국내에서 한국회사, 다국적회사, 어느쪽으로 인식되길 바라나
"국내서 대기업과 정부 대상으로 영업하면 '코리안디스카운트'를 당한다. 딜에 들어가면 1억원을 불러도, 깎이고 깎여서 최종적으로 6천~7천만원을 받는다. 그런데 정작 정부도 외산 솔루션이면 1원 한 푼 깎지 않는다. 우리는 사업적으론 외국기업으로 움직이지만, 한국마인드로는 자존심을 지키고 싶다. 한국 회사가 미국, 유럽회사로부터 로열티를 받는, 한국을 기술종주국으로 만드는, 그런 기업이 되고 싶다."