통합번역 플리토, 고품질 ‘언어 데이터’로 AI 리더 꿈꾼다

[강소기업이 미래다 ㊾] 이정수 대표 "다국어 데이터로 해외 진출 지원”

인터넷입력 :2021/03/24 09:40    수정: 2021/03/24 10:20

4차산업혁명 시대가 되면서 ‘데이터’는 미래 산업의 원유에 자주 비유된다. 인공지능(AI) 기술도 결국 풍부한 양질의 데이터 없이는 발전할 수 없기 때문이다. 자동차가 기름이나 전기와 같은 동력으로 움직이는 것과 같은 원리다.

2012년 설립된 플리토는 다국어 번역 통합 서비스를 통해 수년 간 ‘언어 데이터’를 쌓아온 국내 강소기업으로, 국내 데이터 산업 발전에 기여하고 있다.

이 회사는 웹과 앱 플랫폼을 통해 집단지성 번역, AI 번역, 전문 번역 등의 서비스를 제공 중이다. 이렇게 모은 텍스트, 음성, 이미지 등 언어 데이터를 판매하는 것뿐 아니라, 각 기업에 맞는 가공 서비스도 제공한다. 173개국, 1천만 명 이상의 사용자가 플리토의 데이터 양과 품질을 높여가고 있다.

플리토

플리토는 이 같은 데이터 경쟁력을 인정받아 한국데이터산업진흥원(K-DATA)이 주관하는 ‘데이터 바우처 지원사업’에 공급기업으로 선정됐다. 데이터 바우처 지원사업은 중소기업, 소상공인, 1인 창조기업, 예비창업자를 대상으로 데이터 구매 및 가공 서비스 관련 예산을 바우처 형태로 지원하는 사업이다.

언어 장벽 없는 세상 꿈꾸는 기업 플리토

플리토

플리토는 2019년 사업모델 특례상장으로 코스닥에 입성했다. 이 회사는 창립한 해인 2012년 영국 테크스타 런던 인큐베이팅 업체로 선정돼 8억원의 시드 투자를 받았다. 이후 두 차례(시리즈 A·B)에 걸쳐 총 125억원 투자를 받았으며, 2017년 일본 코로프라넥스트로부터 투자를 받는 등 기술력을 인정받았다.

플리토는 그동안 ▲일본 NTT 도코모 ▲한국전자통신연구원(ETRI)  ▲중국 텐센트 ▲미국 마이크로소프트 ▲현대자동차 ▲CJ ENM ▲EBS ▲한국정보화진흥원(NIA) 등과 파트너십 체결을 통해 번역과 관련한 다양한 사업을 전개해 왔다.

플리토는 지난해 매출액 약 59억원을 기록하며 전년 대비 약 196.8%의 성장률을 보였다. 국내외 데이터 판매 증가와 플랫폼 서비스 이용 증가에 따른 결과다. 이 회사의 전년도 영업손실은 약 50억원으로 전년 대비 약 14% 감소했다. 손실에는 데이터 판매 확대에 따른 신규 데이터 구축 및 연구개발 비용 등이 반영됐다.

이정수 플리토 대표

이정수 대표는 언어 장벽 없는 세상을 꿈꾸며 회사를 창업했다. 이 대표는 SK텔레콤 및 SK플래닛에서 M&A, 벤처기업 투자를 담당했다. 이 때 사내 벤처 프로그램으로 플리토를 시작해 2012년 창업했다. 2019년 문재인 대통령과 북유럽 3개국 순방에 경제사절단으로 동행했으며, 같은 해 12월에는 과학기술정보통신부 장관 표창장을 수상하기도 했다.

쿠웨이트에서 태어난 이정수 대표는 사우디아라비아, 영국, 미국 등에서 유년 시절을 보내면서 언어에 대한 관심이 높아진 것으로 알려졌다. 대학 재학 시절 플리토의 모태가 된 크라우드소싱 번역 서비스 ‘플라잉캐인’을 창업했었다.

9년 쌓은 고품질 언어 데이터, 중소/벤처 기업과 상생

플리토 언어데이터 강점

플리토는 약 9년 간 언어 데이터에 집중해 온 언어 데이터 전문 기업인만큼 다양한 고품질 데이터를 보유하고 있다. 데이터가 필요한 중소/벤처기업에 양질의 데이터를 공급함으로써 함께 성장하고자 데이터 바우처 지원 사업에 참여하게 됐다. 다년 간 국내외 기업과 정부기관 등과 진행한 언어데이터 판매, 구축 사업 노하우를 나눈다는 계획이다.

플리토는 이번 데이터 바우처 지원 사업에서 언어 데이터 ‘판매’와 ‘가공’ 두 분야 모두 참여한다. 플리토가 지원하는 언어 데이터는 크게 ‘텍스트’, ‘음성’, ‘이미지’ 세 개로 나뉜다.

플리토 언어데이터 수집-공급과정

구축, 가공된 텍스트 데이터는 인공신경망 기반 기계번역, AI 기반 챗봇을 비롯한 자연어 처리 기술, 알고리즘 교육 및 다양한 앱/웹 데이터로 활용된다. 음성데이터 역시 자연어 처리 엔진 개발에 활용 가능하며, 이미지 데이터는 OCR(Optical Character Reader), 자율주행차량 시스템 개발 등에 사용할 수 있다.

이 회사의 강점은 집단 지성을 활용하는 웹/앱 기반 플랫폼이다. 앞서 밝힌 대로 173개국 1천만 명 이상의 사용자를 확보하고 있어 데이터를 빠르게 수집하고, 정제, 가공할 수 있다. 또 한국감리원 인증 데이터 정확도 99.8%를 기록하는 등 글로벌 IT기업들과 협업으로 데이터 품질이 검증됐다는 점이다. 다국어 AI 번역기, 챗봇, 음성 인식기 등 일상생활에 필수적인 기술에 고품질 학습용 데이터를 제공함으로써 정확도를 높였다. 아울러 저작권이 확보된 글로벌 표준 데이터를 제공한다는 점도 플리토의 강점 중 하나다.

플리토 언어데이터 활용예시

플리토는 챗봇, 음성 인식기, OCR 개발 업체뿐 아니라 글로벌 시장 진출을 원하는 게임, 커머스, IT 서비스 등에서 활약 중인 수요 기업과의 협업을 기대하고 있다. 이들에게 크라우드 소싱을 활용한 데이터 수집을 통해 데이터 구축에 필요한 시간과 비용을 절약해 준다는 계획이다. 또 체계적인 품질관리 솔루션을 통해 보다 정확한 데이터를 제공한다는 방침이다.

플리토 언어데이터 활용분야

이정수 플리토 대표는 “혁신 기술의 개발 또는 고도화 등 인공지능 산업의 발전에는 양질의 데이터가 필수적이며 데이터에 대한 수요는 점차 증가하고 있다”면서 “플리토는 AI 개발 업체의 기술·서비스의 개발 또는 고도화를 위해 고품질의 데이터를 제공한다. 정부 기관, 국내 기업은 물론 유수의 글로벌 IT 기업들과도 지속적인 협업 관계를 유지하며 글로벌 언어 데이터 선두주자로 도약하기 위해 역량을 집중하고 있다”고 말했다.

이어 “현재 진행중인 데이터바우처 사업 등 정부 지원 사업에 적극 참여해 중소벤처, 스타트업과 동반 성장하고 국내 데이터 및 AI 산업 경쟁력을 높이기 위해 노력하겠다”고 덧붙였다.

플리토 정부 과제 수행 내역

플리토가 생각하는 ‘AI 강국 코리아’ 위한 비전과 전망

정부가 AI 기술 고도화와 데이터 산업 육성에 힘쓰는 가운데, 플리토는 한국이 관련 산업에서 미국과 중국 등에 이어 선도 국가로 발돋움할 수 있는 좋은 기회란 평가다.

회사는 AI 산업 육성에 있어 중요한 것으로 기술 개발 인력과 자금, 데이터를 꼽았다. 세 가지 모두 정부의 참여가 적극 이뤄져야 전반적인 AI 산업이 성장할 것으로 전망했다. 특히 개발 인력이 부족한 환경을 개선하기 위해 국가가 적극 인력 양성에 힘써야 한다고 건의했다.

또 개발엔진을 테스트하기 위해 학습용 데이터가 필요한데, 데이터 저작권 문제로 중소기업의 데이터 구매 비용 부담이 크다고 지적했다. 이에 정부가 적극적으로 공공데이터를 수집해 제공함으로써 어떤 AI 회사라도 일정 수준의 엔진 정확도를 갖추게 하는 것이 필요하다고 조언했다.

관련기사

아울러 AI 알고리즘 개발과 새 기술에 대한 빠른 도입은 한국의 강점이라고 진단한 뒤, 정부가 앞장서 산업을 지원한다는 점이 큰 힘이라고 했다.

다만 데이터 공급 등에 있어 대기업의 참여가 저조하다면서 대기업과 중소기업의 협업, 유망한 AI 스타트업에 대한 M&A 등이 활발해진다면 국내에서 새로운 기술이 적용된 AI 개발 업체가 더 많이 나타나고 상생 시너지가 확산될 것이라고 전망했다.