"앞으로 언어 데이터는 인공지능(AI) 통번역에만 머물지 않을 것입니다. 이에 발맞춰 우리는 피지컬AI 산업에 언어 데이터를 공급할 계획입니다. 로봇이나 자율주행이 현실 세계를 이해할 수 있게 돕겠습니다. 전문 영역에서도 고품질 AI 번역 결과가 나올 수 있도록 데이터 정제에도 꾸준히 힘쓸 것입니다."

이정수 플리토 대표는 지디넷코리아 인터뷰에서 AI 통번역 서비스 전망과 사업 전략을 밝혔다.

플리토는 2012년 설립된 언어 AI 기업이다. 사업 초기에는 집단지성 번역 플랫폼으로 언어 데이터를 합법적으로 수집하는 데 집중했다. 당시 글로벌 K팝 팬들이 연예인 소셜미디어(SNS) 글을 직접 번역하게 했으며, 이를 통해 보상을 주는 식으로 추진됐다.

이정수 플리토 대표.

플리토는 플랫폼 운영 3년 만에 글로벌 사용자 1천만 명을 모았다. 2017년부터 본격적으로 데이터를 기업에 판매하기 시작했으며, 2024년부터 특화 번역 AI 엔진과 실시간 통번역 솔루션을 출시했다. 현재 매출 80% 이상이 미국과 일본 등 해외에서 나온다. 지난해 12월 '챗 트랜스레이션'을 기업소비자간거래(B2C)용으로 공개했다.

이정수 대표는 플리토 강점을 개인화된 특화 AI 번역으로 꼽았다. 오픈AI나 구글 등 빅테크가 '범용 번역기'를 제공하는 것과 달리 플리토는 특정 행사나 화자에 최적화된 AI 엔진을 제공한다는 이유에서다.

이 대표는 "AI가 화자 발음 습관이나 고유 명사를 미리 학습하지 않으면 오역한다"며 "우리는 컨퍼런스 연사가 자신 이름을 어떻게 표기하는지, 해당 분야 전문 용어는 무엇인지를 AI 엔진에 사전 학습한다"고 강조했다. 이어 "개인이 직접 엔진을 학습시키고 수정할 수도 있어 높은 정확도를 갖췄다"고 덧붙였다.

이 대표는 향후 초개인화 AI 통번역 솔루션 승부처도 원본 데이터에 있다고 봤다. 그는 "AI 솔루션 개발에서 가장 중요한 것은 데이터 정제보다 '질 좋은 원본 데이터'를 많이 확보하는 것이 관건"이라고 강조했다.

이어 "언어 분야에서 인간 데이터는 합성 데이터보다 훨씬 높은 정확도를 갖췄다"며 "원본 데이터 수집을 통해 AI 모델을 미세 조정해 서비스 품질을 높이는 것이 필수"라고 설명했다.

플리토는 현재 데이터 정제 과정도 꾸준히 진행하고 있다. 실시간 통번역 서비스 과정에서 인식률 낮은 단어나 사투리를 포착해 데이터 수집 과제로 전환하는 작업을 추진하는 식이다.

예를 들어, 경상도 사용자 '편의점' 발음을 AI가 오인식할 경우, 플리토는 즉시 앱을 통해 해당 지역 사용자들에게 문장 녹음 미션을 발송한다. 이 대표는 "녹음자가 미션 수행하면 금전적 보상을 얻는다"며 "우리는 이를 통해 저작권 확보된 데이터를 축적할 수 있다"고 말했다.

언어 데이터 활용 분야 확장…피지컬AI 산업 적용

이정수 대표는 올해 AI가 단순 도구를 넘어 인간 감각이나 신체에 통합되는 원년이 될 것으로 보고 있다.

플리토는 피지컬AI 분야에 언어 데이터를 공급하는 사업을 추진하고 있다.

그는 AI 통번역 분야에도 변화가 일어날 것이라고 내다봤다. 특히 'AI 글래스' 대중화로 인해 언어 장벽이 시각적으로 완전히 허물어질 것이라고 예측했다.

이 대표는 "상대방과 눈을 맞추며 대화할 때 안경 렌즈 위에 실시간 번역 자막이 나타나는 방식이 보편화될 것"이라며 "우리는 이에 대비하기 위해 실시간 통역 기술 고도화에 집중할 것"이라고 강조했다.

그는 언어 데이터가 텍스트에만 머물지 않을 것으로 전망했다. 이에 로봇 공학·자율주행 등 피지컬AI 분야에 필요한 멀티모달 데이터 사업을 올해 추진한다.

이 대표는 "로봇이 인간 명령을 알아듣고 정확히 행동하려면 언어 데이터와 로봇의 물리적 움직임이 결합돼야 한다"며 "우리는 로봇 동작 수행을 위한 다국어 데이터를 수집·정제·라벨링 할 것"이라고 밝혔다.

플리토는 번역 모델 지능도 고도화한다. 특히 전문 영역에서 더 높은 번역 정확도를 구현하기 위해 데이터 작업에 착수했다. 현재 컨퍼런스나 전문 학술대회에서 발생하는 '전문가들의 문답' 데이터에 주목하고 있다.

이 대표는 "현장 전문가 인사이트는 AI 모델 지능을 한 단계 높일 수 있는 귀한 자산"이라며 "실시간 통역 솔루션으로 희귀 데이터를 체계적으로 수집·가공해 차세대 지식 베이스 구축 핵심 파트너가 될 계획"이라고 포부를 밝혔다.