[데뷰23] 네이버 "파파고, 딥러닝으로 가독성 개선했다"

자연스러운 번역·원본 최대 보존..."배경·문자 색상, 자동 정렬 잘 해야"

컴퓨팅입력 :2023/02/27 15:17    수정: 2023/03/02 11:19

"인공지능(AI) 번역기 '파파고'가 더 자연스러운 결과를 제공하려면, 배경·글자 색 추출을 잘해야 합니다. 가독성을 떨어뜨리지 않기 위해 텍스트 정렬 상태도 자연스럽게 해야 합니다. 여기에 딥러닝 역할이 큽니다."

네이버클라우드 이현수 파파고 개발담당은 27일 서울 코엑스 그랜드볼룸에서 개최한 개발자 컨퍼런스 '네이버데뷰(DEVIEW) 2023'에서 최근 추가한 네이버 번역기 파파고 기술을 소개했다. 이현수 개발담당은 딥러닝을 비롯한 AI 기술을 파파고 번역 기능에 접목해 더욱 자연스러운 번역 결과를 제공한다는 입장이다.

파파고는 문자뿐 아니라 이미지에 적힌 텍스트를 추출해 번역할 수 있다. 사용자가 번역하고자 하는 부분을 카메라로 찍으면 ▲문자인식 ▲HTS ▲번역 ▲배경생성(임페인팅) ▲문자생성 과정을 거쳐 결과를 내놓는다.

발표 중인 네이버클라우드 이현수 파파고 개발담당 (사진=지디넷코리아)

이현수 파파고 개발담당은 새로워진 파파고 배경 생성 기법을 소개했다. 

보통 사용자가 파파고에서 번역하고자 하는 부분을 사진으로 찍으면, 파파고는 새로운 배경 위에 번역본을 제공한다. 그동안 파파고는 배경 색을 원본 문자와 대비되는 색으로 자동 변환했다. 예를 들어, 파파고가 번역하려는 원본 글 색상이 검정이면, 배경을 흰색으로 만들었다. 예외는 없었다.  

이현수 개발담당은 "더 이상 자동변환 방식은 유용하지 않다"며 "최근 이미지 배경이 복잡해지면서 자연스러운 배경 제공을 하기 힘들어졌다"고 밝혔다.

자동 변환 방식은 부자연스러운 흔적을 남긴다(왼쪽). 반면, 딥러닝 신경망을 이용한 방식은 자연스러운 배경 색상을 제공한다(오른쪽). (사진=네이버클라우드)

이 담당은 배경 색상을 자연스럽게 제공하기 위해 딥러닝 신경망을 활용했다고 설명했다. 이 기술은 이미지 속 글자 획이나 주변 영역에 신경망을 집중하는 방식이다. 신경망은 이를 통해 번역본에 사용할 배경 색상을 정한다.  

이현수 담당은 "무조건 자동으로 배경색을 형성하는 것보다 논리적이다"며 "기존보다 훨씬 자연스러운 배경 생성이 가능하다"고 강조했다. 

글자 주변 색이 아닌, 글자 획 자체에 대한 색상 추출이 가능하다. (사진=네이버클라우드)

파파고는 번역하고자 하는 텍스트 색상을 추출해 결과물을 제공한다. 원본과 번역본 글자 색을 통일하기 위함이다. 파파고는 그동안 텍스트 색상과 그 주변 색을 각각 추출했다. 그 색상을 그대로 번역본에 옮겼다. 일정한 규칙에 기반을 둔 추출법이다.

그래도 여전히 흐릿하거나 그림자 변화가 심한 이미지에 문제가 있었다. 흐릿한 색상을 번역본에 옮기면 그대로 흐릿한 이미지가 나와서다. 이현수 담당은 이를 개선할 수 있는 색상 조절 기술도 소개했다. 그는 "흐릿한 이미지에 있는 문자를 더 뚜렷하게 만들어 정확성과 가독성을 높일 수 있다"고 설명했다. 

글자색 더 좋게 만드는 딥러닝 기술 '콘트레스트 레시오' (사진=네이버클라우드)

그는 더 뚜렷한 문자 색상을 제공하는 딥러닝 '콘트레스트 레시오'를 설명했다. 어떤 배경에 있느냐에 따라 텍스트를 더 잘 보이게 설정하는 기술이다. 그는 "단순히 획을 통해 추출한 색감을 한 번 더 정제하는 기술이다"며 "자동으로 색감을 조정할 수 있다"고 말했다. 

딥러닝이 텍스트를 박스 안에 넣고, 글 각도를 계산한다. 이를 통해 문장 원본에서 어떤 정렬로 이뤄졌는지 추론할 수 있다. (사진=네이버클라우드)

이현수 담당은 "번역본 가독성을 높이려면 보기 좋은 배경과 깔끔한 글자 색만으론 부족하다"며 "텍스트 정렬 기술까지 고도화할 필요가 있다"고 했다.

기존에는 파파고에서 모든 번역본이 왼쪽 정렬 형태로 제공됐다. 이현수 담당은 "이는 원본 문단 구조를 해칠 수 있다"며 "원본과 번역본 이질감을 최소화할 필요가 있다"고 강조했다.

관련기사

그는 이 역시 딥러닝을 통해 해결할 수 있다고 밝혔다. 딥러닝이 텍스트를 박스 안에 넣고, 글 각도를 계산하는 식이다. 딥러닝은 이를 통해 문장이 원본에서 어떤 정렬로 이뤄졌는지 추론할 수 있다.

결과적으로 파파고 번역본은 왼쪽 정렬뿐 아니라 가운데, 오른쪽 정렬 형태까지 제공할 수 있다. 그는 "해당 딥러닝은 문단 사이뿐 아니라 글자 이외의 표, 그래프 등 다양한 시각정 특성까지 고려한 정렬법을 갖췄다"고도 덧붙였다.