AI가 고문서 한자 인식해 번역한다

ETRI, 고서 번역 지원 플랫폼 개발···기록 유산 접근성 확대

과학입력 :2023/09/21 13:38

한국전자통신연구원(ETRI)이 고문서에 적힌 한문을 자동으로 인식해 번역하는 인공지능(AI) 기술을 개발 중이라고 21일 밝혔다. 고서 번역자나 연구자의 작업을 지원해 우리 기록문화 유산이 대중에 더 가까이 다가가게 할 수 있다.

현재 고서 번역은 원문을 일일이 입력해 글자로 옮기고, 확인한 후 여러 차례 한글로 변경하는 번거로운 과정을 거쳐 이뤄진다.

ETRI는 이같은 문제를 해결하기 위해 고서 한자 인식 및 번역 기술을 개발 중이다. 한자를 92%의 정확도로 인식하고, AI 번역 샘플의 정확성에 대해 전문가가 85점으로 평가하는 수준이 목표다. 이를 기반으로 전문 번역가의 고서 번역 작업을 돕는 플랫폼도 만들고 있다.

한국고전번역원 권경열 책임연구원(왼쪽)과 ETRI 민기현 선임연구원(오른쪽)이 AI 기반 고서 번역 기술에 대해 논의하고 있다. (사진=ETRI)

이 플랫폼은 여러 이본을 대조해 정본 확립 작업을 도울 수 있으며, 문자인식 결과에 대한 검수, 어휘 사전, 번역 패턴 및 특수용어 공유 등의 기능을 갖고 있다.

연구진은 번역가들에게 스마트 업무 환경 기반을 마련하고 고서 번역 전문가들의 작업 효율을 향상시켜 약 3만 종의 고서와 수십만 점의 고문서 번역을 앞당길 예정이다. 우리나라 기록문화 유산에 대한 접근성이 높아지리란 기대다.

또 ETRI는 일반인도 쉽게 한문고서 한자 인식 및 번역에 접근할 수 있는 기술도 제공한다. 인공지능을 활용한 고서 한자 인식·번역 서비스를 개발, 손쉽게 고서번역을 체험할 수 있는 모바일웹과 앱을 연말에 선보인다. 

연구진은 9월부터 국회도서관, 대전광역시 한밭도서관, 제주특별자치도 한라도서관, 광주광역시립무등도서관, 국립중앙도서관 등 전국 11개 도서관과 문화원에 키오스크를 설치해 일반 국민 대상 한자인식 및 번역 실증 서비스를 제공하고 있다.

키오스크 내 인공지능 한자 인식 화면 (자료=ETRI)

ETRI 연구진은 번역된 고서를 활용한 실감형 인터랙티브 콘텐츠도 개발한다. 번역된 고서의 스토리를 기반으로 미디어아트와 모션센서를 통해 상호작용하면서 체험하는 서비스이다. 이를 통해 고서에 대한 일반인들의 흥미를 유발할 수 있을 것으로 기대된다.

강현서 ETRI 호남권연구센터장은 "번역 전문가의 작업 환경이 그동안 노동집약적 업무로 과중했다"라며 "디지털 전환을 통해 간소화하고 한자를 모르는 일반인들도 고서를 쉽게 접해 우리나라 문화기록유산인 고서에 관심을 갖는 계기가 될 수 있을 것으로 기대된다"라고 밝혔다.

관련기사

권경열 한국고전번역원 책임연구원도 "그동안 번역 전문가들이 번역 이전 단계의 공정을 처리하는데 많은 애로를 겪어왔는데, 이번 기술 개발이 획기적으로 도움을 줄 것으로 생각한다 "라고 말했다.

이 연구는 전라북도의 지원을 받아 수행되고 있으며, 개발된 스마트워크 플랫폼과 실감형 인터랙티브 콘텐츠는 향후 설립될 전라유학진흥원의 핵심 요소로 활용될 예정이다.