한국전자통신연구원(ETRI)은 4개 국어 대화체 음성DB 총 36만 문장 및 한국어 대역 총 20만 문장을 산업체 및 학계 등에 배포한다고 30일 밝혔다.
ETRI가 이번에 배포하는 DB는 ▲독일어, 러시아어, 아랍어, 베트남어 대화체 음성DB ▲한국어-독일어, 한국어-러시아어, 한국어-아랍어, 한국어-베트남어 대화체 대역문장DB 등 8종의 언어음성 DB다.
ETRI는 지난 2011년부터 한·영·일·중 등 다국어 언어음성DB를 구축, 배포해 왔다. 2014년에는 프랑스어를 추가하였고, 지난해에는 독일어, 러시아어, 아랍어, 베트남어를 구축한 바 있다.
언어음성 DB는 음성인식 분야와 언어번역 분야의 SW 개발이나 음성언어처리 연구의 기초데이터로 사용되는 것은 물론 음성리모콘제조, 내비게이션제조, 포털, 외국어 교육 등에 활용될 수 있다. 최근에는 자동통역서비스 등 스마트 인터페이스 산업이 확산되는 추세에 따라 이 분야의 기술 자립을 위해 다국어 언어음성DB 구축이 더욱 중요해진 상황이다.
하지만 구입 가능한 해외 외국어 DB는 300~500명이 발화한 경우 1~2억원 정도의 비용이 소요돼 산업계 부담으로 작용했다. 이에 반해, ETRI가 제공하는 4개국어 음성DB는 발화 인원수도 총 2,400명에 달하며 가격면에서도 해외DB대비 5~10% 수준으로 중소기업이 이용할 수 있다.
ETRI는 현재까지 국내 57개 기관에 247개 DB를 배포, 총 430억원에 해당하는 비용 절감 성과를 얻었으며, 이번에 배포하는 8종의 DB를 국내 10개 기관에 배포할 경우 최소 120억원의 수입대체 효과를 얻을 수 있을 것으로 내다보고 있다.
관련기사
- 윈도10 음성인식 비서 ‘코타나’ 사용법2016.03.30
- “쏘나타 음성 인식 시스템, 운전 집중에 방해”2016.03.30
- "네이버 한글 음성인식 에러율 5% 미만"2016.03.30
- 한컴, 시스트란과 음성인식 합작사 설립2016.03.30
이번 DB 배포는 지난 2011년부터 2016년까지 미래창조과학부가 NIA(한국정보화진흥원)을 통해 추진하는 국가DB사업 중 하나인 “스마트 모바일용 다국어 언어음성DB” 구축사업의 일환으로 진행되었다.
ETRI 자동통역연구실 이영직 박사는 “ETRI의 음성DB는 국가DB사업에서 요구하는 고품질 수준으로 국가지정 감리업체로부터 합격했다. 본 DB를 활용할 경우 언어음성기술의 완성도를 높일 수 있다. 따라서, 신규시장 창출 및 국제경쟁력 강화에 큰 기여를 할 것으로 보인다”고 설명했다.