네이버, 배우 유인나 음성 합성해 오디오북 제작

자체 개발한 nVoice기술 적용

인터넷입력 :2016/08/04 14:47

네이버가 음성합성기술을 활용해 만든 오디오북 3권을 공개했다. 제작된 오디오북으로 네이버는 YG엔터테인먼트와 함께 기부 캠페인을 진행한다.

네이버는 네이버랩스를 통해 축적해온 음성합성 기술과 배우 유인나 씨의 음성을 기반으로 녹음본과 합성본이 결합된 ‘유인나 오디오북’ 3권을 제작하고, 이를 기부 플랫폼인 해피빈을 통해 무료로 제공한다고 4일 밝혔다.

유인나 오디오북은, 청소년들의 교양서적으로 추천할 만한 3권의 책(데미안, 동물농장, 왕자와 거지)에 대해 진행되었고, 책의 전반부는 유인나 씨가 직접 읽고, 후반부는 네이버의 음성합성기술로 만들어졌다.

네이버 측은 "평소 오디오북 녹음하기 위해선 권당 10시간 이상의 녹음 시간이 필요했지만, 네이버의 음성합성기술이 더해져 기존 대비 절반의 시간으로 오디오북을 제작했다"며 "특히 합성 기술이 적용된 부분은 성우의 목소리 속 고유한 운율과 자연스러움을 잘 살려내며 실제와 가까운 소리를 재현해냈다"고 설명했다.

음성합성기술이란 텍스트의 형태소를 분석하고 음소 단위로 변환한 후, 어떠한 운율로 읽는 것이 좋을지 모델링 한 뒤 녹음한 음성 DB를 활용해 최적의 합성단위를 선택하고 합성하는 기술이다.

음성합성기술 중 합성단위 선택방식(Unit Selection)은 방대한 양의 데이터베이스를 분석하고, 자연스럽고 명료한 음성합성을 만들어 내는 알고리즘의 장점이다. 네이버의 nVoice에 적용되는 합성단위 선택방식은 이런 음질의 우수성을 바탕으로 애플 ‘시리’, 아마존의 ‘에코’, 구글 ‘나우’ 등 글로벌 IT기업들이 앞다퉈 개발 및 적용하고 있는 음성합성 방식이다.

관련기사

이 기술은 현재 뉴스 읽기, 사전 예문 읽기, 번역기 등 네이버의 실제 서비스에 적용 중이며, 향후 음성을 인터페이스로 활용하는 다양한 온오프라인 서비스에 확대될 예정이다.

네이버 송창현 CTO는 “미래의 기기와 서비스는 사람과 기계가 음성을 주고받는 대화형 음성 인터페이스가 주를 이룰 것으로 보인다”며, “네이버도 nVoice 기술을 적용해 한국어뿐 아니라 영어, 일본어, 중국어 등 4개국 남녀 화자를 개발했고, 향후 지속적으로 합성기술의 품질을 높여나가며 언어 및 적용 범위를 확대해 나갈 것”이라고 밝혔다.