셀바스AI, 감정 있는 '대화형 음성합성 오픈소스 플랫폼' 구축

인공지능(AI) 전문기업 셀바스AI가 로봇의 감정과 개성을 표현할 수 있는 '대화형 음성합성 오픈소스 플랫폼'을 구축했다고 7일 밝혔다.

해당 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관으로 진행된 '음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발' 국책 연구과제의 결과물이다.

이 플랫폼은 소스코드 공유사이트 '깃허브'에 구축됐다. 여기에 탑재된 기능으로는 ▲딥뉴럴네트워크(DNN) 음성합성기 제작에 필요한 음성코퍼스 ▲로봇에 감정과 개성을 부여하기 위한 감정적 SSML 해석기 ▲딥러닝 기반 한국어 G2P 변환기 ▲딥러닝 훈련이 가능한 종단간 한국어 음성합성기 ▲음색과 감정을 표현할 수 있는 음성합성기 등이다. 또한 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 공개됐다.

관련기사

해당 플랫폼은 개발에는 한국과학기술원, 성신여대, 대전대학교, 서강대학교 등 대학들도 참여했다. 셀바스 AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당해 총 40명의 목소리로 이루어진 2만4천247개 문장, 34시간 분량의 음성 데이터베이스를 구축했다. 여기에는 감정과 개성 표현을 위한 음성 데이터가 포함되었다.

셀바스AI 측은 "공개된 음성 데이터베이스는 한국어로는 전 세계에서 가장 많은 양의 음성합성용 데이터"라고 설명했다.