셀바스AI, 감정 있는 '대화형 음성합성 오픈소스 플랫폼' 구축

음성 데이터베이스 구축에 대학들 참여

컴퓨팅입력 :2021/01/07 17:19

인공지능(AI) 전문기업 셀바스AI가 로봇의 감정과 개성을 표현할 수 있는 '대화형 음성합성 오픈소스 플랫폼'을 구축했다고 7일 밝혔다.

해당 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관으로 진행된 '음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발' 국책 연구과제의 결과물이다.

이 플랫폼은 소스코드 공유사이트 '깃허브'에 구축됐다. 여기에 탑재된 기능으로는 ▲딥뉴럴네트워크(DNN) 음성합성기 제작에 필요한 음성코퍼스 ▲로봇에 감정과 개성을 부여하기 위한 감정적 SSML 해석기 ▲딥러닝 기반 한국어 G2P 변환기 ▲딥러닝 훈련이 가능한 종단간 한국어 음성합성기 ▲음색과 감정을 표현할 수 있는 음성합성기 등이다. 또한 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 공개됐다.

관련기사

셀바스 AI 대화형 음성합성 오픈소스 플랫폼

해당 플랫폼은 개발에는 한국과학기술원, 성신여대, 대전대학교, 서강대학교 등 대학들도 참여했다. 셀바스 AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당해 총 40명의 목소리로 이루어진 2만4천247개 문장, 34시간 분량의 음성 데이터베이스를 구축했다. 여기에는 감정과 개성 표현을 위한 음성 데이터가 포함되었다.

셀바스AI 측은 "공개된 음성 데이터베이스는 한국어로는 전 세계에서 가장 많은 양의 음성합성용 데이터"라고 설명했다.