에이아이더, AI 음성복제 솔루션 '와이즈클로닝 봇' 출시

음성 분석·합성 시간을 10분으로 단축

컴퓨팅입력 :2019/04/29 10:05

에이아이더(대표 김수화)는 인공지능(AI) 음성 복제 솔루션인 와이즈클로닝 봇(Wise Cloning-Bot)을 출시했다고 29일 밝혔다.

에이아이더는 데이터 기반 디지털 혁신 전문기업인 엠로의 자회사로 기업의 AI 도입에 필요한 컨설팅과 맞춤형 솔루션을 제공하는 AI 전문기업이다.

와이즈클로닝 봇은 AI를 통해 사람의 음성을 복제하는 서비스를 제공한다. 개인의 음색과 억양을 학습하는 AI 알고리즘을 통해 음성이 재현된다. 시그널을 통해 음성의 인식과 재현이 이뤄지기 때문에 언어에 대한 제약이 없다.

엠로 자회사 에이아이더 로고

텍스트를 사람의 목소리로 바꿔주는 기존 음성 복제 방식을 사용한 예시로는 아파트 관리사무소와 지하철의 기계음 안내 방송 등이 있다.

에이아이더 관계자는 "사람의 목소리를 단시간 안에 분석하고 복제하는 것은 쉽지 않다"며 "와이즈클로닝 봇의 AI 기술이 자연스러운 음성 복제의 길을 열었다"고 말했다.

와이즈클로닝 봇은 집대성된 음성 정보를 전이학습하며, 특정인의 목소리 특성 파라미터를 딥러닝 기술로 추출하고 패턴화해 인식하고 합성한다. 텍스트는 와이즈클로닝 봇을 통해 인식된 목소리로 변환돼 들려진다.

일반적인 음성 복제에 필요한 분석과 합성 시간은 4시간 정도다. 에이아이더는 이를 10분으로 단축했다.

관련기사

에이아이더는 광고이미지와 모델의 적합도를 음성 복제 기술을 통해 사전에 시뮬레이션하고 체크하는 사업을 진행 중이다. 음성복제 기술로 광고에 나오는 대사를 사전에 모델 후보별로 시뮬레이션하는 것이 가능하다. 광고 모델 음성을 10분 정도 학습하면, 모델이 말하는 것과 동일한 음성을 얻을 수 있다.

김수화 에이아이더 대표는 "아직 사람의 감정을 완벽히 표현하지는 못하지만, 앞으로 감정의 요소까지 딥러닝해서 음성을 복제할 수 있게 될 것"이라며 "음성 합성과 복제 서비스를 AI스피커와 같이 실생활과 다양한 비즈니스 영역에서 쉽게 접할 수 있는 시대가 올 것"이라고 말했다.