"웃음부터 속삭임까지"…일레븐랩스, AI 음성 기술 업그레이드

일레븐랩스가 인공지능(AI) 음성 기능을 업그레이드해 활용 영역을 넓혔다.

일레븐랩스는 텍스트 음성 변환(TTS) 모델 '일레븐 v3 알파'를 출시했다고 11일 밝혔다.

일레븐 v3 알파는 감정의 미묘한 흐름을 비롯한 화자 간 전환, 음성 톤 중간 변화까지 정밀하게 재현할 수 있다는 평을 받고 있다. 속삭임이나 웃음, 숨소리 같은 지시도 실제 음성과 구별 어려울 만큼 자연스럽게 처리된다는 설명이다.

일레븐랩스는 이 모델이 텍스트에 세밀한 음성 태그를 삽입할수록 고품질 결과를 만들 수 있다고 밝혔다. 대사 중간에 분위기를 바꾸거나 아이러니한 말투를 연출하는 등 섬세한 감정 조절이 가능하며, 듣는 이에게 몰입감 높은 오디오 경험을 제공한다고 강조했다.

새 모델은 지원 언어도 기존 32개에서 70개 이상으로 늘어났다. 이를 통해 AI 음성 커버리지는 전 세계 인구 기준 60%에서 90%로 확장됐으며, 향후 지속적인 기능 업데이트가 예정됐다.

모델 대화형 기능도 강화됐다. 화자 간 끼어들기나 대화 흐름 유지, 다양한 감정 표현을 자연스럽게 구현할 수 있어 인터랙티브 미디어, 오디오북, 캐릭터 기반 콘텐츠 제작에 최적화됐다.

사용자는 텍스트에 속삭임, 군중 소리, 문 삐걱거리는 소리 같은 오디오 태그를 삽입하면 상황에 맞는 음향 효과도 생성할 수 있다. 스트리밍 버전과 공개 API는 추후 출시 예정이며, 현재 알파 버전은 누구나 웹사이트에서 체험할 수 있다.

관련기사