일레븐랩스가 인공지능(AI) 음성 기능을 업그레이드해 활용 영역을 넓혔다.
일레븐랩스는 텍스트 음성 변환(TTS) 모델 '일레븐 v3 알파'를 출시했다고 11일 밝혔다.
일레븐 v3 알파는 감정의 미묘한 흐름을 비롯한 화자 간 전환, 음성 톤 중간 변화까지 정밀하게 재현할 수 있다는 평을 받고 있다. 속삭임이나 웃음, 숨소리 같은 지시도 실제 음성과 구별 어려울 만큼 자연스럽게 처리된다는 설명이다.

일레븐랩스는 이 모델이 텍스트에 세밀한 음성 태그를 삽입할수록 고품질 결과를 만들 수 있다고 밝혔다. 대사 중간에 분위기를 바꾸거나 아이러니한 말투를 연출하는 등 섬세한 감정 조절이 가능하며, 듣는 이에게 몰입감 높은 오디오 경험을 제공한다고 강조했다.
새 모델은 지원 언어도 기존 32개에서 70개 이상으로 늘어났다. 이를 통해 AI 음성 커버리지는 전 세계 인구 기준 60%에서 90%로 확장됐으며, 향후 지속적인 기능 업데이트가 예정됐다.
모델 대화형 기능도 강화됐다. 화자 간 끼어들기나 대화 흐름 유지, 다양한 감정 표현을 자연스럽게 구현할 수 있어 인터랙티브 미디어, 오디오북, 캐릭터 기반 콘텐츠 제작에 최적화됐다.
사용자는 텍스트에 속삭임, 군중 소리, 문 삐걱거리는 소리 같은 오디오 태그를 삽입하면 상황에 맞는 음향 효과도 생성할 수 있다. 스트리밍 버전과 공개 API는 추후 출시 예정이며, 현재 알파 버전은 누구나 웹사이트에서 체험할 수 있다.
관련기사
- 오픈AI, 구글클라우드에 챗GPT 올린다…MS 의존 탈피 '시동'2025.06.11
- 웨카와 네비우스, 초고성능 클라우드 인프라 솔루션으로 AI 혁신 가속화 위한 파트너십 체결2025.06.11
- AI가 내 일자리를 뺏을까…13년간 추적한 놀라운 결과2025.06.10
- AI 3대 강국 향한 전략 논의…여야, 산학연과 머리 맞댄다2025.06.10
일레븐랩스는 모델의 한국어 TTS 성능도 대폭 향상됐다고 강조했다. 단순 번역이 아닌 감정 전달에 집중해 사투리, 축구 중계 스타일 같은 특별한 요청도 반영할 수 있어서다. 이에 공공기관부터 크리에이터 콘텐츠까지 폭넓은 모델 활용을 기대하고 있다.
마티 스타니셰브스키 일레븐랩스 공동창업자 겸 최고경영자는 "일레븐 v3는 감정과 표현, 비언어적 지시까지 이해하고 제어할 수 있는 가장 표현력 뛰어난 TTS 모델"이라며 "속도, 감정, 스타일을 자유롭게 조정할 수 있어 콘텐츠 제작 방식의 패러다임 전환을 이끌 것"이라고 말했다.