일레븐랩스, 스푼랩스에 'AI 음성' 공급…"콘텐츠 제작 기간↓"

한국·일본·대만 오디오 콘텐츠 동시 확장 목표

컴퓨팅입력 :2026/05/06 11:44

일레븐랩스가 인공지능(AI) 음성 기술을 앞세워 오디오 콘텐츠 제작 구조를 대량 생산 시스템으로 전환했다.

일레븐랩스는 글로벌 오디오 플랫폼 기업 스푼랩스와 전략적 협력을 통해 신규 오디오 소설 서비스 '팟노블' 제작에 AI 음성 기술을 적용했다고 6일 밝혔다. 스푼랩스는 이를 기반으로 한국 일본 대만 3개국 시장을 겨냥한 오디오 콘텐츠를 동시에 출시했다.

이번 협력 핵심은 제작 기간 단축이다. 기존 성우 녹음 방식은 콘텐츠 한 편을 만드는 데 4~7개월이 걸렸지만 일레븐랩스 AI 음성 솔루션 도입 이후 제작 기간은 수 시간 수준으로 줄었다는 설명이다. 

일레븐랩스가 인공지능(AI) 음성 기술을 앞세워 오디오 콘텐츠 제작 구조를 대량 생산 시스템으로 전환했다. (사진=일레븐랩스)

스푼랩스는 기존 라이브 오디오 중심 사업에서 스토리 기반 오디오 콘텐츠로 사업 영역을 넓히는 과정에서 제작 공정을 재설계했다. 긴 제작 기간과 높은 비용 구조, 콘텐츠 확장성 제약을 해결하기 위해 AI 음성 기술을 도입했다.

일레븐랩스는 텍스트 음성 변환뿐 아니라 문맥과 감정을 반영하는 음성 구현에 초점을 맞췄다. 스푼랩스는 국내외 여러 텍스트 음성 변환 솔루션을 실제 제작 환경에 가까운 조건에서 검토한 뒤 일레븐랩스를 선택했다고 밝혔다.

평가 과정에서는 문장 부호에 따른 억양 변화와 기쁨, 슬픔, 분노 등 문맥 기반 감정 표현력이 주요 기준으로 다뤄졌다. 일레븐랩스는 단순히 글을 읽는 수준이 아니라 상황을 파악해 연기에 가까운 발화를 구현했다는 평가를 받았다.

스푼랩스는 지난 1월 한국 30종, 일본 26종, 대만 19종 팟노블 콘텐츠를 출시했다. 이달부터 국가별 매주 3종 이상 신규 콘텐츠를 출시해 단기적으로 100종 이상의 콘텐츠 라인업을 확보할 계획이다.

일레븐랩스는 8일까지 열리는 서울 코엑스에서 열리는 'AI엑스포 2026'에 참여한다. 

관련기사

김현 스푼랩스 팟노블 콘텐츠팀장은 "오디오 콘텐츠 핵심은 결국 '재미'이며 이를 위해서는 음성 품질이 반드시 뒷받침돼야 한다"며 "일레븐랩스는 단순한 문맥과 감정을 이해하는 '연기' 수준의 기술을 제공했다"고 밝혔다.

홍상원 일레븐랩스코리아 지사장은 "글로벌 오디오 플랫폼 시장을 선도하는 스푼랩스와 협업을 통해 우리 음성 AI를 기반으로 오디오 콘텐츠 제작 방식을 근본적으로 개선할 수 있어 매우 뜻깊었다"고 말했다.