AI 음성 기업 수퍼톤은 새로운 TTS 모델인 ‘소나 스피치2’를 출시했다고 9일 밝혔다.
이 모델의 이전 버전인 ‘소나 스피치1’은 지난 2월 정식 출시된 AI 음성 서비스 ‘수퍼톤 플레이’를 비롯해 수퍼톤 API 등 다양한 TTS 서비스에 적용돼 왔다. 실제 사람의 발화 스타일과 감정 정보까지 학습해 자연스러운 음성을 구현해 호평을 받고 있는 수퍼톤 TTS 기술의 핵심이다.
출시와 동시에 ‘수퍼톤 플레이’에 탑재된 소나 스피치2는 텍스트를 자연스럽게 읽는 수준을 뛰어넘어 문맥을 이해해 발화 속도, 호흡, 억양을 재현하고, 웃음 소리나 목을 가다듬는 소리 같은 비언어적인 표현까지 생생하게 구현한다. 소나 스피치1이 맑고 안정적인 음성에 자연스러운 표현력을 더한 것이 특징이라면, 소나 스피치2는 캐릭터성이 살아있는 음성을 만들어주기 때문에 오디오북처럼 실제 사람이 연기하는 것 같이 몰입도가 중요한 콘텐츠를 제작할 때 유용하다.
지원하는 언어 역시 국내 TTS 솔루션 가운데 최대다. 이전 버전에서 제공하던 한국어·영어·일본어는 물론, 프랑스어·독일어·스페인어·중국어(간체·번체)·베트남어·인도네시아어·태국어·러시아어·아랍어 등까지 더해져 총 23개 언어를 지원하며, 향후 30개로 확대할 계획이다. 23개의 언어에 대해 ‘보이스 클로닝’ 기능도 제공해 사용자들은 단 한 번의 녹음만으로 자신의 목소리 톤은 유지한 채 언어 장벽 없이 텍스트를 음성으로 변환할 수 있다.
지난달 오픈소스로 공개한 바 있는 온디바이스 기반 TTS 모델 ‘수퍼토닉’도 ‘수퍼톤 플레이’에 탑재됐다. 수퍼토닉은 사용자 기기 자체에서 AI 연산 처리가 되는 온디바이스 모델로, GPU나 클라우드, 네트워크 연결 없이 실시간 수준으로 텍스트를 음성으로 바꿔준다. 클라우드로 데이터를 전송하지 않기 때문에 보안이 필수적인 금융, 의료, 보안 산업 분야에서 활용도가 높다. 특히 이번 ‘수퍼토닉’ 모델에서는 오픈소스 공개 버전에서는 없었던 보이스 클로닝 기능을 제공하는가 하면, 한국어·영어·일본어·스페인어·포르투갈어 등 5개의 언어를 지원해 사용자의 편의성을 높였다.
이번에 다양한 TTS 모델이 대거 추가되면서 사용자들의 선택지도 많아졌다. 수퍼톤 플레이를 이용할 때 사용자들은 콘텐츠의 목적과 제작 환경에 따라 기존의 소나 스피치1을 비롯해, 새롭게 추가된 소나 스피치2, 수퍼토닉 중 최적의 모델을 선택해 활용할 수 있다. 예컨대, 챗GPT를 이용할 때 원하는 AI 모델을 선택할 수 있는 것처럼 감정 표현이나 자연스러운 연기가 필요하거나 보다 다양한 언어로 된 콘텐츠를 제작할 때는 소나 스피치2를, GPU나 클라우드, 네트워크 연결이 어렵거나 보안이 요구되는 환경에서는 수퍼토닉을 선택하면 된다.
이 밖에, 소나 스피치2와 수퍼토닉은 API(application Programming Interface)로도 서비스된다. API는 개발자들이 다른 서비스에서 제공하는 데이터나 기능을 가져와 자사 서비스에 내재화할 수 있는 일종의 디지털 연결고리다. 다양한 TTS 모델이 API로 제공됨에 따라 개발자들은 구현하고자 하는 서비스의 특징이나 개발 환경에 따라 모델을 선택해서 개발에 활용할 수 있다.
관련기사
- 아누아, 英 ‘뷰티 어워즈 2025’ 2관왕2025.12.09
- 에이피알, 세번째 플래그십스토어 ‘메디큐브 성수’ 열어2025.12.09
- "장사 잘하는법 배워가요"...배민파트너페스타서 엿본 외식업의 미래2025.12.08
- SSG닷컴 새 멤버십 ‘쓱세븐클럽’ 1월 출시..."7% 적립·티빙 제휴"2025.12.09
수퍼톤은 사용자의 PC에 다운로드해서 이용할 수 있는 ‘수퍼톤 플레이 데스크톱’을 지난달 19일 베타 출시하기도 했다. 이는 클라우드가 없는 일반 PC 환경에서도 빠르고 편리하게 텍스트를 다양한 캐릭터의 음성으로 바꿔주는 윈도우(Windows) 및 맥(Mac)용 소프트웨어다. 수퍼톤은 이달 22일부터 수퍼톤 플레이 데스크톱 사용자 중 프로(Pro) 요금제를 이용할 경우, 무제한으로 음성을 생성할 수 있는 혜택을 제공할 예정이다.
수퍼톤 관계자는 “소나 스피치2는 언어의 장벽을 넘어 누구나 글로벌 시장에서 활동할 수 있는 창작 환경을, 수퍼토닉은 장소와 장비 제약 없는 완전한 실시간 제작 환경을 제공한다”며 “앞으로도 AI 음성 기술을 지속해서 선보여 서비스 품질을 높이고, 창작자들이 원하는 방식으로 기술을 활용하고 창작할 수 있는 생태계를 만들어가겠다”고 밝혔다.











