올해 AWS 서밋 서울 2025에서는 음성 AI 기술 스타트업 ‘수퍼톤’이 주목을 받았다. 수퍼톤은 행사에서 AI 보이스 합성, TTS(Text-to-Speech), 더빙 등 다양한 기술력을 바탕으로 신개념 콘텐츠를 선보이며 참가자들의 눈과 귀를 사로잡았다. 단순 기술 시연을 넘어 콘텐츠, 커뮤니케이션, 일상 영역으로 확장 가능한 가능성을 실감케 했다는 평가다.
18일 관련업계에 따르면 AWS 서빗 서울이 열리는 행사 첫날인 14일, 수퍼톤은 기조연설 무대에 앞서 ‘AI 음악 프로젝트 – 컨트롤 유(Ctrl+U)’라는 무대를 선보여 기술과 예술의 접점을 보여줬다.

이번 프로젝트는 수퍼톤과 음악 생성 AI 스타트업 포자랩스, AWS가 협업해 제작했다.
포자랩스의 AI가 작사·작곡한 곡을 수퍼톤의 가창 합성 기술로 구현된 남성 AI 보이스가 부르고, 일반인 여성 참가자가 듀엣으로 무대에 올랐다. 1절은 AI 뮤직 챌린지 참가자들의 영상과 음성으로 구성됐으며, 2절에서는 실제 여성 참가자가 AI와 호흡을 맞추며 공연을 완성했다. 실제 사람과 AI가 함께 부르는 듯한 자연스러운 무대는 관람객들로부터 뜨거운 박수를 받았다.

수퍼톤의 음성 기술은 공연뿐만 아니라 행사 운영 전반에도 활용됐다. 행사장 곳곳에서 울려 퍼진 장내 안내 방송은 ‘수퍼톤 플레이’의 TTS 기술을 기반으로 한 음성이다. 실제 사람의 발화 스타일을 학습해 부자연스러움이 없는 것이 특징이며, 이번 행사에서는 ‘에디’, ‘수호’ 캐릭터 보이스가 입·퇴장 안내, 세션 소개, 연사 소개 등에 활용됐다. 지난 2월 정식 출시된 수퍼톤 플레이는 출시 3개월여 만인 5월 현재 글로벌 누적 가입자 20만 명을 돌파한 바 있다.

가장 큰 주목을 받은 기술은 행사 둘째 날인 15일 기조연설 중 공개된 AI 더빙 기술이다. 이 기술은 기존 영상 속 인물의 목소리를 클로닝하고, 이를 기반으로 다른 언어로 자연스럽게 더빙해주는 것이다. 수퍼톤은 이번 기조연설 영상에서 아마존 CTO 버너 보겔스, AWS 부사장 디팍 싱의 음성을 영어에서 한국어로 더빙했는데, 목소리의 톤과 말투까지 유사하게 구현해 놀라움을 자아냈다. 더빙 과정에는 수퍼톤의 보이스 클로닝, TTS 기술은 물론, 공간감 재현 기술 ‘수퍼톤 에어’, 스튜디오 음질 보정 기술 ‘SQSE(Studio Quality Sound Enhancement)’까지 적용돼 몰입감을 극대화했다.
관련기사
- "내 목소리가 캐릭터 음성으로"…수퍼톤 시프트, 무료 베타 서비스 시작2024.04.15
- 쿠팡, 임직원·가족 위한 정신건강 지원 프로그램 확대2025.05.18
- 한성숙 전 네이버 대표, 유럽개발대표 물러나 고문으로2025.05.16
- 파리 전통 패션 감성 살린 '칼 라거펠트' 韓 첫 팝업 가보니2025.05.16

수퍼톤의 기술은 전시 부스에서도 직접 체험할 수 있었다. 수퍼톤 부스에는 수퍼톤 플레이를 기반으로 AI 음성 서비스를 시연할 수 있는 공간과 함께, 음성 기반의 ‘캐릭터 챗’도 운영됐다. 또 골프존 부스에는 수퍼톤의 음성을 기반으로 한 ‘AI 골프 코치’도 함께 선보여 현장 관람객들의 관심을 끌었다.
이교구 수퍼톤 대표는 “AWS 서밋을 통해 콘텐츠 영역을 넘어 실생활 전반에 적용 가능한 음성 AI의 확장성을 보여줄 수 있었다”며 “앞으로도 수퍼톤은 누구나 쉽게 사용할 수 있는 AI 오디오 기술을 통해 산업과 일상에 기여하겠다”고 밝혔다.