"우리는 한국 스타트업·디지털 네이티브 기업 중심으로 인공지능(AI) 사업 성과를 내고 있습니다. 앞으로 엔터프라이즈 고객을 비롯한 방송사, 콘텐츠 기업과 협업해 성공 사례를 글로벌 수준으로 끌어올릴 것입니다."
홍상원 일레븐랩스 한국·일본 고투마켓(GTM) 디렉터는 최근 지디넷코리아 인터뷰에서 한국 시장 성과와 전략을 이같이 밝혔다.
일레븐랩스는 AI 음성 특화 솔루션을 개발·운영하고 있다. 일레븐랩스 AI 음성은 인간 감정과 호흡 같은 비언어적 요소를 텍스트-투-보이스(TTS)로 구현할 수 있다. 현재 1만1천 개 넘는 보이스 라이브러리와 99개 언어를 지원하고 있다. TTS·STT·음성 인식·VAD 매칭 기술을 결합한 음성 에이전트 기술을 핵심 강점으로 내세웠다.
일레븐랩스는 지난해 일본 도쿄에 첫 지사를 설립했으며 같은 해 11월 한국 시장 진출을 발표했다. 홍상원 디렉터가 한국과 일본 지사를 동시에 총괄하고 있다.
홍 디렉터는 한국과 일본 AI 음성 시장 차이점을 언급했다. 일본은 보험, 금융, 통신 등 보수적 산업 중심으로 기술증명(PoC)를 거친 뒤 AI 음성을 본격적으로 도입하고 있는 반면, 한국은 스타트업과 디지털 네이티브 기업 중심으로 일레븐랩스 기술을 빠르게 받아들이고 있다는 설명이다.
홍 디렉터는 한국 시장 출범 후 6개월 만에 여러 활용 사례를 확보했다고 밝혔다. 국내 스타트업을 비롯한 게임, 미디어, 콜센터, 라이브커머스, 크리에이터 생태계 중심으로 AI 음성 기술 적용 사례를 넓히고 있다고 설명했다.
그는 최근 국내 대표 사례로 스푼랩스를 꼽았다. 그는 "스푼랩스는 기존 성우 녹음 방식으로 콘텐츠 한 편을 제작하는 데 4~7개월이 걸렸다"며 "우리 AI 음성 솔루션을 도입한 뒤 제작 기간을 수 시간 수준으로 줄였다"고 강조했다.
일레븐랩스는 케어링의 고령층 돌봄 서비스에 AI 음성 에이전트를 적용해 이용자와 대화하고, 건강 관리와 정서적 지원을 제공하는 방식을 추진하고 있다. 또 방송사와 콘텐츠 기업과 협업도 추진 중이다. 경인방송에서 고 김광한 DJ가 진행했던 '라디오 가가' 20주년 축하 메시지에 AI 기술을 공급했다.
"韓, AI 음성 기대치 높아…고객사 확장 목표"
홍 디렉터는 한국 시장 공략 과제로 높은 품질 기대치와 엔터프라이즈 고객 확보를 꼽았다.
그는 "한국 고객들의 TTS 품질 기대치가 매우 높다"며 "이 수준에 맞추려면 실제 사람과 같은 대화가 가능한 AI 에이전트를 만들어야 한다"고 말했다. 이어 "발화를 인식할 뿐 아니라 말하는 기술까지 더 정교해져야 한국서 제대로 된 비즈니스를 할 수 있다고 판단했다"고 덧붙였다.
이에 홍 디렉터는 AI 음성 도입이 단순 기술 구매가 아니라 기업 운영 방식 변화도 필요하다고 봤다. 그는 "기술이 좋다고 해서 곧바로 고객사에 도입되는 것은 아니다"며 "AI 도입은 새로운 비즈니스 운영 모델 자체를 바꾸는 일"이라고 설명했다.
그러면서 "기업은 운영 매뉴얼과 24시간·주 7일 운영 방식 변화도 고민해야 할 때"라며 "우리는 고객과 AI 도입 구조를 이에 맞게 설계하는 것도 돕고 있다"고 강조했다.
홍 디렉터는 한국에서 엔터프라이즈 고객을 적극 공략하겠다고 밝혔다. 현재 스타트업과 디지털 네이티브 기업 분야에서는 사업이 순조롭게 진행되고 있지만, 엔터프라이즈 시장에는 아직 완벽하게 침투하지 못했다는 판단에서다.
관련기사
그는 "국내 주요 대기업과 협업을 추진하고 있다"며 "특히 네이버, LG유플러스 등 투자사들과의 협업 사례도 공개해 나갈 것"이라고 밝혔다.
이어 "한국은 AI 음성 기술의 실험과 확산이 동시에 가능한 시장"이라며 "국내에서 검증한 활용 사례를 엔터프라이즈와 콘텐츠 산업 전반으로 넓혀 글로벌 시장에서도 통할 수 있는 성공 모델로 만들겠다"고 포부를 밝혔다.











