가우디오랩(대표 오현오)은 오디오 인공지능 기술을 활용해 가사와 음원을 자동으로 동기화해 실시간 가사 보기 기능을 제공할 수 있도록 한 GTS(Gaudio Text Sync)를 출시, 벅스를 통해 상용화 했다고 27일 밝혔다.
GTS는 가우디오랩의 독자적인 오디오 기술로 개발된 인공지능 기반 가사 동기화 솔루션이다. 지금껏 '타임 코더'라 불리는 인력이 직접 투입돼 매 곡마다 일일이 가사와 음원의 시점(Time sync)을 맞추던 문제를 자체 AI기술을 통해 풀어냈다.
GTS 솔루션은 정확히 싱크된 가사를 빠르게 생성해 서비스할 수 있어, 스트리밍 서비스 담당자는 물론 이용자 만족도 향상에도 기여하고 있다. 하루에 새롭게 발매되는 음반의 수가 수만 장, 트랙 수로는 수십만 곡에 이르는 현 음원시장에서는 수작업으로 모든 곡에 싱크 가사를 생성하는 것이 사실상 불가능하다. 반면 GTS 엔진이 장착된 서버 1대면 하루 약 7만 곡을 처리할 수 있다.
관련기사
- 소프트뱅크벤처스, 배터리 스타트업 ‘스탠다드에너지’ 100억 투자2021.04.14
- 소프트뱅크벤처스, 주얼리 스타트업 ‘비주얼’ 25억 투자2021.04.01
- 소프트뱅크벤처스, VR 게임 스튜디오 미라지소프트 20억 투자2021.03.30
- 소프트뱅크벤처스, AI 기술기업 집중 투자에 1800억 쓴다2021.03.24
현재 음원 스트리밍 서비스사가 보유한 곡은 각 사 별로 약 4천만에서 7천만 곡 정도의 규모이나, 실시간 가사가 제공되는 곡은 아직 수십만 곡에 그친다. 실시간 가사 입력을 위해 소요되는 수작업 인력과 시간 비용 문제 때문이다. 이번 GTS 상용화를 통해 음원 서비스사가 제공하는 사실상 모든 곡에 대해 실시간 가사 보기가 가능한 시대가 열린 셈이다.
가우디오랩 전상배 최고과학책임자(CSO)는 "음원 스트리밍 서비스를 이용할 때 동기화에 오류가 있는 가사를 제공하거나 싱크 가사가 아닌 일반 가사를 제공하는 경우가 많은데, 가우디오랩의 기술을 활용하면 빠르고 정확하게 많은 곡에 대한 싱크 가사를 제공할 수 있다"며 "잘못된 가사의 오류를 검출하는 기능 탑재로 가사의 품질 관리도 가능하고, 한국어, 영어, 중국어 등 다양한 언어를 지원하는 만큼, 전 세계 음원 서비스에 적용돼 사용자들의 음악을 듣는 경험을 더욱 향상시킬 수 있을 것"이라고 말했다.