미국 음성인식 인공지능(AI) 기술업체 사운드하운드가 한국 시장에서 심상치 않은 움직임을 보이고 있다. 삼성전자, 현대자동차, KT, 네이버·라인에 투자를 받더니 내년엔 한국에 지사를 설립한다. 국내 AI솔루션 업체인 솔트룩스와 협력해 서비스 한국어화를 추진중이다.
사운드하운드는 외부 제품과 서비스에 음성 비서 개발 플랫폼을 제공하는데, 이 플랫폼을 이용하는 서비스들이 데이터를 공유할 수 있는 구조를 갖췄다는 점에 주목할 필요가 있다. 플랫폼 참여 업체들이 일종의 집단 지성으로 '포괄적 지식을 갖춘 AI'를 만들어갈 수 있다.
사운드하운드가 한국에 본격 진출하면, 한국형 포괄적 AI가 탄생될지 관심이 쏠린다. 특히 국내 사운드하운드 투자 업체들이 지분 확보보다 기술협력에 더 큰 관심을 보이고 있는 만큼, 여기에 참여할지도 관전 포인트다.
■삼성전자, 현대자동차, KT, 네이버.라인까지 사운드하운드에 투자
업계에 따르면 사운드하운드가 삼성전자, 현대자동차, KT, 네이버·라인까지 국내 기업을 통해 유치한 투자금액은 총 1천500억원이 넘는다. 실리콘밸리 기업에 국내 굴지 4개 기업이 동시에 투자한 사례는 사운드하운드가 유일하다.
사운드하운드는 2005년 미국에서 설립된 음성인식 AI 개발 회사로 10년 이상 이 분야만 파고들어, 경쟁 서비스와 차별화되는 자체 기술을 확보했다. 기술력을 바탕으로 1조원 이상의 기업가치를 인정받고 있다.
미국, 캐나다, 일본에 총 8개 사무소를 운영하고 있는데 내년엔 한국에도 사무소를 낼 계획이다. 한국어 서비스를 출시하기 위해 국내 AI 기술업체 솔트룩스와 전략적 협력관계를 맺고 한국어를 학습 중이다.
업계에 따르면 사운드하운드는 "한국 진출에 맞춰 국내 대기업들과 '플랫폼'구축"에 돌입했다. 이 중에는 사운드하운드에 투자한 업체들도 참여하고 있는 것으로 알려졌다. 구체적으로 어떤 방식의 협업이 이뤄지고 있고 그 결과로 어떤 서비스가 가능해질지는 아직 공개되지 않았다.
■사운드하운드 어떤 기술 가졌나
사운드하운드의 음성AI는 아마존 알렉사나 구글 어시스턴트처럼 음성을 듣고 날씨, 장소, 주식 등 사용자가 필요한 정보를 제공해준다. 복잡한 질문에도 즉각적으로 정확한 답변을 제공한다는 점이 차별화 됐다. 스피치투미닝(STM)이라는 자체 기술 덕분이다. 음성을 문자로 변경한 후, 텍스트 분석을 거쳐 정보를 제공하는 방식이 일반적인데, STM은 음성에서 바로 의미를 찾아낸다.
두 단계를 거치는 기존 방식보다 STM 기술이 "속도와 정확도 면에서 모두 뛰어나다"는 게 회사 측 설명이다. 단계가 줄어들어 속도도 빨라졌고, 사람이 문맥을 고려해 상대의 말을 더 정확하게 알아듣듯이 음성 인식과 의미 분석을 동시에 실행해 에러율을 크게 낮췄다는 설명이다.
■외부 개발사에 매력적인 사운드하운드 음성AI 플랫폼
사운드하운드는 외부 기업이 이 기술을 이용해 쉽게 자체 서비스에 음성AI를 결할할 수 있도록 '하운드파이'라는 개발 플랫폼을 제공하고 있다.
아마존이나 구글도 외부 업체들이 자사 음성AI를 이용할 수 있게 제공하지만, 사운드하운드는 외부 기업에 독립성을 보장한다는 점에서 이들과 차이가 크다는 점을 강조하고 있다.
사운드하운드 케이반 모헤이에르 대표는 최근 솔트룩스가 개최한 기술컨퍼런스에서 이 점을 강조하기도 했다. 그는 "아마존과 구글의 AI플랫폼은 외부 기업들의 사용자와 브랜드를 뺏어가고 있다"며 "때문에 아마존이나 구글 플랫폼과 통합하는 것을 주저하는 회사가 많아지고 있다"고 말했다.
하운디파이는 독립성을 제공하는 동시에, 플랫폼 참가자들이 원한다면 서로 연합해 보다 똑똑한 AI를 만들 수 있게 해준다. 집단 AI 구축이 가능한 아키텍처(구조)를 갖췄다고 할 수 있다. 사운드하운드는 이 기술을 '콜렉티브AI'라고 부른다.
콜렉티브AI는 여러 분야의 서비스들이 각자 보유하고 있는 도메인(활동 분야) 데이터를 공유해, 보다 포괄적인 이해력을 갖춘 AI를 만들자는 개념이다.
■한국형 '집단 AI 연합' 나올까?
콜렉티브AI는 사운드하운드가 대규모 투자를 유치하는 데 큰 공을 세웠다. 올해 1월 사운드하운드는 삼성전자가 만든 ‘삼성촉진펀드(Samsung Catalyst Fund)'로부터 투자 유치소식을 알리며 "하운디파이 플랫폼 뒤에 있는 기술의 힘을 더 많은 세계 사용자들에게 제공하고 콜렉티브AI 아키텍처를 확장하는데 사용할 것"이라고 말하기도 했다.
사운드하운드가 국내 기업들과 구축하고 있는 플랫폼이 콜렉티브AI와 관련된 협력이라면, 사용자들 입장에서 그동안 여러 서비스에서 각각 찾아야 했던 정보를 보다 쉽게 한 서비스에서 이용하게 될 수 있다.
사운드하운드는 지도앱, 차량공유앱, 식당평가앱이 어떻게 서로 데이터를 이용하는지 동영상을 통해 설명하고 있다.
개발자 A가 지도앱을 만들고 데이터를 공유하면, 개발자 B는 차량공유앱에서 A의 위치 데이터를 가져다 쓸 수 있다. 덕분에 B 앱에서 "이 위치에서 저 위치로 가는데 비용이 얼마인가?" 같은 질문에 답이 가능해진다.
관련기사
- 18년동안 음성만 팠더니 기회가 오네2017.11.19
- KT, 글로벌 협력으로 AI 서비스 고도화2017.11.19
- 삼성-네이버는 왜 사운드하운드에 관심갖나2017.11.19
- 네이버-라인, 美 음성인식기술기업 투자2017.11.19
개발자 C는 식당평가앱을 만들고 A의 데이터를 이용해 지도 상에 레스토랑을 표시해 주고 이용정보를 소개해 줄 수 있다. A와 C가 연결되면서 B의 차량공유 앱에선 이제 이런 복잡한 질문이 가능해진다. "가장 가까운 공항에서 샌프란시스코의 최고 이탈리안 레스토랑까지 가는데 비용이 얼마나 드나, 레스토랑은 4스타 등급 이상이고 아이들이 이용하기 좋지만 체인점은 아니어야 한다. 또 수요일에 오후 9시 이후에도 열어야 한다. 그리고 이동하는데는 얼마나 걸리나?"
콜렉티브AI 아키텍처 안에서 이미 맛집검색 옐프, 차량공유 우버, 호텔예약 익스페디아를 포함해 날씨, 주식, 스포츠, 항공편, 대화형 게임 등 100 개 이상의 서로 다른 도메인이 연결돼 있다.