인공지능(AI) 스피커를 개발하는 IT 기업들이 주인 목소리에만 반응하는 ‘화자 인식’ 기술을 앞 다퉈 선보이고 있다. 이 기술이 커머스 영역에 적용되면 외부인 목소리일 경우 결제를 거부하는 기능도 구현할 수 있게 된다.
16일 관련 업계에 따르면 최근 구글은 화자 인식 기능이 있는 AI 스피커 구글홈을 국내에 출시했으며, 카카오도 AI 스피커 카카오미니에 화자 인식 기능을 추가했다. 이외 네이버·KT 등 AI 플랫폼을 제공하는 IT 기업들은 내년 초까지 화자인식 기능을 탑재할 계획이다.
화자인식 기능이 적용된 AI 스피커는 사전에 목소리를 등록한 이용자에 한해 일정을 알려주거나, 맞춤형 콘텐츠를 제공해주는 서비스가 가능하다.
또한 스피커가 외부인의 명령에 무조건적으로 반응하는 일도 줄어들 것으로 보인다. TV 방송 진행자가 ‘오케이 구글’, ‘헤이 클로바’, ‘헤이 카카오’ 등 AI 플랫폼의 이름을 부르는 바람에 각 가정에서 보유한 AI 스피커들이 한시에 대답하는 웃지 못 할 상황을 방지할 수 있다.
현재까지 국내에 출시된 AI 스피커 중 화자인식 기능이 탑제된 제품은 구글홈과 카카오미니다. 화자인식을 통한 대화나 콘텐츠 추천이 가능한 수준이다.
지난 9월 국내 출시된 구글홈에는 한 기기에 최대 6명의 음성을 구별할 수 있는 화자 인식 기능인 ‘보이스 매치’ 기술이 탑재됐다. 연동된 구글 계정을 바탕으로 각 사용자가 좋아하는 음악, 콘텐츠 등을 추천하고 일정을 알려준다.
카카오는 최근 카카오미니에 화자인식 기능 ‘보이스프로필’을 적용해 베타 서비스 중이다. 카카오미니에게 “내 이름이 뭐야?”라고 물으면 스피커는 “제 가장 친한 친구 OO의 목소리에요”라고 답한다. 보이스프로필은 현재 1명까지 등록할 수 있으며 간단한 대화를 나눌 수 있다.
네이버와 KT는 화자인식 기술의 토대를 마련했으며 커머스 분야까지 확대 적용할 경우를 대비해 보안 기술을 철저히 보완해 서비스 하겠다는 입장이다.
지난 12일 열린 네이버 개발자 행사 ‘데뷰 2018’에서 네이버의 한 개발자는 현재 AI 플랫폼의 클로바 화자 인식 기술을 연구 중이며, 서비스화까지는 시일이 걸린다고 밝혔다.
네이버 관계자는 “화자인식 기술이 서비스로 들어가면 논의해야 할 부분이 많아 하반기까지는 어려울 것 같고, 내년 초를 목표로 하고 있다”며 “커머스까지 확장 적용된다면, 만약 아이들이 생수 주문해달라고 할 경우 주문이 안 들어가게 하는 서비스도 가능하다”고 말했다.
KT는 AI 플랫폼 기가지니에 화자 인식 기술을 접목해 가족 목소리에만 반응하도록 하고 결제까지 가능한 서비스를 구현할 계획이다.
현재 KT IPTV에 적용된 기가지니로 쇼핑하려면 결제 시스템인 엘페이(L.pay)에 핀번호를 입력해야 한다. 리모콘 버튼을 누르거나 말로 입력 가능하다.
기가지니에 화자인식 기술이 도입되면 핀번호를 입력할 필요 없이 사용자의 목소리가 그대로 결제 암호로 사용될 전망이다.
KT 관계자는 “결제시 엘페이 핀번호를 리모콘이나 목소리로 입력해야 했는데, 화자인식 기술이 접목되면 이걸 넘어서서 내 목소리로 결제할 수 있게 된다”며 “결제와 관련해서는 화자 인식을 넘어서 보안과 관련된 화자 인증이 중요하다”고 설명했다.
관련기사
- 미국 가정 24% 스마트 스피커 보유2018.10.16
- 라인프렌즈, 브라운X뱅앤올룹슨 스피커 출시2018.10.16
- AI 스피커 직접 만들고 써보니2018.10.16
- 아마존, 에코 오토 등 AI 스피커 신제품 대거 공개2018.10.16
이어 “목소리를 통한 화자인증이 도입되면 KT가 국내 최초”라면서 “KT는 이를 연내, 늦어도 내년 상반기까지 도입할 계획”이라고 덧붙였다.
SK텔레콤과 삼성전자는 각각의 AI 플랫폼 '누구', '빅스비'를 통해 구현할 화자인식 기술을 보유하고 있으나 언제 서비스화 할지는 미정이라고 밝혔다.