11년 만에 변신한 '음성 비서' 알렉사, AI 달고 애플 시리·삼성 빅스비 넘을까

아마존, '알렉사+' 유료 요금제로 운영…생성형 AI 덕에 기술 고도화, 자연어 처리도 거뜬

컴퓨팅입력 :2025/02/27 09:40    수정: 2025/02/27 10:47

생성형 인공지능(AI)을 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 되고 있다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다.

27일 블룸버그통신 등 주요 외신에 따르면 세계 최대 전자상거래 업체 아마존은 지난 26일 뉴욕에서 AI 음성 비서 '알렉사 플러스(+)'를 공개하는 행사를 진행했다. 기존 '알렉사'에 생성형 AI를 탑재한 것으로, 알렉사의 업그레이드는 2014년 출시 후 처음이다.

아마존은 당초 2023년 9월 '알렉사'를 대규모로 개편하겠다는 계획을 발표한 후 지난해 10월 중순께 이를 선보이려고 했으나, 출시 일정이 연기되다 이날 공개했다.  

파노스 파네이 아마존 디바이스 및 서비스 책임자는 "알렉사의 모든 것을 다시 설계했다"며 "여러분의 생활 속 거의 모든 요소를 알고 있다"고 말했다.

아마존 '알렉사+' (사진=아마존 뉴스룸)

새로운 '알렉사+'는 기존에 무료로 제공됐던 것과 달리 오는 3월부터 월 19.99달러의 유료 요금제로 운영된다. 아마존 프라임 회원은 무료로 이용할 수 있다.

기존에는 날씨 등 사용자의 간단한 질문에 음성으로 답하는 것에 그쳤으나, 앞으로는 대규모 언어 모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 된다. 또 콘서트 티켓을 구매하고 식료품을 주문하고 저녁 식사 장소를 알아서 예약하는 등 다양한 작업도 수행할 수 있다.

'알렉사+'는 학습 가이드를 읽고 문제를 내거나 손글씨 문서를 정리해 해당 정보를 기억하는 등 복잡한 작업도 가능하다. 아마존 도어벨인 '링'과 연결해 카메라 녹화 영상도 보여준다.

또 아마존은 '알렉사+'가 주택 소유자 협회 계약서 같은 문서를 검토해 태양광 패널 설치가 가능한지 등을 알려줄 수 있다고 소개했다. 단편적인 요청뿐 아니라 연속적인 요청을 이해·처리할 수 있고 이용자가 직접 개입할 필요가 없는 'AI 에이전트' 기능도 탑재됐다고 설명했다.

'알렉사+'는 아마존 자체 AI 모델 '노바'뿐 아니라 챗GPT 개발사 오픈AI 대항마로 평가되는 앤트로픽의 AI 모델 '클로드' 등 여러 모델을 기반으로 학습했다. 아마존은 앤트로픽에 80억 달러를 투자한 바 있다.

아마존은 자체 개발한 스피커 '에코(Echo)'를 비롯해 자체 스마트홈 기기에 알렉사를 탑재해 기기 판매도 늘리고 이용자들이 쉽게 이용할 수 있도록 할 계획이다.

이에 맞서 삼성전자도 AI 비서 '빅스비'의 활용도를 높이기 위해 지난해 8월 업데이트를 실시했다. 자연어 기반으로 맥락을 이해하는 음성 명령으로 가전 제품을 쉽게 제어할 수 있도록 한 것이다.

이를 통해 ▲한 문장에 여러가지 명령을 담아 말해도 가전제품이 각 의도를 이해할 수 있고 ▲앞의 대화를 기억해 다음 명령까지 연결해 수행할 수 있으며 ▲기기 관련 궁금증과 답변을 말로 묻고 바로 확인할 수 있다.

구글도 같은 해 8월 '메이드 바이 구글 2024'를 통해 자연스러운 대화가 가능한 AI 음성 비서 '제미나이 라이브'를 공개했다. 제미나이 라이브를 활용하면 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택 가능하다.

월 구독료는 19.99달러(약 2만7천원)로, 구글 픽셀폰뿐 아니라 삼성전자 갤럭시폰에서도 이용할 수 있다. 구글은 '아이폰'에도 이를 사용할 수 있도록 지원한다.

애플은 첫 AI폰 '아이폰16' 시리즈에 오픈AI의 'GPT-4o'를 적용한 AI 음성비서 '시리'를 탑재했다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 그러나 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 이전까지 불가능했다. 

다만 '시리'는 현재 성능이 들쭉날쭉하다고 평가받고 있다. 여전히 개인 맞춤형 정보 제공 기능이나 앱 내에서 다양한 작업을 수행하는 기능 등 핵심 기능이 완전히 구현되지 않았다는 것이 중론이다. 이에 애플은 2월 말 베타 버전 출시, 4월 정식 출시를 목표로 했으나 안정성 문제를 해결하기 위한 추가 작업을 해야 하는 탓에 시리의 개편 일정을 5월 이후로 연기할 것으로 알려졌다.

씨넷은 "애플은 '시리'와 새로운 AI 시스템인 '애플 인텔리전스'의 통합 과정에서 엔지니어링 문제와 소프트웨어 버그를 해결하고 있다"며 "이로 인해 출시 일정이 미뤄지고 있다"고 말했다.

아마존 '알렉사+' (사진=아마존 뉴스룸)

AI 음성 비서 시장은 지난해 오픈AI의 GPT-4o 등장 후 크게 변화하고 있다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 이에 걸맞은 답을 할 수 있다.

업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다.

이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다.

관련기사

업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다.

그러면서 "다만 AI 비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.