삼성전자가 애플보다 앞서 스마트폰용 음성인식 기술에 한국어를 지원할 전망이다. 한 발 앞서 지원되는 한국어 음성인식 기능이 삼성에게 어떤 이점을 줄 수 있을까.
이달초 삼성은 영국 런던 '모바일언팩' 현장에서 안드로이드 4.0 아이스크림샌드위치(ICS)를 탭재한 갤럭시S3 단말기를 선보였다. 4.8인치 화면, 쿼드코어프로세서, 안드로이드용 플립보드 애플리케이션(이하 '앱')과 음성인식 앱 'S보이스'를 탑재했다.
S보이스는 사용자가 말소리로 갤럭시S3 단말기의 통화, 알람, 사진촬영 기능을 제어할 수 있게 해준다. 휴대폰 절전모드 풀기, 전화 걸기, 메일과 메시지 보내기, 음량 키우거나 줄이기, 일정관리 등이 가능한 자연어 기반 사용자인터페이스(UI)로 묘사된다.
■S보이스-시리 '닮은꼴'
S보이스는 현재 한국어, 영어, 독일어, 스페인어 등 8개국어를 알아듣는다. 지원 언어는 추후 늘어날 예정이다. 우리나라 사용자들은 다음달 국내 출시를 예고한 3G 버전부터 새 단말기에 한국말로 명령을 내릴 수 있게 된다. 사실 이번주초 안드로이드 앱 패키지 파일(APK) 형태로 유출돼 다른 ICS 기반 단말기에서도 S보이스를 써볼 수 있는 것으로 알려졌다.
S보이스는 애플이 앞서 아이폰4S 단말기로 선보인 음성인식 개인비서 앱 '시리'를 연상시킨다. 삼성이 경쟁사를 의식해 차기작에 대항마 성격의 기능을 투입했다는 평가다.
시리와 S보이스는 겉모습뿐아니라 기능적으로 유사성을 보인다. 사용자 음성명령을 듣고 문자를 보내거나 전화를 걸고 일정을 관리할 수 있다. 특정장소나 지역의 날씨, 주가, 시각을 알아보거나 사용자가 있는 곳을 중심으로 상점가 위치정보를 검색해 주기도 한다.
통상적인 정보 검색시 외부 자료를 참조하는 방식도 비슷하다. 지식기반 검색사이트 '울프램알파'를 시리뿐 아니라 S보이스도 활용하는 것으로 알려졌다. 울프램알파는 시리가 루미아900을 최고의 스마트폰이라 알려줄 당시 참조한 검색서비스다. 갤럭시S3에게 같은 질문을 던졌을 때도 경쟁사 단말기를 칭찬할 수 있다는 얘기다.
■차이점은 한국어 지원여부
일단 음성인식에 동원된 기반 기술 공급업체가 서로 다르다. 삼성과 애플 모두 음성인식 인터페이스를 구현하기 위해 직접 기술을 개발한 게 아니라 전문기술을 갖춘 회사와 손을 잡았다. 애플은 음성인식 소프트웨어 업체 뉘앙스(Nuance)커뮤니케이션과, 삼성은 뉘앙스의 경쟁사였던 블링고(Vlingo)와 제휴했다. 공교롭게도 뉘앙스가 블링고를 인수중이다.
국내 사용자들에게 결정적인 차이는 지원 언어다. S보이스는 첫선을 보일 때부터 지원 언어 대상에 한국어를 포함했다. 삼성이 우리나라에 기반을 둔 기업이고 국내 시장 공략에 의지가 크다는 방증으로 풀이된다.
아직 시리는 한국어를 알아듣지 못한다. 다만 아이폰4S 사용자들 사이에선 다음달 6월 세계개발자대회(WWDC)서 나올 것으로 예상되는 iOS6 버전에 추가될 것이란 기대가 높다. 뉘앙스가 최근 음성인식 앱 '드래곤 딕테이션'과 '드래곤 서치' 한국어판을 선보여 가능성을 더했다. 애플도 지원 언어를 다양화할 계획이다. 현재 초기 영어, 불어, 독일어 등부터 최근 추가된 일본어까지 6개국어를 알아듣는다.
■음성처리, 별도 서버-네트워크 필수
애플은 뉘앙스 기술에 자연어 의미를 이해하는 언어처리와 인공지능 계층을 더해 시리를 만들었다. 이 계층은 애플이 별도 구축한 시스템에 있기 때문에 데이터통신이 가능해야 시리가 작동된다. 즉 시리에 내린 음성 명령은 항상 애플 서버를 거쳐 돌아온다.
삼성도 블링고 음성인식 기능을 구현할 때 사용자가 내린 음성 명령을 직접 구축한 시스템으로 가져온다. 해당 단말기에 동작하라는 신호를 보내는 것은 회사측 서버란 얘기다. 언어를 처리하려면 방대한 처리엔진을 언어별로 갖고 있어야 하는데 이는 단말기 자체의 성능으로 구현하기 어렵기 때문이다.
관련기사
- 갤럭시S3 전용 '삼성판 시리' 앱 유출2012.05.24
- 애플 시리 "최고 스마트폰은 루미아900"2012.05.24
- 삼성 ‘갤럭시S3’ 공개… 이렇게 생겼어?2012.05.24
- 아이폰4S 시리, 어떻게 생겼을까?2012.05.24
애플이든 삼성이든 언어별 명령을 처리 규칙들을 구축하고 발전시키는 구조를 취할 것으로 보인다. 서버에 탑재된 언어 처리엔진 정확성, 단어나 명령어 인식력을 높이려면 특정 언어 사용자가 어떤 방식으로 말하고 발음하는지 많은 관찰과 분석을 수행해야 한다. 이런 노하우 축적이 경쟁사와의 차별점으로 연결된다.
갤럭시S3 정식 출시를 앞두고 유출된 S보이스 앱은 타사 안드로이드 ICS 환경을 통해서 한국어 사용자를 위한 처리엔진 업그레이드를 도와줄 것으로 예상된다. 삼성이 애플보다 앞서 한국어 음성인식을 지원함으로써 더 나은 한국어 처리 성능을 얻기 위한 발판을 마련한 셈이라 볼 수도 있다. 삼성측이 갤럭시S3 단말기 출시 이후, 유출된 S보이스 앱에 대한 사용을 차단할 것인지 지켜볼 일이다.