사투리도 인식하는 갤S4 개발 비밀

일반입력 :2013/06/15 22:09    수정: 2013/06/17 14:03

정현정 기자

‘뭐라카노’라고 말했더니 ‘What did you say’라고 통역이 된다?

음성인식 기술의 진화가 놀랍다. 최근 출시된 삼성전자 갤럭시S4에는 사투리 표현도 영어로 번역해 줄 정도로 인식률이 향상됐다. 그 뒤에는 개발팀에 남다른 노고가 있었다. 음성인식 기능은 얼마나 많은 데이터베이스(DB)를 축적하느냐에 따라 인식률이 결정되는 만큼 다양한 어휘와 표현에 대한 샘플수집과 반복적인 실험이 수반됐다.

14일 삼성전자에 따르면 갤럭시S4의 음성인식 기능인 ‘S보이스’에는 전작인 갤럭시S3 대비 향상된 엔진이 적용됐다. 또 새로운 음성인식 기능인 S트랜슬레이터와 S보이스드라이브가 추가됐고 인식률과 답변의 정확도 측면에서도 많은 개선이 이뤄졌다. 삼성전자는 S보이스 기능의 인식률을 높이기 위해 다수의 전담 인력을 배치해 수개월 간의 개발과정을 거쳤다.

S보이스는 네트워크를 기반으로 작동된다. 음성을 입력하면 데이터를 분석해서 서버에 저장된 데이터베이스와 매칭을 하는 방식이다. 때문에 얼마나 많은 데이터베이스를 축적했는지가 인식률을 결정하는 척도가 된다. 다른 기능 개발과 달리 단순히 알고리즘 개발 외에도 실제 샘플수집과 반복적인 테스트가 필수적인 이유다. 삼성전자는 인식률과 정확도를 높이기 위해 매주 수천 문장을 기준으로 수개월 동안 성능 향상 과정을 거쳤다. 이 과정에서 사소한 문제점이라고 발견되면 지속적으로 개선작업을 진행했다.

삼성전자 관계자는 “고유명사·지명·신조어·숫자 등 성능이 부족했던 부분을 다양한 테스트를 통해 확인하고 추가 데이터베이스 등을 확보해 개선 작업을 진행했다”면서 “특별히 갤럭시S4는 국가별로 다양한 테스트를 통해 기능과 성능, 사용성이 극대화 되도록 출시 전까지 지속적인 개선작업을 진행했다”고 설명했다.

음성인식 기능의 특성상 대화 과정에서 다양한 억양과 어휘가 등장하는 등 여러 변수가 존재한다. 지역별로 다양한 사투리 역시 변수 중 하나다. 지난달 본지가 갤럭시S4의 S트랜슬레이터 기능을 이용해 사투리 문장 인식 여부에 대한 실험을 진행한 결과 (본지 보도 사투리 알아듣는 갤S4 “그게 참말이여?” 참고) 간단한 사투리 문장을 인식하고 이를 의미가 통하는 영어로 번역해주는 것으로 확인됐다. 예를 들어, ‘내 그거는 몬한다’는 ‘I am poor at that’, ‘밥뭇나’는 ‘Did you have a meal’로 변환되는 식이다.

이를 위해 삼성전자는 지역마다 다른 사투리 인식률을 높이기 위해 각 지역 출신 인력을 총동원해 지역별 표현을 수집하고 이에 대한 반복적인 테스트를 진행했다. 대화체 형식의 경우 어떤 문장이 들어올지 예측하기 힘들기 때문에 개발 초기부터 신조어와 각 지역별 사투리를 수집해 인식하지 못하는 부분이 없도록 했다.

삼성전자 관계자는 “사투리도 번역의 일부분으로 보고 각 지역의 사투리를 수집해서 표준어로 변경하는 작업을 거친다”면서 “음성인식의 경우 초기 대비 다양한 지역의 사용자들이 증가됨에 따라 여러 지역의 억양 데이터베이스를 중심으로 재훈련해 성능이 지속 개선되도록 했다”고 말했다.

삼성전자는 S보이스에 적용된 향상된 동일한 음성인식 엔진을 S트랜슬레이터에도 적용해 통·번역 뿐 아니라 인식 성능 향상에도 노력을 기울였다. 여기에 통·번역 기능을 구현하기 위해 각 언어별로 번역된 수많은 문장들을 수집하고 국가별로 전담 테스트 인력을 투입해 성능을 개선했다.

삼성전자 관계자는 “동양어와 영어는 문법 구조가 다르기 때문에 동양어를 중점으로 통번역 기능을 구현했다”면서 “동양어 중에서도 한글은 문법 형태에 맞지 않아도 뜻이 이해되므로 특히 한국어에 중점을 두고 번역 기능을 개발했다”고 설명했다.

기본적인 기능 제어를 위한 명령어 인식 외에도 음성인식 기능은 사용자에 짖궂은 질문에 재치있는 답변으로 화제가 되기도 했다. 최근 외신 보도에 따르면 S보이스 역시 “애플을 좋아하느냐”, “아이폰을 사용해본적이 있느냐?”는 질문에 “No, I have standards”라고 대답해서 화제가 되기도 했다.

삼성전자 관계자는 “해당 기능은 스마트폰 제어를 위한 명령어 이외의 문장에 대해서도 친근하고 재미있는 답변을 주기 위해 개발된 기능”이라면서 “가상 비서에 대해 어떤 질문을 할지 많은 사람들로부터 질문을 확보하고 그에 대한 답변을 삼성전자의 이미지를 고려해 작가진이 답변을 작성했다”고 설명했다. 국가별로 이슈가 있는 질문에 대해서는 지속적으로 업데이트가 되고 있다.

관련기사

삼성전자는 음성을 통한 스마트폰 제어 기능의 편의성을 향상시키기 위해 기술개발을 지속 진행 중이다. 특히 S보이스는 논터치(Non-touch) 콘셉트로 터치없이 음성만으로 스마트폰 주요 기능을 제어할 수 있도록 한 점이 특징이다. ‘하이 갤럭시’라고 말하면 S보이스가 실행되며 이를 통해 통화나 메시지 등 터치없이 동작 수행이 가능하다. 전화 수신, 카메라 동작, 음악재생 제어 등 스마트폰 제어 기능도 강화됐다. 차량에 특화된 S보이스드라이브 등 기능에서는 아이즈프리(Eyes Free)를 목표로 화면을 보지 않고도 음성으로 동작할 수 있도록 했다.

삼성전자 관계자는 “차기 제품을 위해 음성인식 기능 업그레이드를 진행하면서 기본적인 성능 극대화하는데 주안점을 두고 있다”면서 “특히 웨어러블 기기들의 등장으로 음성 인터페이스의 중요성이 커지고 있는 만큼 다양한 잡음환경에서의 성능 향상과 스마트폰 제어 편의성 향상, 멀티모드를 적용한 사용성 향상 등 사용자들에게 새로운 가치를 줄 수 있는 음성인식 개발을 위해 노력 중”이라고 밝혔다.