클라우드로 구현된 소리글자 '한글'

일반입력 :2010/06/16 18:11

이설영 기자

구글이 모바일 음성검색을 한국어로 지원한다고 16일 발표했다. 제조사와 협의할 부분이 있어 아직 실제로 출시하지는 않은 상황. 향후 애플 아이폰에서도 가능할 전망이다.

구글 음성검색은 2008년 영어를 시작으로 2009년 중국어와 일본어 서비스를 선보였으며, 6월초에 프랑스어, 이탈리아어, 독일어, 스페인어가 나왔다. 한국어는 8번째 서비스이다.

영어의 경우 지난 수년간 음성 인식 관련 연구가 진행됐다. 한국어는 영어만큼 보편적이지 않은 것이 사실. 그러나 한국어 음성 인식 또한 기본적으로는 타언어 인식 시스템과 방법론적으로 유사하다는 것이 구글 측 설명이다.

마이크 슈스터 구글 음성인식 총괄연구원은 현재 한국어 음성인식 기술을 통해 20만개 이상의 단어를 인식할 수 있고, 이들을 조합하면 다양한 자연어 검색이 가능하다면서 한글이 세계적인 소리음자이기 때문에 맵핑 작업에 도움이 많이 됐다고 말했다.

구글 음성검색 시스템은 ▲다양한 통계학 모델 ▲발음과 관련한 음성학 모델 ▲단어와 어구 등의 언어 모델 ▲각 단어의 발음 원칙을 담은 사전을 학습하는 원리로 구성된다.

우선 음성학 모델 학습을 위해 구글은 한국어 연설문 녹취와 해당 녹취서를 다량으로 활용했다. 구글 측에 따르면 100시간이 넘는 분량이다. 언어모델은 한국어 검색 쿼리를 이용해 학습했다.

이렇게 훈련된 시스템에 음성 검색을 입력하면 가장 연관성 높은 검색어 문가가 해당 검색어의 검색 결과 화면과 함께 제시되는 방식이다.

한국어 음성검색을 구현하면서 직면해야 했던 어려움도 있다.

영어의 경우 낱말과 발음간 대응을 보여주는 사전이 시중에 많은 반면 한국어는 상대적으로 그렇지 못한 것. 따라서 수십만 개의 단어에 대한 발음 맵핑을 새로 만들어야 했다. 앞서 밝혔듯 소리글자인 한글의 구조가 이 작업 과정을 보다 손쉽게 만들어줬다.

예외적인 발음 규칙도 존재한다. 예를 들어 '2010'을 '이천십'이 아닌 '이공일공'으로 읽거나 'MP3'를 '엠피삼'이 아닌 '엠피쓰리'로 읽는 것들이 바로 그런 예. 이런 발음들은 즉각 파악할 수 없다는 어려움이 있었다.

음성인식 기술은 보통 검색 화면에 많이 등장하는 검색어에 능하다. 도시명, 가게, 주소, 잘 알려진 약어나 제품 모델명, '김연아'와 같은 유명인사가 그런 예가 될 수 있다. 그러나 일반인 이름처럼 검색에서 잘 쓰지 않는 고유명사의 경우 인식률이 떨어진다. 구글은 이런 부분에 대해서는 지속적으로 개선작업을 한다고 밝혔다.

관련기사

인식률이 떨어지는 경우는 대부분 충분한 데이터를 통해 훈련되지 않았기 때문이다. 이에 따라 다른 언어와 마찬가지로 한국어도 구글 클라우드 컴퓨팅 환경을 통해 더 많은 데이터를 지속적으로 추출하고, 이를 통해 지속적으로 성능이 개선될 것으로 기대된다.

한편 구글 모바일 음성검색의 경우 안드로이드 운영체제는 1.6 이상 버전부터 이용 가능하다. 그러나 제조사와의 협의가 필요한 부분이라 정확한 출시일은 알 수 없다. 아이폰에서도 앱스토어에 올라와 있는 '구글 모바일 애플리케이션'을 통해 지원 예정이며, 아이폰의 경우 실제 구현까지 시간이 조금 더 소요될 것으로 보인다.