구글 "청각장애 위한 AI 음성-문자 변환 앱 개발"

앱 다운로드·OS 업데이트 통해 이용 가능

인터넷입력 :2019/03/14 13:43

시끄러운 공간에서 오가는 대화 음성을 문자로 변환해주는 앱 ‘라이브 트랜스크라이브’를 통해 난청 환자, 청각장애인들이 보다 원활한 의사소통이 가능할 전망이다.

구글코리아는 14일 서울 역삼동 구글코리아 회의실에서 구글 본사에 소속된 사가 사블라 인공지능(AI) 리서치 프로덕트 매니저를 화상통화로 연결해 트랜스크라이브에 대해 소개했다.

라이브 트랜스크라이브는 한국어를 포함한 70개 이상의 언어와 방언을 지원한다. 말을 할 수 없거나 음성입력을 원하지 않는 사용자를 위해 키보드를 활용한 양방향 대화도 지원하며, 받아쓰기 정확도를 높이기 위해 외부 마이크를 사용할 수 있다.

사가 사블라 구글 인공지능(AI) 리서치 프로덕트 매니저가 라이브 트랜스크라이브 기술을 시연 중이다.

구글은 이 기술을 개발하기 위해 청각 장애 및 난청 환자를 위한 연구를 진행하는 미국 갈루뎃 대학과 협력했다.

사블라 매니저는 “앞서 구글독스 프로그램에는 조용한 회의실에서 음성을 전사하는 수준의 기능이 포함된 반면, 라이브 트랜스크라이브는 사람이 많은 시끄러운 환경에서 실시간으로 자막을 생성하는 것을 목표로 한다”며 “인터넷이 되는 곳에서 사용할 수 있으나, 인터넷 속도가 느린 공간에서도 작동될 수 있도록 했다”고 설명했다.

이어 “갈루뎃 대학은 이 앱이 청각 장애인의 필요에 맞도록 도움을 줬고, 테스트 참여자들이 사용 후 긍정적인 반응을 보였다”고 덧붙였다.

구글은 여태까지 자동음성인식(ASR)을 기반으로 유튜브 자동 자막, 프레젠테이션, 전화 통화 등을 지원했으나 수차례 업데이트에도 실제 사람이 전사를 매개하는 방식의 서비스 품질에는 미치지 못했다. 그러나 비용이 비싸고 미리 예약한 후 이용할 수 있어 청각 장애인들이 보편적으로 사용하기는 어려웠다.

구글은 컴퓨팅 모델과 사용자 경험 연구를 통해 이번 라이브 트랜스크라이브 기술을 개발했다. 안정적인 서비스를 제공하기 위해 사용자의 데이터 사용량이 과도하게 늘어나지 않도록 했다.

라이브 트랜스크라이브는 지난 2월 구글플레이에서 베타 버전으로 출시됐으며, 외부 앱이 아닌 접근성 설정을 통해서도 이용할 수 있다. 안드로이드 운영체제 기반의 모바일 기기의 경우 최신 운영체제 업데이트 과정에서 기존 빌트인 된 접근성 기능에 라이브 트랜스크라이브 기능이 추가됐다.

관련기사

구글은 카페나 공항 라운지와 같은 소음이 심한 공간에서 대화 음성을 돋궈주는 ‘사운드 앰플리파이어’도 출시했다. 안드로이드 스마트폰에 유선 헤드폰을 연결한 후 앰플리파이어를 이용해 주변 소리를 필터링하거나 증폭시킬 수 있다. 미세한 소리를 크게 만들면서 동시에 큰 소리는 과도하게 키우지 않는다. 주변 소음을 차단하는 기능도 있다. 구글플레이에서 다운로드 할 수 있으며, 안드로이드9(P) 이상의 스마트폰에 지원한다.

사블라 매니저는 “향후 라이브 트랜스크라이브에 온디바이스 인식, 화자 분리, 음성 향상 등을 위한 작업을 계획 중”이라고 밝혔다.