알파고로 세계를 놀라게 한 구글 딥마인드가 이번엔 사람의 입모양을 읽어내는 인공지능 시스템을 개발했다. 특히 이번에 딥마인드가 내놓은 독순술(입모양 읽는 기술) 전문 인공지능 기술 수준이 사람 전문가보다 훨씬 높은 것으로 알려져 관심을 끌고 있다.
이 기술을 잘 활용할 경우 청각장애인들을 위한 서비스 개발은 물론 음성비서 서비스의 정확도 개선에도 큰 힘이 될 것으로 기대된다.
22일(현지시간) 미국 지디넷은 구글 딥마인드와 영국 옥스퍼드대학교 연구진이 말하는 사람의 입 모양을 통해 언어의 내용을 파악할 수 있는 인공지능 기술을 개발했다고 보도했다.
연구진들은 5000시간 분량의 BBC 방송으로 이 인공지능 시스템을 학습시켰다. 그 결과 법원에서 청각장애인들을 위해 입술 읽기 서비스를 제공하는 전문가들보다 더 정확도 높은 입술 읽기 성과를 보였다.
관련기사
- 솔트룩스, 책 60만권 학습한 국산 AI 서비스 공개2016.11.24
- 구글, 'AI 최강' 야심…캐나다에 연구소 설립2016.11.24
- 범죄자 얼굴형 학습 AI 시스템 논란 불거져2016.11.24
- 인텔 "AI 성능 4년 내 100배로 높일 것"2016.11.24
이들 전문가들에게 200편의 BBC 비디오를 무작위로 보여주고 테스트한 결과 약 4분의 1 정도의 말을 올바르게 해독했다. 반면 AI 시스템에 동일한 조건을 적용한 결과 절반 가량을 정확하게 해석했다.
이 기술은 향후 청각장애인들을 위한 서비스 이외에도 다양한 방식으로 활용될 수 있을 것으로 예상된다. 시리 같은 비서 서비스의 성능을 향상시키는데도 활용될 수 있다. 지금은 주변이 시끄러우면 음성인식이 잘 되지 않는 경우가 많은데 입술 읽기 기술이 적용되면 인식 정확도를 높일 수 있다. 또 무성영화에 더빙을 새로하거나 자막을 입힐 수 있고, 여러사람이 동시에 얘기해 음성이 뒤섞여 내용 파악이 어려울 경우 각자의 말을 정확하게 판독해 내는데도 사용할 수 있을 것으로 기대된다.