KAIST(총장 신성철)는 신소재공학과 이건재 교수와 왕희승 박사팀이 '공진형 유연 압전 음성 센서'를 개발해 정확도가 높은 초고감도의 인공지능 기반 화자(話者) 식별 및 음성 보안기술을 구현, 이를 스마트폰과 인공지능 스피커에 탑재, 제품화에도 성공했다고 15일 밝혔다.
앞서 2018년 이건재 교수팀은 세계 최초로 공진형 유연 압전 음성 센서 개념을 제시한 바 있다. 이번 연구에서는 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝히고 크기를 매우 소형화함과 동시에 성능이 향상된 음성 센서를 개발했다.
공진은 특정 주파수 영역에서 센서가 큰 진폭으로 진동하는 걸 말한다. 압전은 압력을 가했을 때 전기 신호가 자발적으로 생성되는 현상이다. 음성으로 센서 막이 진동할 때 공진 현상이 일어나 민감도 높은 전압 신호를 얻을 수 있다.
인간이 먼 거리의 소리를 인식하는 것은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 수많은 공진 현상을 발생, 소리를 증폭하는 원리다. 연구진은 이런 원리 효과를 극대화하기 위해 매우 얇은 유연 압전 막을 사용해 사람 귀를 모사했고, 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 제작했다.
KAIST는 "유연 압전 음성 센서는 원거리에서 스마트 기기들을 정확하게 제어하는 미래 사물인터넷 기술과 음성을 암호화하는 보안기술을 연결, 소비자 맞춤형 서비스 제공에 크게 이바지할 것으로 기대한다"고 밝혔다.
생체 모사된 공진형 음성 센서는 신호 대 잡음비(Signal to noise ratio, SNR)가 우수해 음성인식 기능이 뛰어나고 다수 채널을 보유하기 때문에 인공지능 음성 서비스에 적은 데이터양으로도 화자 식별 정확도를 높이는 강점이 있다고 KAIST는 설명했다.
KAIST 연구팀이 제작한 음성 센서는 같은 조건에서 정전용량형 상용 마이크로폰과 성능 비교를 진행한 결과, 음성 분석 및 화자 식별에 인식률을 크게 높였고 조건에 따라 오류율을 60%에서 95%까지 줄일 수 있었다.
연구팀이 개발한 시제품은 이 교수가 교원 창업한 기업인 프로닉스를 통해 2020년 세계 가전박람회(CES)에서 공개된 바 있고, 현재 이 기술은 완성도 높은 인공지능 음성 기술을 시연하며 프로닉스 미국 지사를 통해 실리콘밸리 유수 IT 기업과 협업도 추진하고 있다.
관련기사
- KAIST, 16일 개교 50주년···과기 인재 6만9388명 배출2021.02.14
- KAIST, 고감도 단백질 센서 제작 플랫폼 개발2021.02.05
- KAIST, 해상도 높인 초박형 4D 카메라개발2021.02.04
- 가상자산, 미국은 변하는 데 한국은 왜 안 바뀌나2024.11.25
이건재 교수는 "이번에 제품화한 모바일 음성 센서는 높은 민감도를 보유하면서도 크기를 획기적으로 줄였기 때문에 미래 인공지능기술을 구동하는 핵심 센서로 적용할 수 있다"면서 "현재 대량생산 공정도 완성 단계에 있어 실생활에 곧 적용할 수 있을 것"이라고 말했다.
이번 연구는 한국연구재단의 휴먼플러스 인공지능 센서 센터 지원을 받아 수행됐고, 국제 학술지 '사이언스 어드밴시스(Science Advances)'에 2월 12일자에 게재됐다.