KAIST, 얼굴 감정 표현 보다 생생히 구분 기술 개발

정기훈, 이도헌 교수 공동연구팀...근적외선 라이트필드 카메라와 AI기술 융합

과학입력 :2022/01/07 10:00

KAIST(총장 이광형)는 바이오·뇌공학과 정기훈, 이도헌 교수 공동연구팀이 근적외선 기반 라이트필드 카메라와 인공지능(AI) 기술을 융합해 얼굴의 감정표현을 구분하는 기술을 개발했다고 7일 밝혔다.

라이트필드 카메라는 일반 카메라와 다르게 미세렌즈 배열(Microlens arrays)을 이미지센서 앞에 삽입해 손에 들 수 있을 정도로 작은 크기지만 한 번 촬영으로 빛의 공간 및 방향 정보를 획득한다. 이를 통해 다시점 영상, 디지털 재초점, 3차원 영상 획득 등 다양한 영상 재구성이 가능하고 활용 가능성이 많아 주목받고 있다.

하지만 기존 라이트필드 카메라는 한계가 있다. 실내조명에 따른 그림자와 미세렌즈 사이의 광학 크로스토크(Optical crosstalk)로 이미지 대비도 및 3차원 재구성 정확도가 낮아지는 한계점이 있다. 연구팀은 이런 단점을 해결했다. 라이트필드 카메라에 근적외선 영역의 수직 공진형 표면 발광 레이저(VCSEL) 광원과 근적외선 대역필터를 적용해 기존 라이트필드 카메라가 갖는 조명 환경에 따라 3차원 재구성의 정확도가 낮아지는 문제를 해결했다.

근적외선 기반 라이트필드 카메라의 모식도
근적외선 기반 라이트필드 카메라를 이용해 획득한 표정별 거리 지도 및 주요 3차원 얼굴 특징 이미지.

이를 통해 얼굴 정면 기준 0도, 30도, 60도 각도의 외부 조명에 대해 근적외선 대역필터를 사용한 경우 최대 54%까지 영상 재구성 오류를 줄일 수 있었다고 밝혔다. 또, 가시광선 및 근적외선 영역을 흡수하는 광 흡수층을 미세렌즈 사이에 제작하면서 광학 크로스토크를 최소화해 원시 영상 대비도를 기존 대비 약 2.1배 정도로 획기적으로 향상하는 데 성공했다.

이를 통해 기존 라이트필드 카메라 한계를 극복하고 3차원 표정 영상 재구성에 최적화된 근적외선 기반 라이트필드 카메라(NIR-LFC, NIR-based light-field camera) 개발에 성공했다. 연구팀은 개발한 카메라를 통해 피험자의 다양한 감정표정을 가진 얼굴의 3차원 재구성 이미지를 조명 환경과 관계없이 고품질로 획득할 수 있었다고 설명했다.

획득한 3차원 얼굴 이미지로부터 기계 학습을 통해 성공적으로 표정을 구분할 수 있었고, 분류 결과 정확도는 평균 85% 정도로 2차원 이미지를 이용했을 때보다 통계적으로 유의미하게 높은 정확도를 보였다. 이뿐 아니라 연구팀은 표정에 따른 얼굴의 3차원 거리 정보의 상호의존성을 계산한 결과를 통해, 라이트필드 카메라가 인간이나 기계가 표정을 판독할 때 어떤 정보를 활용하는지에 대한 단서도 제공할 수 있음을 확인했다고 덧붙였다.

관련기사

정기훈 교수는 "연구팀이 개발한 초소형 라이트필드 카메라는 정량적으로 인간 표정과 감정을 분석하기 위한 새로운 플랫폼으로 활용할 수 있을 것으로 기대한다ˮ며 "모바일 헬스케어, 현장 진단, 사회 인지, 인간-기계 상호작용 등의 분야에서 활용할 수 있을 것"이라고 연구 의미를 설명했다.

KAIST 바이오및뇌공학과 배상인 박사과정 졸업생이 주도한 이번 연구 결과는 국제저명학술지 '어드밴스드 인텔리전트 시스템즈(Advanced Intelligent systems)'에 지난해 12월 16일 온라인 게재됐다. (논문명: Machine-Learned Light-Field Camera that Reads Facial expression from High-Contrast and Illumination Invariant 3D Facial Images). 이번 연구는 과학기술정보통신부 및 산업통상자원부의 지원을 받아 수행됐다.

정기훈 KAIST 교수