사진 한 장으로 초실사 AI 아바타 만든다…ETRI, 차세대 인터랙션 기술 개발

자율주행차·디지털 휴먼 시장 겨냥…향후 키오스크·은행·광고 영역 확산 전망

컴퓨팅입력 :2025/04/15 15:48

단 한 장의 인물 사진만으로 실제 사람처럼 자연스럽게 말하는 기술이 개발돼 업계의 주목을 받고 있다.

한국전자통신연구원(ETRI)은 초실사 인공지능(AI) 아바타 생성 기술을 개발했다고 15일 밝혔다.

해당 기술은 완전 자율주행 시대를 대비해 차량과 사람 간의 직관적인 상호작용을 가능케 하는 차세대 인터페이스로 주목받고 있다. 향후 디지털 휴먼 산업 전반으로의 확산도 전망된다.

ETRI 연구진이 실사 인물 발화 영상 생성 프레임워크 기술에 대해 논의하는 모습 (사진=ETRI)

기존 음성 기반의 AI 비서나 내비게이션 시스템이 단순한 명령 수행에 그쳤다면, ETRI의 초실사 AI 아바타는 정교한 표정과 입 모양 표현을 통해 실제 사람과 같은 자연스러운 대화가 가능하다.

이를 통해 차량 내 AI 운전기사가 운전자와 대화하거나 보행자와 소통하는 등 더욱 인간 친화적인 사용자 경험을 제공할 수 있다.

이번 기술의 핵심은 기존 생성형 AI와 달리 입술·턱 등 발화와 직접 연관된 부위를 선별적으로 학습·합성하는 독자 알고리즘이다.

이같은 방식을 통해 불필요한 정보 학습을 줄이는 한편 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교하게 구현할 수 있게 됐다.

ETRI는 이 기술이 CVPR와 AAAI 등 국제 주요 학술대회 발표 기술들보다도 합성 화질과 입술 동기화 성능 면에서 우수한 성능을 입증했다는 설명했다.

ETRI는 이번에 개발한 기술이 자율주행차 외에도 ▲키오스크 ▲은행 창구 ▲뉴스 진행 ▲광고 모델 등 다양한 산업 분야에서 활용될 수 있으며 AI 기반 디지털 휴먼 산업의 혁신을 견인할 것으로 기대하고 있다.

이번 기술은 현재 ETRI 기술 이전 사이트 내 '실사 인물 발화 영상 생성 프레임워크 기술'로 등록돼 있다.

ETRI 모빌리티UX연구실은 현재 사람과 기계 간 상호작용(HMI) 기술을 중점적으로 연구하고 있으며 운전자와 보행자의 감정·피로도·집중 상태 등을 분석하는 AI 기반 운전자 인터페이스 기술도 함께 개발하고 있다.

연구진은 다양한 산업 분야에서의 상용화를 위한 기술이전과 사업화 전략도 적극 추진할 계획이다.

관련기사

윤대섭 모빌리티UX연구실장은 "모빌리티 기술이 고도화될수록 노인이나 사회적 약자들이 소외될 수 있다"며 "이번 AI 아바타 기술이 디지털 리터러시 향상에 기여하고 모두가 쉽게 이용할 수 있는 스마트 모빌리티 서비스로 발전하길 기대한다"고 밝혔다.

연구책임자인 최대웅 선임연구원은 "AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직이는 생성형 AI 기술을 한층 고도화할 계획"이라며 "향후 주문·상담 등 일부 인력을 대체할 수 있을 정도의 상호작용 구현을 목표로 하고 있다"고 말했다.