카메라 한 대로 3차원 공간 학습하는 AI 기술 개발

KENTECH 이석주 교수팀, 다중 인공신경망 통합 학습 알고리즘 설계

디지털경제입력 :2022/08/10 18:53

한국에너지공과대학교(KENTECH·총장 윤의준) 이석주 교수 연구팀이 자율주행의 핵심 기술 중 하나인 동적 물체의 3차원 시각인지를 위한 인공지능(AI) 학습 알고리즘 개발에 성공했다고 10일 밝혔다.

이석주 교수 연구팀은 한쪽 눈만 보여도 운전면허 취득이 가능하다는 점에서 영감을 얻어 복잡한 동적 환경에서 인간이 3차원 정보를 인지할 때 활용하는 객체에 대한 사전지식에 초점을 맞춰 기술을 개발했다고 설명했다.

깊이 지도 및 물체의 움직임에 대한 추론 결과

이를테면 사람은 일반적으로 보행자보다 자동차가 빠르게 움직일 것이고, 승용차는 버스 보다 높이가 낮기 때문에 영상에서 이 둘의 높이가 같다면 버스가 더 멀리 위치할 것이고, 차량 움직임은 회전보다 직진 비중이 높을 것 등을 이미 인지하고 있다는 점에 착안했다.

연구팀은 “이같은 객체 정보는 다양한 물체 인지 태스크들이 유기적으로 맞물려 동시에 효과적으로 학습되도록 AI 모델 간 윤활유 역할을 한다”고 전했다.

연구팀은 깊이 지도 생성, 카메라의 움직임 추정, 동적 물체의 움직임 추정을 위한 세 가지 신경망을 제안하고, 이들을 동시에 학습하기 위해 객체에 대한 사전지식을 통한 새로운 자기지도 학습 메커니즘을 설계했다.

낮은 수준과 높은 수준의 다양한 객체 정보를 사람처럼 해석할 수 있도록 알고리즘들을 개발하고 이들을 인공지능 학습기에 통합했다.

차원 공간 및 움직이는 물체에 대한 추론을 위해 제안된 다중 심층신경망 구조.

연구팀은 단안 카메라 학습에 대한 깊이 지도와 움직임 추정 태스크에서 기존의 인식 성능을 뛰어넘었고, 다양한 동적 주행 환경에서도 일관적으로 우수한 성능을 보였다고 설명했다.

이석주 교수는 “단일 태스크만 학습하는 기존 AI 모델은 한계가 있기 때문에 서로 다른 목적을 가진 AI 모델들이 유기적으로 학습될 때 새로운 가치가 창출될 것”이라며 “이 연구를 기점으로 향후 AI 기술의 방향을 제시할 연구에 기여할 것”이라고 말했다.

연구팀은 개발된 알고리즘을 활용하면 기존 영상 기반 3차원 인식 시스템의 약점을 보완할 수 있고, 다양한 로봇과 AI 분야에 광범위하게 응용될 수 있을 것으로 기대했다.

이번 연구에는 KENTECH 에너지공학부 이석주 교수가 주 저자로 참여하고, KAIST 권인소 교수, 프랑소와 라뮤 연구교수, 대구경북과학기술원(DGIST) 임성훈 교수가 함께 참여했다.

관련기사

이 연구성과는 독일과 영국에서 설립된 Springer Nature 출판사의 국제학술지 International Journal of Computer Vision에 온라인으로 7월 19일 실렸다. 논문명은 Self-Supervised Monocular Depth and Motion Learning in Dynamic Scenes: Semantic Prior to Rescue이다.

한편, 이번 연구는 KENTECH과 KAIST, DGIST 지원으로 수행됐다.