마인즈랩, 시각 분야 AI 연구성과 국제학술지 'PRL' 게재

컴퓨팅입력 :2022/04/22 17:59

마인즈랩은 차성국 연구원의 논문이 국제 패턴 인식 협회의 학술지인 ‘패턴인식저널(PRL)’에 채택되어 실리게 되었다고 22일 밝혔다.

이미 지난해 9월과 12월 세계 최고 권위의 인공지능 음성신호 처리학회인 ‘인터스피치 2021’과 ‘뉴립스 워크샵 창의성과 디자인을 위한 기계학습 2021’에 논문이 실린 데 이어 올해 또다시 SCIE급의 세계적인 학술지에 논문이 채택된 것이다.

이번 논문은 학습한 적 없는 사물도 인식하는 제로샷 세그멘테이션 연구로, 고가의 라벨링 비용 문제를 해결할 수 있는 획기적인 접근법을 제안한다.

객체 분리 작업 이미지(이미지=마인즈랩)

차성국 연구원에 따르면 본 연구는 멀티모델(vision+NLP) 개념이 유행하기 전인 2020년에 진행한 것으로, 현재는 휴먼 오브젝스 인터렉션(HOI)까지 연구가 진행중이라는 설명이다.

지난 학술 성과들이 음성 분야의 인공지능 엔진과 관련된 것이었으나 이번 논문은 시각 엔진 분야로, 마인즈랩 연구진이 다양한 영역에서 연구성과를 올리고 있다는 소식이다.

PRL은 국제 패턴 인식 협회에서 발행하는 학술지다. 관련자들에 의하면 최근 이슈가 되고 있는 시각 분야의 인공지능 관련 논문이 선정된 것은 의미가 크다는 평가다.

머신러닝/딥러닝을 이용한 시각 인식은 빅데이터와 연산을 기반으로 최근 폭발적인 발전이 있는 연구 분야로 기존의 접근 방법들은 사물을 인식하기 위해 반드시 많은 데이터 학습이 필요했으나제로샷 러닝은 학습이 없이 새로운 사물을 인식한다.

본 연구는 자연어 모델에서 사물에 대한 지식을 힌트로 사용하는 기존의 접근법의 보편화 한계를 비판하며, 그 대안으로 자연어 모델의 지식 대신 시각 모델의 지식을 사용하는 SM-VCENet을 제안한다.

또한 보편화성능을 측정할 수 있는 새로운 벤치마크 PASCAL2COCO를 제안한다. SM-VCENet은 제로샷 시멘틱 세그멘테이션 벤치마크인 PASCAL-5i에서 많은 차이로 최고 점수를 갱신했으며, PASCAL2COCO 벤치마크를 통해 보편화-견고함을 보였다.

관련기사

논문은 아카이브(https://arxiv.org/abs/2111.15181)에서 볼 수 있다.

마인즈랩은 자체 개발한 글로벌 최고 SoTA(State of The Art) 수준의 AI 엔진 40여개와 외부 엔진까지 조합이 가능한 AI 응용프로그램 인터페이스 커넥터(API connector)인 '마음오케스트라' 플랫폼을 통해 고객 맞춤형 AI 고객 상담원, AI 돌보미, AI 경비원, AI 속기사 등의 인공인간을 제작, 공급하고 있다.