마음AI "로봇·자율주행 시장 혁신"···'워브' AI 선보여

31일 판교 사옥서 컨퍼런스 열고 공개..."텍스트와 영상 처리 멀티모달 파운데이션"

컴퓨팅입력 :2023/11/01 08:15

인공지능(AI) 전문회사 마음AI(대표 유태준)가 31일 서울 판교 사옥에서 컨퍼런스를 열고 회사가 자체 개발한 멀티모달 파운데이션 모델 '워브(WoRV, World model for Robotics and Vehicle control)'를 공개했다.

마음AI는 '워브'에 대해 "완전 자율주행과 범용 로봇 제어를 위한 앤드투앤드 멀티모달 파운데이션 모델(Foundation model)"이라고 밝혔다. '워브'는 차량이나 로봇에 달린 카메라를 통해 실시간으로 들어오는 영상을 언어적으로 이해해 상황을 분석하고 그에 맞는 작업계획을 수립, 적절한 제어 명령을 내릴 수 있다. 디바이스 처음부터 끝까지(엔드 투 엔드, end-to-end)를 커버하며 텍스트는 물론 영상(멀티모달)도 처리하는 파운데이션 AI 모델이라는 것이다.

많은 양을 학습한 거대AI인 파운데이션 모델의 트렌드는 자연어에 이어 이미지 모달(Image multi-modal)로 이어지고 있다. LG AI연구원과 오픈AI 등도 이미 멀티모달 AI를 선보인 바 있다. 이미지 모달에 이어 동영상도 커버하는 비디오 파운데이션 모델로 발전할 전망이다.

마음AI가 선보인 파운데이션 모델 기반의 '워브'는 시뮬레이션을 기반으로 자율주행을 학습한다. 도로에 갑작스럽게 사람이 침입한 것을 확인하고 즉각 반응해 정지하며, 사람은 놓치기 쉬운 사각지대의 영상(left, right view)도 보고 즉각적으로 판단해 사고를 피할 수 있다고 회사는 설명했다. 또 완전히 범용적인 멀티 모달(Multi-modal), 멀티 태스크(Multi-task) 인공신경망을 자체 설계, 다양한 업무(task)의 오픈데이터셋 및 재가공 데이터셋을 활용해 '워브'를 개발했다고 설명했다.

유태준 마음AI 대표는 "우리가 자체 설계한 인공신경망은 이미지, 비디오, 텍스트, 위치(로케이션) 등 복수의 데이터 포맷(Data format)을 한번에 학습해 하나의 모델로 다양한 업무가 가능하다"면서 "시각 정보를 언어적으로 이해하는 파운데이션 모델 기반 로봇과 자율주행 기술인 WoRV는 새로운 인공지능 시대를 여는 체인저가 될 것으로 예상한다"고 강조했다. 이어 유 대표는 "마음AI는 이 기술을 통해 현재 로보틱스와 자율주행 시장에서 해결하기 어려운 문제들을 극복함으로써 최소 400조 이상으로 추정되는 범용 서비스 로봇과 완전 자율주행 시장의 주요 플레이어로 자리매김할 수 있을 것으로 기대한다"고 덧붙였다.