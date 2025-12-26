AI 세이프티 스타트업 에임인텔리전스(AIM Intelligence, 대표 유상윤)가 LG전자 및 미국 로봇OS 기업 오픈마인드(OpenMind)와 추진 중인 ‘피지컬 AI 세이프티(Physical AI Safety)’ 협력의 첫 성과로 ‘Video2Robot(비디오투로봇)’ 파이프라인을 공개했다고 26일 밝혔다.

이번 프로젝트는 에임인텔리전스가 LG전자, 오픈마인드와 진행 중인 공동 연구의 첫 공개 사례다. 3사는 로봇이 실제 환경에서 겪을 수 있는 위험을 시뮬레이션 단계에서 검증, 안전성을 구조적으로 높이는 것을 목표로 협력하고 있다.

이번에 선보인 오픈소스 파이프라인 ‘Video2Robot’은 영상 속 인간의 동작을 로봇 학습 데이터로 변환하는 엔진이다. ▲인간과 근접 상호작용 ▲급경사 미끄러짐 ▲고하중 물체 조작 시의 균형 붕괴 등 현실에서 직접 연출하기 어려운 시나리오를 생성형 AI(Veo, Sora 등)를 활용해 로봇 모션 데이터로 안전하게 변환한다. 이를 통해 로봇 안전 문제를 사후 대응이 아닌, ‘사전 학습(Preemptive Learning)’의 영역으로 끌어올렸다.

에임인텔리전스가 LG전자·오픈마인드와 ‘피지컬 AI 세이프티’ 분야 협력의 첫 결실 이미지(제공=에임인텔리전스)

특히 ‘Video2Robot’은 기존 로봇 학습 과정에서 낙상, 충돌 등 위험한 시나리오의 데이터를 수집하는 데 한계가 있던 점을 극복했다. 고가의 장비 파손 우려와 안전 문제로 실제 환경에서의 반복 촬영이 불가능했지만, Video2Robot을 활용하면 넘어지고 부딪히는 데이터를 직접 찍지 않고도 얻어낼 수 있다. 이를 통해 로봇이 실제 환경에서 마주할 수 있는 고위험 상황을 사전에 학습하고 검증하는 새로운 접근법을 개발했다는 설명이다.

에임인텔리전스의 ‘Video2Robot’이 공개되자마자 글로벌 테크 커뮤니티의 반응도 호의적이다. 지난 23일 기준 X(구 트위터)와 링크드인 합산 조회수만 20만 회를 넘어섰고, 깃허브(GitHub) 스타(Star) 수도 400개를 돌파했다. 단순 기술 데모를 넘어 로봇에게 ‘실패’를 가르치는 등 피지컬 AI 안전에 대한 업계의 공감대를 형성했다는 평가다.

에임인텔리전스는 그동안 텍스트, 오디오, 비디오 등 다양한 모달리티를 아우르는 멀티모달(Multimodal) AI safety 연구를 수행해 왔다. 이번 ‘Video2Robot’은 축적한 멀티모달 연구 역량을 가상 공간이 아닌 물리적 세계(Physical World)의 안전 문제로 확장했다는 점에서 의미가 크다는 설명이다. 에임인텔리전스는 로봇이 현실 세계에서 안전하게 작동할 수 있도록 학습 구조 단계부터 안전성을 설계하는 것을 목표로 하고 있다.

에임인텔리전스 권태윤 연구원은 “Video2Robot은 단순한 도구가 아닌 피지컬 AI 세이프티를 향한 첫걸음”이라며 "앞으로 로봇이 실제 환경에서 마주할 다양한 돌발 상황을 선제적으로 학습하고 대비하는 ‘피지컬 AI 세이프티 프레임워크’를 구축해 나갈 것”이라고 밝혔다.