구글 딥마인드가 인공지능(AI)이 현실 세계에서 사람처럼 추론·행동할 수 있게 돕는 로보틱스 모델을 발표했다.
구글 딥마인드는 차세대 AI 로봇 개발을 위한 '제미나이 로보틱스'와 '제미나이 로보틱스-ER'을 공개했다고 13일 공식 블로그를 통해 밝혔다. 해당 모델은 '제미나이 2.0' 기반으로 작동한다.
제미나이 로보틱스는 비전-언어-행동(VLA) 모델이다. AI가 눈으로 보고, 언어를 이해하고, 행동으로 옮길 수 있도록 설계된 모델이다. 단순히 텍스트나 이미지로만 정보를 처리하는 것이 아니라 직접 로봇을 제어해 움직이게 만드는 기능까지 갖췄다.

제미나이 로보틱스는 로봇 플랫폼에 적용 가능하도록 설계됐다. 현재 '알로하 2' 쌍팔 로봇 플랫폼 데이터로 훈련된 상태다. 학술 연구실에서 사용하는 프랑카 기반 로봇 제어도 가능하다. 특히 앱트로닉과 협력해 휴머노이드 로봇 '아폴로' 개발도 착수했다.
딥마인드는 "제미나이 로보틱스는 인간처럼 일반성과 상호작용성, 기민성을 갖췄다"며 "이전에 경험하지 못한 작업과 환경에서도 스스로 적응해 문제를 해결할 수 있으며, 다양한 자연어 명령을 이해하고 이에 따라 행동을 조정한다"고 강조했다. 또 "정교한 조작 능력으로 복잡한 다단계 작업도 처리할 수 있다"고 덧붙였다.

제미나이 로보틱스-ER은 제미나이 로보틱스 기능에 공간 이해력을 강화한 모델이다. 로봇이 주변 환경을 더 잘 이해하고 어떻게 움직여야 안전하고 효율적으로 작업을 할 수 있을지 스스로 판단할 수 있게 설계됐다.
관련기사
- 구글, AI 전략 본격화…지메일도 '제미나이' 손길 닿는다2025.03.11
- 워크데이 "AI 에이전트도 직원처럼 관리받자"…韓 금융권 도입 검토2025.03.13
- 팀뷰어, 여성 레이싱 지원 확대...F1 아카데미와 맞손2025.03.12
- 구글, AI 팀 통합했다…'딥마인드'로 이관2025.01.13
이를 통해 인식과 상태 추정, 공간 이해, 계획 수립, 코드 생성까지 한 번에 처리할 수 있다. 복잡한 물체를 인식해 적절한 조작 방법을 제시도 가능하다. 소수 인간 시범만으로도 해결책을 도출할 수 있다. 엔드투엔드 테스트에서 기존 모델 대비 2~3배 높은 성공률을 기록했다.

딥마인드는 "AI가 현실 세계에서 실질적인 도움을 주기 위해서는 체화된 추론 능력과 정교한 행동 제어가 필수"라며 "앞으로도 다양한 테스트와 협력을 통해 AI 로봇의 현실 적용성을 확대해 나갈 것"이라고 밝혔다.