챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

하사비스 CEO "물리 세계 이해하는 AI 모델…로보틱스 시장에 결정적 순간 올 것"

컴퓨팅입력 :2025/04/11 11:16

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 구글의 인공지능(AI) 모델 '제미나이'와 영상 생성 AI '비오2'를 결합한다는 계획을 발표했다.

11일 테크크런치에 따르면 하사비스 CEO는 리드 호프먼 링크드인 공동 창립자가 진행하는 팟캐스트 파서블에 출연해 제미나이에 비오2를 결합해 물리 세계를 이해할 수 있는 AI 모델로 고도화하겠다고 밝혔다.

데미스 하사비스 구글 딥마인드 CEO (사진=위키커먼스)

하사비스 CEO는 "비오2가 많은 유튜브 영상을 학습하는 것만으로도 현실 세계의 물리 법칙을 이해할 수 있다는 것에 놀랐다"며 "이는 로봇 산업에 엄청난 영향을 미칠 수 있다고 생각했다"고 말했다.

이어 "우리가 개발한 멀티모달 파운데이션 모델 제미나이와 비오2를 향후 결합할 계획"이라며 "AI가 단순 챗봇 수준을 넘어 인간이 살고 있는 현실 세계를 이해하고 도움을 줄 수 있도록 할 것"이라고 강조했다.

두 AI 모델을 결합해 유튜브 영상 학습과 같은 기존의 강화 학습만으로 복잡한 인간의 창의성과 행동을 모방할 수 있는 '인공 일반 지능(AGI)'에 도달할 수 있다는 게 구글의 기대다.

특히 로보틱스 산업에서의 활용도 성공적일 것이란 관측이다. 로보틱스 기술에 필요한 물리적 상호작용 없이도 영상 AI를 기반으로 현실 세계를 이해할 수 있다는 것이다.

앞서 구글 딥마인드는 로봇 맞춤형 AI 모델인 '제미나이 로보틱스'와 다른 고급 시각·언어·행동(VLA) 모델 대비 성능이 2배 향상된 벤치마크 결과도 발표한 바 있다.

하사비스 CEO는 "우리 삶에 실질적인 도움을 주는 AI 기술은 로보틱스 영역에도 필요하다"며 "물리 법칙을 이해하는 멀티모달 모델들에 로봇이 필요로 하는 행동, 운동 제어, 계획 수립과 관련된 미세조정을 수행해 이를 성공적으로 구현할 수 있다"고 설명했다.

관련기사

이어 "범용 AI 모델에 데이터를 추가 학습하거나 특별한 노력 없이도 로보틱스 환경에 알맞은 AI를 개발·이식할 수 있다"며 "이는 5년 전 최고의 로봇공학자들조차 예측하기 어려웠던 결과"라고 덧붙였다.

그러면서 "우리가 만들고 있는 범용 멀티모달 모델들이 충분히 정교해져 로봇에 그대로 탑재될 것"이라며 "언어·과학 분야에 챗GPT·알파고·알파폴드가 가져온 결정적인 순간이 아직 로보틱스 산업에는 오지 않았으나 그 시점이 곧 올 것"이라고 강조했다.