[현장] 피지컬 AI 시대, LLM이 곧 '월드 모델'…노빅 "기존 토대 활용해야"

구글 연구총괄, 'AI 서울 2026' 기조연설서 파운데이션 모델 효용성 강조

컴퓨팅입력 :2026/01/30 13:47    수정: 2026/01/30 13:49

"2026년 우리는 에이전트 인공지능(AI)과 로봇 공학이 결합된 피지컬 AI 시대를 목격하고 있습니다. 그렇다면 이 새로운 흐름을 위해 지금까지 쌓아온 거대언어모델(LLM)을 모두 허물고 처음부터 다시 시작해야 할까요? 제 대답은 '아니오'입니다."

피터 노빅 구글 연구총괄 겸 스탠퍼드대학교 인공지능연구소 위원은 30일 서울 강남구 코엑스에서 개막한 'AI 서울 2026' 콘퍼런스 영상 기조연설에서 이같이 밝혔다.

최근 AI 산업 담론의 축이 모델 성능에서 상용화와 수익성으로 옮겨가면서 기존 파운데이션 모델인 LLM의 효용성이 논쟁거리로 떠오르고 있다.

노빅 위원은 먼저 물리적 세계가 가진 본질적인 불확실성에 주목했다. 전통적인 소프트웨어 공학은 코드의 불확실성을 제거하고 통제하려 하지만 현실 세계의 예외 상황에는 한계가 있다는 지적이다.

피터 노빅 구글 연구총괄 겸 스탠퍼드대학교 인공지능연구소 위원이 30일 서울 강남구 코엑스에서 개막한 'AI 서울 2026' 콘퍼런스에서 영상 기조연설을 하고 있다. 2026.1.30

그는 1999년 나사(NASA) 화성 탐사선 '마스 폴라 랜더' 추락 사고를 예로 들었다. 당시 착륙선은 다리가 펴질 때 발생한 진동을 착륙 신호로 오인해 추락했다. 노빅 위원은 센서 오류 가능성을 판단하고 상황을 추론할 수 있는 '공유된 월드 모델'이 있었다면 사고를 막을 수 있었을 것이라고 분석했다.

피지컬 AI의 두뇌 구축에 대해서는 LLM의 확장을 지지했다. 일각에서는 '딥러닝의 대부'로 불리는 얀 르쿤 전 메타 수석 과학자 등의 주장을 빌려 기존 LLM을 버리고 새로운 아키텍처를 도입해야 한다고 주장한다.

하지만 노빅 위원은 기존 LLM이 이미 세상을 이해하는 월드 모델로서 기능하고 있다고 반박했다.

그는 "언어 모델은 단순히 다음 단어를 예측하는 시퀀스 모델이지만, 텍스트뿐만 아니라 비디오 프레임과 같은 시퀀스도 처리할 수 있다"며 "이 과정에서 AI는 인과관계나 물체 간 관계 등 세상이 작동하는 원리를 자연스럽게 학습한다"고 말했다.

관련기사

예를 들어 렌터카 반납을 위해 자전거를 타라고 제안했던 과거 소프트웨어와 달리, 지금의 파운데이션 모델은 렌터카를 반납하면 이동 수단이 사라진다는 맥락을 완벽히 이해하고 바로잡을 수 있다는 것이다.

노빅 위원은 "언어 모델이 텍스트 시퀀스 예측을 넘어 비디오와 오디오 데이터를 학습하며 월드 모델로 확장 중"이라며 "피지컬 AI는 기존의 거대 모델을 폐기하는 것이 아니라 그 토대 위에서 구축돼야 한다"고 제언했다.