AI는 왜 아직 '딸기 한 입'조차 제대로 못 먹일까

컴퓨팅입력 :2025/04/10 20:34    수정: 2025/04/11 09:24

현재 AI, 사람 돕는 일에는 턱없이 부족하다

로봇과 인공지능(AI)의 진보는 가시적인 기술적 성과를 내고 있지만, 정작 인간을 직접 돕는 서비스 분야에선 여전히 갈 길이 멀다. 의료 지원, 가정 간병, 일상 청소 등 인간 중심의 복잡한 서비스 작업을 수행하기엔 현재의 AI는 충분한 지능이나 경험 기반 학습 역량을 갖추지 못했다. 미국 미시간대학 컴퓨터공학과 마크 스테픽(Mark Stefik) 교수는 논문에서 “현재의 AI는 실세계에서 몸으로 부딪히며 경험하고 학습하는 능력이 부족하다”고 지적한다. 그는 이를 극복하기 위한 대안으로 ‘경험 기반 기초 모델(Experiential Foundation Models)’의 필요성을 강조하며, 로봇이 실제 환경에서 행동하고 사람과 상호작용하며 학습하는 프레임워크가 필요하다고 주장했다.

AI의 한계는 ‘수동적 관찰’에 머문 학습 방식… ‘관찰’만 잘할 뿐, 직접 해보진 않았다

AI는 지금까지 ‘빅데이터 기반의 관찰 학습’에 초점을 맞춰 발전해왔다. 대형 언어 모델(LLM)과 이미지 인식 시스템은 방대한 양의 데이터를 학습해 정교한 분류나 요약 기능을 구현하지만, 이는 어디까지나 정적 데이터에 기반한 예측일 뿐이다. 스탠퍼드대의 리페이페이(Fei-Fei Li) 교수는 이를 “AI는 우리가 무엇을 보고 있는지 말해줄 수 있지만, 그 이상은 하지 못한다”고 지적한 바 있다.

이러한 한계를 극복하려면 AI가 직접 실세계와 상호작용하며 얻은 경험을 통해 의미 있는 판단과 행동을 배우는 방식으로 진화해야 한다. 특히 의료현장처럼 작은 실수가 큰 문제로 이어질 수 있는 분야에서는 이 같은 ‘행동 중심의 학습’이 필수적이다.

로봇이 간병하려면 ‘딸기 한 입’에도 수십 가지를 배워야 한다

AI가 의료 보조나 간병에 투입되기 위해선 인간의 몸짓, 의사소통, 상황 판단 등 복합적인 역량을 갖춰야 한다. 코넬대의 EmPRISE 연구실 사례는 이를 단적으로 보여준다. 연구진은 장애인을 대상으로 로봇이 딸기를 집어 입에 넣어주는 실험을 진행했는데, 이 과정에서 로봇은 딸기의 크기나 상태, 입의 위치, 사람의 의사 표현, 주변 방해 요소 등 수십 가지 변수에 대응해야 했다.

해당 연구진은 “완전 자율형 시스템은 아직 멀었고, 반자율형 시스템조차 사용자 입력의 한계로 인해 제약이 많다”고 밝힌다. 이처럼 로봇이 사람과의 상호작용을 통해 안정적 서비스를 제공하려면 단순한 기계적 동작을 넘어 정서적, 사회적 맥락을 인식하고 대응할 수 있어야 한다.

빅데이터 학습에서 '경험 기반 모델'로 전환해야… 대형 언어모델은 의료도, 간병도 잘 못한다

현대 AI의 핵심은 대규모 기초 모델(Foundation Models)을 중심으로 발전해왔지만, 대부분은 언어, 이미지, 코드 중심이다. 스테픽 교수는 로봇이 일상적 업무를 수행할 수 있도록 하려면 시뮬레이션이 아닌 실세계 데이터를 기반으로 한 ‘로봇용 기초 모델(Robotic Foundation Models)’이 필요하다고 강조한다.

예를 들어 behavior-1K 프로젝트는 1,000가지 일상 활동을 정의하고, 이를 수행할 수 있는 시뮬레이션 환경을 구축한 로봇 학습 데이터셋이다. 하지만 이조차도 사람과의 상호작용은 포함하지 않는다. 스테픽 교수는 이를 넘어서기 위해 로봇이 실제 환경에서 몸으로 부딪히며 데이터를 축적하고 학습하는 ‘경험 기반 기초 모델’을 제안한다. 이는 인간 아이들이 놀이와 모방을 통해 능력을 키우는 것처럼, 로봇도 유사한 발달 단계를 거쳐 학습해야 한다는 주장이다.

로봇을 '키우는' 시대를 향해… AI도 사람처럼 ‘키워야’ 진짜 똑똑해진다

경험 기반 AI 학습 방식은 단순히 알고리즘을 개발하는 단계를 넘어서, 로봇을 ‘양육’하는 개념으로의 전환을 요구한다. 아이처럼 로봇도 기본적인 감각, 운동, 언어 능력을 먼저 익히고, 이후 점차 복잡한 사회적, 전문적 기술을 배우도록 유도하는 방식이다. 이러한 로봇은 사용자와의 협업, 피드백, 실패 경험을 통해 진화하며, 특정 분야에 특화된 ‘경험 기반 AI’로 거듭날 수 있다.

스테픽 교수는 이같은 방식이 인간과 유사한 로봇을 만드는 데 더 현실적인 해법이 될 수 있다고 강조하며, 향후 AI 발전이 ‘기술의 성숙기(railroad time)’를 맞이하기 위해선 이러한 방향으로의 전환이 필수적이라고 결론짓는다.

FAQ

Q. 왜 지금의 AI는 의료보조나 간병 같은 일을 잘 못하나요?

A. 현재의 AI는 주로 '관찰' 기반의 학습을 합니다. 즉, 이미 존재하는 텍스트나 이미지 데이터를 분석해서 판단하는 데는 강하지만, 실제 환경에서 몸을 움직이며 행동하고 피드백을 받는 '경험 중심의 학습'은 거의 하지 못합니다. 의료나 간병처럼 인간과 복잡하게 상호작용해야 하는 서비스 업무는 단순한 데이터 분석만으로는 수행할 수 없습니다.

Q. 로봇도 ‘양육’해야 한다는 건 무슨 의미인가요?

A. 인간이 아기 때부터 감각, 언어, 협업 등을 배워가듯, 로봇도 점진적으로 훈련시켜야 한다는 뜻입니다. 갑자기 전문가 수준의 AI를 개발하는 대신, 초기엔 단순한 능력을 익히고 점차 복잡한 업무로 확장하는 ‘성장형 학습’이 효과적이라는 주장입니다.

Q. 그럼 이런 로봇은 언제쯤 볼 수 있을까요?

관련기사

A. 연구자들은 최소 10년 이상의 개발과 현실 환경에서의 테스트가 필요하다고 말합니다. 로봇이 단순한 시연을 넘어서 실제 가정이나 병원에서 안정적으로 작동하려면, 수많은 변수에 대한 경험과 검증이 축적되어야 하기 때문입니다.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)