[바르셀로나(스페인)=박수형 기자] 로봇 플랫폼을 내세워 KT가 피지컬AI 전략을 가다듬었다. 로봇과 설비, 시스템을 아우르는 현장형 피지컬AI를 구현한다는 방침이다.

KT는 스페인 브라셀로나에서 열리는 MWC26에서 로봇, 설비, IT 시스템을 하나의 지능형 생태계로 연결하는 피지컬AI 전략과 로봇 플랫폼 ‘K RaaS(KT Robot as a Service)’를 공개한다.

K RaaS는 개별 로봇을 제어하는 기술을 넘어 실제 운영 가능한 피지컬AI 서비스를 구현하는 로봇 오케스트레이션 플랫폼이다. 로봇, 시설, 레거시 시스템을 통합해 서비스의 전 생명주기를 인지하고 분석, 운영해 현실 비즈니스 환경에서 인공지능 기반의 자동화를 바로 적용할 수 있도록 설계됐다.

특히 K RaaS는 클라우드 환경에 최적화된 구조로 설계돼 전 세계에 분산된 이기종 로봇과 설비를 실시간으로 모니터링하고, 이를 통합해 운용 관리할 수 있다. 단일 로봇의 자동화를 넘어 서비스 흐름 단위의 전체적인 피지컬 AI 시스템이 유기적으로 작동하는 구조다.

이 플랫폼에는 다양한 역할을 수행하는 에이전트가 탑재된다.

먼저 ‘서비스 빌더 에이전트’는 별도 개발 없이도 고객사가 환경에 맞는 로봇 융합 서비스를 설계해 배포할 수 있도록 지원한다. ‘K RaaS 에이전트’는 자연어 인터페이스를 통해 미션 현황을 조회하고 운영 데이터를 분석해 보고서까지 생성해낸다. 수십 개의 관제 화면을 확인해야 했던 관리자가 대화 한 번으로 통합 리포트를 받아볼 수 있게 된 것이다.

KT는 초고속 네트워크 인프라와 생성형 AI 모델 SOTA K, 로봇 오케스트레이션 기술을 결합해 반도체 제조공장, 물류센터, 스마트 빌딩 등 다양한 산업 현장에서 피지컬AI 적용 레퍼런스를 확보했다. KT는 K RaaS가 단순한 로봇 간 연결이나 관리 중심의 로봇 제어 기술을 넘어 AI가 물리 환경을 이해하고 최적의 실행을 이끌어내는 현장형 피지컬AI 오케스트레이션 플랫폼으로 구현한다는 계획이다.

듣고 보고 이해하는 차세대 로봇 지능

VLA 에이전트는 시각 정보(Vision)와 언어(Language)를 통합해 이해하고 이를 실제 행동(A으로 연결하는 차세대 로봇 지능이다.

특정 로봇 유형에 종속되지 않는 범용 구조로 설계돼 휴머노이드든 이동형 로봇이든 VLA 에이전트를 탑재하면 인식, 추론, 행동 능력을 갖추게 된다. 기존의 서비스 로봇이 수동 조작 중심이었다면, VLA 에이전트는 호출어와 시선 인식 등을 기반으로 로봇이 자율적으로 사용자 의도를 파악하고 맥락을 이해해 동작하게 한다.

로봇이 무엇을 인식하고, 어떤 추론 과정을 거쳐 어떤 행동을 호출하는지도 실시간으로 확인할 수 있다. 카메라 영상이나 음성 데이터는 저장되지 않고 로봇 내에서 분석 후 즉시 폐기되며, 모든 처리는 온디바이스 기반으로 수행된다. 산업 현장에서 요구하는 높은 보안성까지 충족했다.

VLA 에이전트 시연에서는 혼잡한 환경에서도 로봇이 정확히 사용자의 의도를 인식해내는 과정을 보여준다.

예컨대 관람객이 눈을 마주치거나 손을 흔들거나 “KT 로봇”이라고 호출하면, 로봇은 호출어와 시선 인식을 동시에 확인한 뒤 반응한다. “창가 자리로 안내해줘”라고 요청하면, 인원수와 좌석 조건을 종합적으로 판단해 최적 위치를 계산하고 자율 이동을 시작한다. 이동 중에는 라이다 센서와 깊이 카메라가 실시간으로 주변을 스캔해 사람이나 장애물을 자동 회피한다.

만약 정보가 부족하면 로봇이 먼저 되묻는다. 이를테면 “자리 안내해줘”라는 요구에는 “몇 분이신가요?”라고 추가 질문을 던진다. 흰 셔츠를 입은 고객에게는 먼저 “앞치마를 드릴까요”라는 제안도 한다.

사람 개입 없이 로봇 간 자율 협업 구현

실제 고객 현장에서 동작하는 ‘엣지 R2R 에이전트’도 주목할 부분이다. ▲이기종 로봇 통합 서비스 제공 ▲현장 내 모든 에이전트 및 레거시 시스템 오케스트레이션 ▲플랫폼과의 실시간 연계를 통한 임무 수행이라는 세 가지 핵심 역할을 수행한다.

관람객들은 스마트 자동차 공장 시나리오를 통해 피지컬 AI의 작동 방식을 직관적으로 확인할 수 있다. 휴머노이드 로봇 ‘Hugo’가 VLA 기반으로 부품의 이상 여부를 검수하고, 다음 단계인 ‘물품 이송’이 필요하다는 판단을 자동으로 도출한다.

이어, Hugo가 작업 라인을 요청하면 플랫폼이 즉시 창고관리시스템(WMS)을 호출해 가용 라인을 확인하고 모바일 로봇 ‘Mobi’에 이송 임무를 배정한다. 로봇 간 직접 협업(R2R)과 에이전트 간 통신(A2A)를 통해 중앙 통제나 사람의 개입 없이 작업이 완결되는 구조다.

이러한 시연을 통해 피지컬 AI는 개별 로봇의 지능이나 움직임이 아니라, 플랫폼 기반의 에이전트 오케스트레이션 역량에서 완성된다는 점을 확인할 수 있다.

디지털 주문부터 물리적 배송까지 OK

K RaaS 오더 및 딜리버리 에이전트는 AI 에이전트들이 협력해 주문부터 로봇 배송까지 전 과정을 수행하는 고객 체감형 서비스다.

사용자가 모바일 앱에서 채팅으로 메뉴를 주문하면 오더 에이전트가 의도를 분석해 플랫폼에 배송을 요청하고 플랫폼은 적합한 로봇을 배정한다. 로봇은 엘리베이터나 보안게이트 등의 다양한 설비 시스템과 연동돼 자율적으로 이동하며, 고객은 실시간 위치와 주문 상태를 확인할 수 있다.

이 과정에서 플랫폼, Edge, VLA, 로봇이 하나의 생태계처럼 작동한다. 디지털 오더가 물리적 배송으로 완결되는 피지컬 AI의 대표 사례다.

KT는 K RaaS가 단순한 로봇 간 연결 기술이 아니라, AI가 물리 세계를 이해하고 최적화하는 현장형 플랫폼이라고 강조한다.

오승필 KT 기술혁신부문장은 “K RaaS는 현장에서 생성되는 데이터를 신경망 기반으로 학습하고, 이를 다시 서비스 품질 개선과 운영 최적화에 반영하는 구조를 갖췄다”며 “학습과 실행이 반복될수록 성능이 향상되는 선순환형 피지컬 AI 체계를 통해 제조 물류 빌딩 등 산업 전반으로 확장해 나가겠다”고 말했다.