노타, 퀄컴 엣지 디바이스서 '피지컬 AI' 속도 7배 높였다

드래곤윙 IQ-9075서 SmolVLA 0.45B 최적화

컴퓨팅입력 :2026/05/29 14:50

노타가 로봇 동작 생성에 필요한 시각언어행동(VLA) 모델을 엣지 디바이스에서 구동하고 추론 속도를 최대 7배 높이며 피지컬 인공지능(AI) 온디바이스 구현 가능성을 입증했다.

노타는 퀄컴 최신 엣지 AI 디바이스 '드래곤윙(Dragonwing) IQ-9075' 환경에서 VLA 모델 'SmolVLA 0.45B'를 최적화했다고 29일 밝혔다.

노타는 이번 최적화 과정에서 모델 전체를 줄이지 않고 속도 개선 효과가 크면서 정확도에 미치는 영향을 최소화할 부분을 선별했다. 노타는 로봇 동작을 생성하는 단계의 반복 연산을 줄이는 실시간 추론 최적화와 퀄컴 엣지 AI 디바이스 실행 환경에 맞춰 연산 흐름을 효율화하는 신경망처리장치(NPU) 기반 그래프 최적화를 적용했다.

비전언어행동(VLA) 데모 화면 (사진=노타)

그 결과 로봇 동작 생성 단계인 액션 헤드 처리 시간은 218ms에서 31ms로 약 85.8% 감소했으며 최대 7배 수준의 속도 개선을 달성했다. 전체 추론 시간도 505ms에서 310ms로 단축됐다. 작업 성공률은 기존 86%에서 85%로 유사한 수준을 유지해 속도를 높이면서도 안정성을 지켰다.

관련기사

노타는 이번 성과를 미국 산타클라라에서 열린 임베디드 비전 서밋 2026에서 공개했다. 관람객이 직접 물품을 선택하면 최적화된 VLA 모델이 이를 인식하고 로봇팔 동작을 생성해 물품을 집어 바구니에 넣는 실시간 체험형 시연을 진행했다.

채명수 노타 대표는 "피지컬 AI가 산업 현장으로 확산하려면 AI가 실제 환경을 보고 이해하고 행동으로 연결하는 과정을 엣지 AI 디바이스에서 빠르고 안정적으로 처리할 수 있어야 한다"며 "이번 VLA 최적화 사례는 우리 AI 최적화 기술이 피지컬 AI 시대 핵심 기반 기술로 확장됐음을 보여준다"고 말했다.