네이버클라우드가 범용 대규모언어모델(LLM) 경쟁을 넘어 텍스트·이미지·음성·도구 활용을 하나의 모델로 통합하는 '옴니모달 인공지능(AI)' 전략을 전면에 내세웠다.
상대적으로 작은 모델부터 시작해 점진적으로 고도화하는 방식으로, 현실 환경을 이해하고 행동하는 AI 에이전트 구현을 목표로 차세대 파운데이션 모델 경쟁에서 기술적 차별화를 강조했다.
네이버클라우드는 30일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 서울 코엑스에서 개최한 '독자 AI 파운데이션 모델 1차 대국민 발표회'에서 옴니모달 기반 파운데이션 모델과 이를 적용한 다양한 AI 서비스를 공개했다.
이날 네이버클라우드는 옴니 파운데이션 모델 전략을 제시했다. 전시 부스에서는 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조의 '하이퍼클로바X 시드 8B 옴니'와 복합 추론 능력을 강화한 '하이퍼클로바X 시드 32B 씽크' 두 가지 모델을 공개했다.
8B급 옴니모델은 규모는 비교적 작지만 멀티모달 입력을 단일 모델 구조에서 처리할 수 있도록 설계된 것이 특징이다. 텍스트·이미지·음성을 각각 다른 모델로 처리해 결합하는 기존 방식과 달리, 처음부터 하나의 의미 공간에서 학습해 응답 속도와 효율성을 높였다.
네이버클라우드는 이 모델을 시작점으로 삼아 데이터 확장과 학습 고도화를 통해 단계적으로 스케일업할 계획이다.
함께 공개된 32B급 씽크 모델은 옴니모달 입력을 바탕으로 추론과 문제 해결에 초점을 맞췄다. 이미지 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 요청을 처리하는 에이전트형 AI 경험을 구현하며 수학 문제 풀이나 시각 정보 기반 추론 등 고난도 작업을 수행하는 시연이 이뤄졌다.
부스에서는 이들 모델을 적용한 다양한 체험형 서비스도 공개됐다. 이미지 촬영만으로 문제를 이해하고 풀이 과정을 설명하는 AI 수학 에이전트, 민원 행정 상담을 돕는 AI 아바타, 법률 상담 챗봇, 감정 상담을 지원하는 마음 케어 아바타 등 공공·생활 밀착형 서비스가 관람객의 이목을 끌었다.
네이버클라우드는 이번 독자 AI 파운데이션 모델 프로젝트를 통해 대규모 파라미터 경쟁보다는 작은 모델을 촘촘하게 다져 키운다는 전략이다. 실제 서비스 환경에서 비용과 개발 부담을 줄이기 위해 8B·32B급 모델에서 옴니모달 구조와 추론 성능을 충분히 검증한 뒤 단계적으로 모델 규모를 확대하겠다는 구상이다.
이를 바탕으로 산업 및 공공 영역으로의 확장도 염두에 두고 있다.
관련기사
- 이미지 생성 AI 모델 경쟁 심화…오픈AI, 'GPT 이미지 1.5' 공개2025.12.17
- 네이버 하이퍼클로바X, AI 해커톤서 생활밀착 서비스 확장 '입증'2025.09.01
- AI 어디까지 가나..."사진이나 영상 흐려도 말끔하게 복원"2025.08.31
- "읽지 말고 들으세요"...구글, '제미나이' 앞세워 문서 패러다임 전환 선언2025.08.20
네이버클라우드는 농기계와 모빌리티 등 다양한 산업 현장에서 음성·시각·공간 정보를 동시에 이해하는 AI 에이전트 활용 가능성을 제시하며 물리적 환경과 상호작용하는 피지컬 AI로의 진화를 준비 중이라고 설명했다.
네이버클라우드 관계자는 "옴니모달 AI는 단순히 모델을 크게 만드는 문제가 아니라, 현실 세계의 맥락을 얼마나 정교하게 이해하느냐가 핵심"이라며 "8B급 모델부터 차근차근 고도화해 나가며 산업과 일상에서 실제로 쓰이는 옴니 AI 에이전트를 구현해 나가겠다"고 말했다.











