엔비디아가 미스트랄AI의 오픈 모델 개발에 협력해 생성형 인공지능(AI) 경쟁력을 끌어올렸다.
미스트랄AI는 엔비디아 슈퍼컴퓨팅과 엣지 플랫폼 전반에 최적화된 다국어·멀티모달 오픈소스 모델 '미스트랄3'를 공개했다고 4일 밝혔다. 제품군은 프론티어급 대규모 모델 '미스트랄 라지3'와 엣지 실행에 특화된 경량 제품군 '미니스트랄3'로 이뤄졌다.
미스트랄 라지3는 불필요한 연산을 줄이는 전문가 혼합 방식(MoE) 구조를 적용해 확장성과 정확성을 높였다. 410억 개의 활성 매개변수, 6천750억 개의 전체 매개변수, 25만6천 토큰 컨텍스트 윈도우를 갖춰 엔터프라이즈 AI 워크로드에서 효율성과 적응성을 제공한다.
해당 모델은 엔비디아 'GB200 NVL72' 시스템과 결합할 때 병렬 처리와 하드웨어 최적화가 극대화된다. 방대한 AI 모델의 배포 효율이 크게 향상된다. 이 조합은 미스트랄 AI가 말하는 '분산 지능' 개념을 현실화하며 연구 성과와 실제 활용 간 간극을 좁히는 기반이 된다.
미스트랄 라지3는 엔비디아 NV링크의 일관 메모리 도메인, 전문가 병렬 처리 구조, NVFP4 저정밀도 연산, 엔비디아 다이나모 기반 분산 추론 최적화가 결합돼 훈련과 추론 성능을 크게 끌어올렸다. 그 결과 NVL72 시스템에서 이전 세대 H200 대비 10배 성능 향상을 보였다.
엣지 실행을 위한 '미니스트랄 3'는 9개 소형 언어 모델로 구성됐다. 엔비디아 스파크, RTX PC·노트북, 젯슨 등 다양한 플랫폼에서 최적화된 성능을 제공한다. 또 라마.cpp, 올라마 등 주요 AI 프레임워크와 연동 가능하다.
미스트랄 3 제품군은 누구나 이용 가능한 오픈소스 형태로 제공돼 연구자와 개발자가 실험, 맞춤화, 최적화를 폭넓게 수행할 수 있다. 기업은 이를 엔비디아 네모의 데이터 디자이너, 커스터마이저, 가드레일, 네모 에이전트 툴킷과 연동해 에이전트 기반 모델 개발 속도를 높일 수 있다.
관련기사
- 삼성전자, 엔비디아향 HBM4 최종 평가 단계 돌입2025.12.03
- AWS "엔비디아 GPU 대비 50% 비용 절감"…자체 AI칩 공개2025.12.03
- 아카마이, 엔비디아와 AI 추론 클라우드 구축…엣지로 분산2025.12.02
- 엔비디아, 자율주행용 AI 모델 발표…"레벨4 연구 지원"2025.12.02
또 엔비디아는 클라우드부터 엣지까지 추론 효율을 극대화하기 위해 텐서RT-LLM, SGLang, vLLM 등 추론 프레임워크도 미스트랄 3에 맞춰 최적화했다.
이번 모델 군은 주요 오픈소스 플랫폼과 클라우드 서비스에서 즉시 사용 가능하며, 조만간 엔비디아 NIM 마이크로서비스 형태로도 배포될 예정이다.











