엔비디아-미스트랄AI, 신규 AI 모델 출시…"개인 데스크톱도 AI 실행"

100여 개 이상 다국어 지원…한국어 학습 성능 2배 향상

컴퓨팅입력 :2024/07/19 09:22

인공지능(AI) 하드웨어 시장을 주도하는 엔비디아와 오픈AI의 경쟁자로 주목받는 미스트랄AI가 새로운 언어모델을 발표했다.

신규 언어 모델은 엔비디아의 개인용 그래픽카드인 RTX 시리즈로도 구현할 수 있는 소규모 AI로, 기업을 비롯해 개인 사용자의 AI 활용에도 많은 변화를 일으킬 수 있을 전망이다.

미스트랄AI는 공식 홈페이지를 통해 엔터프라이즈용 언어모델 미스트랄 네모(Mistral-NeMo)를 출시했다고 19일 밝혔다.

엔비디아-미스트랄AI. 미스트랄 네모 공개(이미지=엔비디아)

미스트랄 네모는 퍼블릭 클라우드가 아닌 환경에서도 고성능 AI를 실무자의 데스트톱을 통해 직접 제공하기 위해 설계된 AI 모델이다.

120억 개의 매개변수로 학습된 이 모델은 글로벌 다국어 앱을 위해 설계된 것이 특징으로 기존 언어모델과 비교해 16배 큰 12만8천 토큰의 컨텍스트 창을 제공한다.

8비트 부동 소수점 포맷(FP8) 추론을 지원해 양자화 인식 훈련을 통해 더욱 빠른 처리 속도를 제공한다. 이를 통해 한 번에 대규모 텍스트를 인식하고 처리하는 것이 가능하다.

또 100개 이상의 언어로 훈련된 틱토큰(Tiktoken) 기반의 새로운 토크나이저인 테큰(Tekken)을 사용해 언어에 대한 인식을 개선했다. 라마3(Llama3) 토크나이저와 비교해 모든 언어 대비 약 85% 성능이 향상됐다.

특히 영어, 한국어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 중국어, 일본어, 아랍어, 힌디어에 특화된 성능을 지원한다.

미스트랄AI에 따르면 한국어와 아랍어를 각각 2배와 3배 더 효율적으로 압축할 수 있으며 중국어, 이탈리아어, 프랑스어, 독일어, 스페인어, 러시아어도 30% 성능 향상을 달성했다.

미스트랄 네모는 기존 AI모델과 벤치마크 테스트를 통해 비교한 결과 MT벤치 7.84, 와일드벤치 42.57를 기록했다. 6.48와 25.55를 달성한 미스트랄 7B와 6.85, 28.77을 기록한 라마3 8B 등 기존 AI모델에 비해 월등한 성능을 기록했다.

관련기사

엔비디아의 응용 딥러닝 연구 부사장인 브라이언 카탄자로는 "이 모델은 아파치 2.0 라이선스로 출시되는 오픈소스"라며 "우리는 높은 정확도를 가진 모델의 다양한 작업에서 활용될 것을 기대하고 있다"고 밝혔다.

이어 "미스트랄 네모는 많은 사람들이 이미 가지고 있는 RTX GPU에서도 실행할 수 있는 소규모 AI"라며 "집에서 데스크톱으로도 사용할 수 있는 만큼 많은 변화를 가져올 수 있을 것"이라고 덧붙였다.