메타·엔트로픽·미스트랄, AI 新무기 내놔도 오픈AI 못 넘는다…이유는?

메타 '라마 3.1' 이어 미스트랄도 최신 AI 모델 '라지 2' 공개…'멀티모달' 없어 경쟁 한계

컴퓨팅입력 :2024/07/26 09:27

생성형 인공지능(AI) 시장을 주도하고 있는 오픈AI를 겨냥해 메타와 엔트로픽, 미스트랄 등이 잇따라 최신 모델을 선보이며 AI 경쟁이 치열해지고 있다. 각 업체들은 오픈AI의 최신 모델 'GPT-4o'나 'GPT-4'를 기준으로 성능을 비교하며 자사 모델의 경쟁력을 알리고 있지만 오픈AI를 뛰어넘기엔 기술적 한계가 여전하다는 평가다.

26일 IT 매체 테크크런치에 따르면 프랑스 AI 스타트업 미스트랄은 지난 24일 최신 AI 모델인 '라지(Large) 2'를 선보였다. 

이 모델은 1천230억 개(123B)의 매개변수로 12만8천 토큰의 컨텍스트 창을 제공한다. 회사 측은 전날 출시한 메타의 '라마 3.1' 모델과 동등한 성능을 가졌다고 주장했지만, '라마 3.1' 중 가장 큰 모델(450B)에 비해 매개변수는 3분의 1도 안된다.

미스트랄AI 로고(사진=미스트랄AI 홈페이지 캡처)

다만 전작에 비해선 추론뿐 아니라 코드 생성, 수학 등 전반에 걸쳐 성능이 개선됐다는 평가를 받는다. 고급 다국어 기능도 제공되는데 한국어를 포함해 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어 등 12개 언어와  80개의 코딩 언어를 지원한다. 또 고급 함수 호출 및 검색 등 새로운 기능이 추가됐고 AI의 큰 단점으로 꼽히는 '할루시네이션(환각 증상)'도 최소화했다.

페이스북 모회사 메타도 지난 23일 거대언어모델(LLM) 라마 3 시리즈 중 상위 버전인 '라마 3.1'을 출시했다. 지난 4월 '라마 3'을 선보인 이후 3개월여만으로, 405B와 8B, 70B 등 3가지 버전으로 구성됐다. '또 라마 3.1'은 엔비디아 최신 그래픽처리장치(GPU) 'H100' 1만6천 개를 기반으로 훈련됐다. 운영 비용은 오픈AI 'GPT-4o'에 비해 절반정도인 것으로 알려졌다.

올해 3월에는 앤트로픽도 차세대 LLM '클로드3'를 내놨다. 오픈AI의 GPT-4를 넘어섰다는 평가를 받은 '클로드3'는 성능과 속도에 따라 '오푸스', '소네트', '하이쿠'로 나뉜다. 이 중 가장 지능적인 '오푸스'는 대학원 수준의 전문 추론, 기초 수학 등 AI 성능 테스트에서 오픈AI의 GPT-4를 능가한 것으로 알려졌다.

미라 무라티 오픈AI 최고기술책임자(CTO)가 온라인 신제품 발표 행사에서 자사의 새 AI 모델 GPT-4o를 설명하고 있다. (사진=오픈AI)

이처럼 각 업체들이 오픈AI AI 모델을 기준으로 삼고 최신 버전을 내놓지만 'GPT'를 넘기엔 여전히 부족하다는 의견이 많다. 오픈AI와 달리 '멀티모달(Multi modal)' 기능을 제공하고 있지 않아서다. 멀티모달은 텍스트뿐 아니라 이미지, 음성, 영상 등 다양한 데이터를 인식할 수 있는 AI 모델 방식이다. 기존 AI는 대부분의 정보를 텍스트로 배우고 처리했지만, 멀티모달 AI는 여러 가지 정보를 한꺼번에 받아들여 더 정확한 결과물을 만들어낼 수 있다는 것이 강점이다.

이 탓에 현재로선 오픈AI와 겨룰 수 있는 경쟁사는 구글이 거의 유일하다. 구글은 올해 2월 멀티모달 AI 모델 '제미나이 1.5 프로'를 공개한 데 이어 5월 중순께 제미나이 탑재 검색 엔진을 정식 출시했다. 

이에 맞서 오픈AI도 지난 5월 다양한 형태의 데이터를 동시에 인식하고 처리할 수 있는 대규모 멀티모달 모델(LMM) 'GPT-4o'를 공개했다. '음성 모드'가 지원되는 것이 특징으로, 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 차별점이다. 

최근에는 챗GPT 소형 모델인 'GPT-4o 미니'를 공개하며 멀티모달 AI의 소형화에 앞장서고 있다. 이미지와 동영상을 제공해주고 실시간 음성 대화가 가능했던 'GPT-4o'와는 달리 텍스트와 이미지 인식 기능만 지원된다. 가격은 일반 모델인 GPT-3.5 터보보다도 60% 저렴하지만, 성능은 최신 모델인 'GPT-4o' 수준과 유사한 것으로 알려졌다.

관련기사

오픈AI는 "'GPT-4o 미니'는 지난해 10월까지의 지식을 보유하고 있다"며 "이미지·비디오·오디오 입출력은 향후 지원할 예정"이라고 밝혔다.

테크크런치는 "미스트랄 라지 2와 메타 라마 3.1 버전에도 없는 것이 바로 '멀티모달' 기능"이라며 "오픈AI는 멀티모달 AI 시스템과 관련해 경쟁사보다 훨씬 앞서 있고 일부 스타트업들이 이를 구축하려고 노력 중"이라고 분석했다.