뤼이드(대표 장영준)가 개발한 생성AI 모델이 4일 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM(Large Language Model, AI 거대 언어 모델) 리더보드’ 평가에서 74.07점을 기록해 글로벌 1위에 올랐다.
오픈AI, 구글, 아마존 등 글로벌 빅테크들의 초거대 AI 언어모델들이 미래 시장을 두고 치열한 경쟁 중이다. 전세계 500여 개의 오픈소스 생성 AI 모델들의 성능을 평가해 순위를 공개하는 허깅페이스의 오픈 LLM 리더보드는 하루에도 수십개 씩 새로운 모델이 나올 정도로 치열한 전세계 AI 기술 경쟁의 각축장이다.
평가 지표는 총 4개로 ▲초등학교 수준의 과학 추론 능력 ▲인간에게는 쉽지만 AI 모델에게는 까다로운 상식 능력 ▲초등 수학, 미국 역사, 컴퓨터 과학, 법률 등을 포함한 종합적 언어 이해 능력 ▲환각현상(할루시네이션) 방지를 위한 진실성 검사 등 이들 지표의 평균 점수를 통해 종합 점수와 순위가 정해진다. 뤼이드는 네 가지 지표 모두 고른 고득점을 얻어 종합 점수에서 최고점을 기록했다.
현재 상위권 주요 참가팀을 살펴보면, 2위는 대만 항공우주 회사, 3위는 중국 알리바바와 서북공업대 연합 모델, 5위는 중국 연합통신으로 추정된다. 각 참가자들이 공식적인 정보를 공개하지 않아 모델명으로 추정한 결과다. 이외에도 이미지 생성 AI인 '스테이블디퓨전' 개발사 '스태빌리티 AI'의 LLM이 71.42로 47위를 기록 중이며, 메타의 '라마-2'는 67.35점으로 106위에 랭크돼 있다.
관련기사
- "GPT로 자동채점"…뤼이드, 토익스피킹 AI 모의고사 ‘산타 세이' 출시2023.09.26
- 뤼이드, 챗GPT 활용 ‘토익 스피킹’ 모의고사 베타 서비스 시작2023.06.19
- 뤼이드, 日 어학교육 ‘아루쿠'와 ‘산타 재팬’ 운영계약 체결2023.06.01
- 브라질 경제사절단, 뤼이드 방문…"실용 AI 기술 확인"2023.05.26
이 리더보드는 상시 오픈 상태로, 참가기업이나 개인이 자체 LLM을 제출하면 평가 후 바로 리더 보드가 갱신된다. 국내에서는 지난 8월 AI 기술 기업 업스테이지가 챗GPT 3.5 모델을 누르고, 전세계 1위를 차지해 주목받았으며, 현재 14위를 기록 중이다. 뤼이드는 지난 9월 처음으로 제출한 모델이 73.69점을 기록, 세계 2위에 랭크됐으며, 이번에 한 달 만에 새로 제출한 모델이 74.07점을 받아 1위에 올랐다.
장영준 뤼이드 대표는 "이번 1위를 통해 교육 분야에 국한되지 않은 AI 기술 기업으로서 LLM 학습 능력과 튜닝 기술이 세계 선두에 있음을 증명했다"며 "그간의 교육학습 AI 운영으로 축적된 프롬프트 엔지니어링이 파인튜닝 기술과 좋은 시너지를 발생시킬 것으로 기대된다"고 밝혔다.