업스테이지-NIA, 한국어 LLM 성능 비교·평가 플랫폼 구축

27일부터 운영 시작

컴퓨팅입력 :2023/09/25 11:40

업스테이지가 한국지능정보사회진흥원(NIA)과 한국어 언어모델(LLM) 성능을 비교·평가하는 리더보드를 만든다.

업스테이지는 NIA와 한국어 LLM 리더보드 '오픈 Ko-LLM 리더보드'를 구축한다고 25일 밝혔다. 운영은 27일부터 시작한다. 

오픈 Ko-LLM 리더보드는 누구나 자신이 만든 한국어 LLM 모델을 등록하고 다른 모델과 경쟁할 수 있는 공개 플랫폼이다. 해당 리더보드에 관심 있는 연구자들은 27일 이후 허깅페이스 오픈 Ko-LLM 리더보드 스페이스에서 자세한 정보를 확인하고 참여할 수 있다.

허깅페이스 오픈 Ko-LLM 리더보드 스페이스 화면. (사진=업스테이지)

이 리더보드는 허깅페이스가 운영하는 오픈LLM 리더보드 한국어판이다. 업스테이지와 NIA가 한국어 데이터 특성과 문화를 반영해 만들었다.

상식을 생성하는 능력을 살펴보는 ‘상식생성’ 기준도 추가했다. 한국어 LLM의 높은 성능과 다양성을 평가할 수 있기 위해서다. 상식생성은 업스테이지가 고려대 임희석 교수 연구진과 협업으로 구축한 데이터셋이다. 역사 왜곡, 환각 오류, 형태소 오류, 불규칙 활용 오류, 혐오 표현 등에 대한 유형을 포함한 질문지로 이뤄졌다. 이를 통해 AI가 주어진 조건에 대해서 만들어 낸 결과물이 한국어 사용자라면 지닐 수 있는 일반 상식에 부합할 수 있는지를 측정한다.

관련기사

이번 리더보드 개설에는 최근 발표된 업스테이지와 KT의 협업도 한몫 했다. AI 생태계 확대에 양사가 힘을 합쳐 KT 클라우드의 인프라 지원을 통해 리더보드가 안정적으로 운영될 예정이다.

김성훈 업스테이지 대표는 "업스테이지가 NIA와 함께 한국어 LLM 경쟁력을 증진하고 연구 수준을 더욱 높일 수 있는 오픈 Ko-LLM 리더보드를 개설해 무척 기쁘다"며 "앞으로 1T클럽을 포함한 고품질 한국어 데이터 공유는 물론, 리더보드를 통한 협업 촉진과 빠른 기술 전파 등을 통해 한국 AI 생태계를 넓히고 발전을 증진시킬 수 있도록 더욱 노력할 것"이라고 밝혔다.