한국형 챗GPT 무료 출시하는 정부, 독자 AI 검증 체계 개발한다

정부가 국산 인공지능(AI) 모델의 성능과 안전성을 검증할 평가 체계를 마련하는 것으로 확인됐다. 국가대표 AI라 불리는 '독자 AI 파운데이션 모델(독파모)' 프로젝트를 기반으로 한국형 챗GPT인 '모두의 AI'를 연내 선보이는 만큼 이들 모델의 실력을 독립적으로 가늠할 잣대를 갖추겠다는 구상이다.

1일 정보기술(IT)업계에 따르면 한국지능정보사회진흥원(NIA)은 지난달 말 '2026년 벤치마크 데이터 활용 AI 모델 평가 지원' 사업 발주를 위한 사전규격 공개에 나섰다. 3억 4800만원 규모로 오는 12월까지 진행되는 이 사업은 벤치마크 데이터로 AI 파운데이션 모델 성능과 안전성을 정밀 측정하는 객관·독립 평가·검증 체계를 구축하는 것이 핵심이다.

평가 방식은 객관식과 단답형을 넘어 서술형 응답까지 자동 채점하는 데 초점을 맞췄다. 복수의 '평가형 LLM(LLM-as-a-Judge)'를 동원해 채점 기준 기반의 정성 평가를 자동화한다. 기업이 자사 로컬 환경에서 같은 방식으로 평가받도록 지원하고 그 결과를 NIA 'K-AI 리더보드'에 반영한다.

2026년 벤치마크 데이터 활용 AI 모델 평가 지원 사업제안요청서 갈무리 (사진=NIA)

NIA는 이번 사업이 과학기술정보통신부 주도로 진행 중인 독파모 프로젝트와 '월드 베스트 LLM 데이터 활용 지원' 사업의 일환이라고 명시했다. 이에 따라 독파모 수행기관으로 최종 선정된 기관은 평가 지원 사업에 참여할 수 없다. 평가하는 쪽과 평가받는 쪽을 분리해 검증의 독립성을 담보하려는 장치다.

독파모 프로젝트는 단계별 평가로 팀을 추려내는 경쟁형 압축 방식이다. 올해 초 1차 단계평가에서는 대상 5개 기업이 세계적 성능 지표 기준치를 모두 통과했다. LG AI연구원·SK텔레콤·업스테이지·모티프테크놀로지스 등 4개 정예팀이 오는 8월 2차 평가를 받을 예정이다. 이어 올 연말 3차 평가를 기점으로 최종 2곳만 살아남는다.

정부는 2차 평가에 나서는 8월 독파모를 오픈소스로 공개하고 이 모델을 기반으로 만든 모두의 AI를 이르면 오는 11월 무료로 출시한다. 챗GPT 같은 범용 AI 챗봇 형태 서비스로 전 국민이 AI 에이전트를 활용할 수 있게 적극 돕는다는 취지다. 정부는 AI를 활용하기 어려운 노년층과 소외계층을 위한 특화 모델 서비스도 제공할 계획이다.