NC AI, 산업 맞춤형 AI '배키' 공개…글로벌 SOTA급 성능·한국어 최적화

토큰 학습·MoE 아키텍처로 효율 극대화…메타 'Llama4 Scout' 대비 1.9배 성능 우위

컴퓨팅입력 :2026/01/08 11:32

NC AI가 대한민국 주력 산업의 AI 전환(AX)을 가속하기 위해 확장 가능한 멀티모달 생성용 파운데이션 모델을 선보였다. 

NC AI는 멀티모달 생성용 파운데이션 모델 '배키(VAETKI)'를 공개했다고 8일 밝혔다. '배키'는 'Vertical AI Engine for Transformation of Key Industries' 약자로, 국내 산업현장에 최적화된 소버린 AI를 지향한다.

NC AI의 자체 성능평가 결과 배키 100B 모델은 오픈AI 'GPT OSS', 메타 '라마(Llama)' 등 현존하는 글로벌 SOTA(최고 성능) 오픈소스 모델과 비교해 대등하거나 이를 상회하는 성능을 기록하며 기술적 완성도를 높였다.

NC AI의 멀티모달 파운데이션 모델 배키 (사진=NC AI)

배키는 10조 토큰의 방대한 코퍼스를 바탕으로 학습됐다. 특히 토크나이저 어휘의 20%를 한국어에 할당하고 고어까지 처리 가능한 한글 조합 기능을 포함했다. 이를 통해 유사한 파라미터 규모를 가진 GPT-OSS-120B 시리즈와 한국어 주요 벤치마크 3종에서 평균 101% 우세한 성능을 기록했다.

한국어 외 글로벌 주요 벤치마크 지표 평균에서도 메타의 '라마4 스카우트(Llama4 Scout)' 대비 약 1.9배에 달하는 성능 우위를 점했다. 지시 이행 능력(IFeval)에서 265%, 박사 수준 추론능력(HLE) 영역에서 137% 성능 수치를 기록했다.

배키는 산업 확산을 위한 '효율성'과 '확장 가능성'을 강점으로 한다. 배키는 모델 크기를 키우면서도 운영 효율성을 극대화하기 위해 혼합 전문가(MoE) 아키텍처를 도입했다.

배키 벤치마크 결과 (사진=NC AI)

차세대 어텐션 기술인 MLA(Multi-Latent Attention)와 국소-전역 인터리빙(Local-Global Interleaving) 기법을 결합해 기존 방식 대비 KV 캐시 메모리 사용량도 약 83% 절감했다. 대규모 AI 도입을 검토하는 기업들 인프라 운영 부담을 낮춘 셈이다.

관련기사

또 모델이 답변에 도달하는 논리적 과정을 보여주는 '싱크(think) 구조'를 채택해 국방, 제조, 금융 등 높은 신뢰도가 요구되는 분야의 의사결정 지원에 최적화했다.

이연수 NC AI 대표는 "배키는 단순히 글로벌 기술을 따라잡는 것을 넘어, 대한민국 주력 산업이 AI를 무기 삼아 글로벌 시장을 선도하게 만드는 전략적 자산이 될 것"이라며 "독자적인 도메인 옵스 기술력을 바탕으로 산업 현장에서 실제 가치를 창출하는 소버린 AI 생태계를 구축하겠다"고 말했다.