디노티시아, LLM 모델로 'AI 어시스턴트' 베타 테스트 실시

자체 개발한 '디엔에이' 모델, 허깅페이스에 오픈소스로 공개

반도체ㆍ디스플레이입력 :2024/12/10 09:22

인공지능(AI) 전문기업 디노티시아는 자체 개발한 고성능 대형언어모델(LLM) 파운데이션 모델 ‘디엔에이(DNA): Dnotitia AI’를 ‘허깅페이스(HuggingFace)’에 오픈소스로 공개했다고 10일 밝혔다.

또한 회사는 이를 바탕으로 생성형 AI 어시스턴트의 베타 테스트를 시작할 예정이다.

모델별 실제 사용성 성능 비교(사진=디노시티아)

DNA는 AI 성능 평가 벤치마크인 KMMLU, KoBest 등에서 평균 점수 기준으로 경쟁 모델을 뛰어넘는 성과를 거두며, 작은 모델 크기로도 고품질의 한국어 서비스를 제공할 수 있는 중요한 전환점을 마련했다. 또한 글로벌 벤치마크인 MMLU, GSM8K 등에서도 우수한 성능을 기록하며 디노티시아 모델의 전반적인 경쟁력을 입증했다.

이번 공개한 ‘DNA 1.0 8B Instruct’ 모델은 80억 개의 파라미터 규모로, Llama 아키텍처 기반의 이중언어 모델이다. 한국어 이해와 생성에 최적화된 이 모델은 영어 처리 능력도 갖추고 있으며, 고품질 한국어 데이터셋을 사용해 지속적 사전 학습(CPT)을 진행했다. 

또한 지도 학습 미세조정(SFT) 및 직접 선호 최적화(DPO)를 통해 자연스러운 대화 능력과 복잡한 지시를 따르는 수행 능력을 강화했다.

KMMLU 에서 인문학, 사회학, 과학·기술 등을 평가하는 한글, 영어 벤치마크 전반에서 디노티시아의 LLM 모델은 평균 점수 53.26점을 기록하며, 최근 발표한 LG엑사원3.5 (45.30점) 및 엔씨소프트 VARCO (38.49점), 알리바바 Qwen2 (45.66점), 야놀자 EEVE (42.17점) 등 주요 경쟁 모델을 능가하는 최고 성능을 달성했다. 

이는 단순히 일부 항목에서 우수한 결과를 낸 것이 아니라, 전반적인 성능에서 두각을 나타낸 결과로 더욱 주목받고 있다. 특히 디노티시아 모델은 다양한 벤치마크에서의 높은 정확도를 기록하며, 다방면에서의 실용성이 기대된다.

디노티시아는 ‘디엔에이’ 파운데이션 모델을 기반으로 생성형 AI 어시스턴트의 베타 테스트를 시작한다. 이 AI 어시스턴트는 한국 문화와 맥락을 깊이 이해하는 기능을 통해 한국 사용자들에게 특화된 서비스를 제공한다. 검색, 요약, 번역, 데이터 분석, 보고서 작성, 코딩 등 주요 LLM 서비스 기능을 모두 지원하며, 한국 사용자들에게 가장 적합한 AI 솔루션 제공을 목표로 하고 있다.

박상길 디노티시아 LLM 엔지니어링 팀장은 “최신 연구 논문을 기반으로 ‘지식 증류, 구형 선형보간(SLERP), 직접 선호 최적화(DPO)’ 등 고급 기법을 직접 구현하고 적용해 최고 수준의 모델 성능을 달성했다”며 “디노티시아의 뛰어난 인재들과 긴밀하게 협력하고 함께 노력한 덕분에 이러한 결과를 이룰 수 있어 매우 기쁘다”고 말했다.

관련기사

정무경 디노티시아 대표는 “이번 공개는 누구나 사용할 수 있는 고성능 LLM 모델을 제공하여 한국의 AI 기술 발전에 이바지하고자 하는 노력의 일환”이라며 “본 생성형 AI 어시스턴트 베타 테스트를 통한 사용자 피드백을 개인 및 엣지 LLM 디바이스, 니모스(Mnemos)에 적극 반영해 최상의 서비스를 제공할 계획”이라고 말했다.

디노티시아의 LLM 모델인 ‘디엔에이’는 허깅페이스에서 확인 가능하며, AI 어시스턴트 서비스 베타 테스트에 참여하고자 하는 사용자는 디노티시아 홈페이지에 게시된 안내문을 참고하여 신청할 수 있다.