SKT, GPT-3 수준 한국어 AI 모델 만든다

SK텔레콤(대표 박정호)은 7일 국립국어원과 업무 협약을 맺고 국립국어원의 언어 정보를 활용하여 한국어에 최적화된 차세대 인공지능(AI) 언어 모델 개발에 나선다고 밝혔다.

오픈AI가 개발한 영어 기반 언어모델 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(GLM)로 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현한다는 계획이다.

GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어활동에 적용될 수 있다. 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대된다.

SK텔레콤이 개발하는 GLM은 1천500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다.

GPT-3가 1천750억개의 매개변수를 가지고 있어 GPT-2보다 100배 이상 크고, 보다 높은 정확도와 넓은 활용도를 갖고 있는 점을 고려하면 GLM은 한국어 AI 언어 모델의 최고 수준에 이를 것으로 보인다.

SK텔레콤은 올해 말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이다. 또한 한국어 언어모델 성능 평가 방법 개발과 한국어 데이터 품질 평가 연구도 추진할 예정이다.

이와 함께 국립국어원은 올해 국어 정보처리 시스템 경진대회를 SK텔레콤 AI 언어 모델을 활용해 AI의 언어소통 능력을 겨루는 방식으로 개편해 한글 주간에 개최하기로 했다.

관련기사