SK텔레콤이 ‘독자 AI 파운데이션 모델 프로젝트’ 2단계 개발에 착수한 가운데 AI 모델 'A.X K1'을 옴니모달 모델로 확장한다. 언어모델에서 이미지와 음성 모델로 나아가겠다는 목표인데, 이를 통해 소버린AI를 확보할 수 있다는 의견이 나와 이목을 끈다.

김건희 서울대 컴퓨터공학부 교수는 22일 SK텔레콤 뉴스룸 기고문을 통해 "SK텔레콤 초거대 AI모델 'A.X K1'은 옴니모달 모델로의 진화를 계속해 나갈 것이며, 이는 디지털 주권을 넘어 물리적 인프라 주권까지 함께 강화하는 기반이 될 수 있다"고 강조했다.

김 교수는 "소버린 AI 개발을 위해선 국가 핵심 데이터 주권을 확보해야 하는데, 옴니모달이 이를 가능케 한다"고 말했다.

옴니모달 모델은 텍스트, 사진, 영상 등 시각 정보와 음성까지 아우른다. 외부 플랫폼에 의존하지 않고 국가, 공공, 산업 데이터를 직접 학습, 운영할 수 있다.

사진=SK텔레콤 뉴스룸

옴니모달 구현엔 기술적 과제가 남아있다. 김 교수는 실시간 상호작용이 필요한 음성 대화의 특성, 지나치게 긴 응답이 몰입도를 떨어뜨릴 수 있다는 점, 음성 기반 사용자 지시를 정확히 반영해야 하는 문제 등을 지적했다.

그러면서 "높은 성능의 언어모델을 갖추는 게 옴니모달 모델 개발의 핵심 요소"라고 설명했다.

나아가 "옴니모달 모델은 산업 전반을 하나의 모델로 연결할 수 있으며, 물리적 세계를 아우르는 실행형 AI로 진화해 나갈 것"이라며 "SK텔레콤이 추구하는 ‘모두의 AI’ 서비스의 실현 기반이 될 것"이라고 설명했다.

이 모델을 적용해 SK텔레콤은 천만 명 이상의 가입자를 보유한 에이닷 서비스 통화 요약을 비롯해 티맵, B tv 등에서 실시간 음성 대화를 지원할 수 있다.

또한 크래프톤 게임 AI에 핵심 기술로 활용돼, 사용자가 음성 대화를 통해 공동의 임무를 수행하는 새로운 플레이 경험도 구현할 수 있을 전망이다.

한편 김 교수는 컴퓨터 비전, 기계학습 등을 연구하며 지난해에 1 NeurIPS, 2 EMNLP, 2 ICCV 등 국제 권위 학술대회와 저널에 논문을 실었다.