한국전자통신연구원(ETRI)이 엔씨(NC) AI 컨소시엄에 참여해 추진 중인 과학기술정보통신부 독자 AI 파운데이션 모델 개발 사업의 밑그림을 처음 공개했다.

이 사업은 지난 8월부터 시작됐다.

과제는 ‘산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발’이다.

ETRI 연구진이 음성/시각 정보 기반의 멀티모달 교감 대화 시스템을 시연 중이다.

산업 현장에서 활용 가능한 대규모 인공지능 모델을 자체 기술로 구현하기 위한 핵심 프로젝트로, 대규모 언어모델(LLM)과 멀티모달 AI 기술을 독자적으로 확보해 산업·공공·학술 등 전 분야에 걸쳐 활용할 수 있는 기반 기술을 육성하는 것이 목표다.

ETRI측은 "산업 현장 중심의 적용성을 확보함으로써 향후 제조·의료·교육·문화 등 주요 산업 전반의 AI 혁신을 가속화할 것"이라며 "독자 기술 기반 초거대 AI 모델 개발의 국내 기술 자립화를 견인할 것"으로 기대했다.

현재 ETRI는 한국지능정보사회진흥원(NIA) 데이터 지원과 정보통신산업진흥원(NIPA) GPU 자원 지원을 기반으로 대규모 모델 개발에 필요한 안정적 연구 인프라를 구축했다.

ETRI 지능정보연구본부는 이번 연구에 그간 수행해 온 자체 국책과제의 핵심 기술을 적극 접목하고 있다. 현재 총 3개 연구실이 모여 100B(1,000억 매개변수)급 모델 사전학습을 진행 중이다.

언어지능연구실은 그동안 ‘복합인공지능 원천기술 연구’를 통해 개발한 언어모델 ‘Eagle(이글)’의 개념적 이해 및 추론 능력, ‘생성형 언어모델의 최신성 학습 기술’의 희소 어댑터(sparse adapter) 기반 지속학습 기술을 대규모 모델에 적용해 모델의 최신성과 효율성을 확보할 계획이다.

체화복합지능연구실은 ‘퇴행성 뇌기능 저하 평가 기술’과 ‘다화자 대화 모델링 기술’등 기존 연구성과를 토대로 음성·영상 중심의 멀티모달 AI 모델을 개발 중이다. 궁극적으로 이를 범용 파운데이션 모델로 확장할 계획이다.

시각지능연구실 또한 텍스트 기반 이미지 생성 모델 ‘KOALA(코알라)’, 시각언어 질의응답 모델 ‘Ko-LLaVA(코라바)’등을 통해 축적한 기술을 바탕으로 비전-언어 융합 생성 성능과 AI 안전성을 동시에 강화하는 연구를 진행 중이다.

ETRI는 현재 기술개발–대규모 사전학습–산업 실증으로 이어지는 로드맵을 단계적으로 추진 중이다.

ETRI 연구진이 산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발에 관해 논의하는 모습.

과제책임자인 권오욱 지능정보연구본부장은 “ETRI가 정부출연연구원 중 유일하게 국가대표 연구팀으로 선정된 이후, 초기의 자원 확보 난관을 극복하고 100B급 모델 사전학습을 안정적으로 수행하고 있다"고 말했다.

권 본부장은 또 "NC AI 컨소시엄과의 긴밀한 협력을 통해 산업 AI 전환을 이끄는 확장 가능하고 신뢰성 높은 멀티모달 파운데이션 모델을 개발해 글로벌 최고 수준의 기술력 확보에 기여할 것"이라고 덧붙였다.