정부가 특정 전문 분야에서 '세계 최고' 인공지능(AI) 파운데이션 모델을 확보해 글로벌 기술 패권 경쟁에 본격 뛰어든다.

과학기술정보통신부와 정보통신산업진흥원은 15일 서울 엘타워에서 사업설명회를 개최했다. 현장에는 삼성SDS, 마키나락스, 와이즈넛, 딥노이드 등 비롯해 기존 '국가대표 AI' 프로젝트에서 최종 사업자로 선정되지 못한 모티프테크놀로지스와 코난테크놀로지, 루닛, KT, 카카오, 사이오닉AI 등의 관계자들이 참여해 눈길을 끌었다.

이날 양 부처는 '인공지능 특화 파운데이션 모델 프로젝트' 참여팀 사업 공모에 대해 설명하며 참여를 원하는 국내 AI 기업과 대학 연구기관은 다음 달 13일 오후 3시까지 지원을 마쳐야 한다는 점을 밝혔다.

특화 파운데이션 모델 사업설명회 (사진=장유미 기자)

이번 프로젝트의 핵심 지원 내용은 최신 그래픽 처리장치(GPU) 컴퓨팅 자원이다. 정부는 최종 선정될 2개 팀에 각각 엔비디아의 'B200' GPU 256장을 제공한다. 인력이나 데이터 등 다른 형태의 지원은 없으며 오직 GPU 인프라만 현물로 지원하는 방식이다.

특히 이번 사업은 정부가 지원하는 GPU 자원의 가치에 상응하는 민간 부담금 편성을 의무화했다. 참여 기관은 기업 규모와 개발 모델의 오픈소스 공개 여부에 따라 차등적으로 책정된 비용을 현금과 현물로 부담해야 한다.

과기정통부 "목표는 세계 1등…독자AI 주도 기업은 주관 불가"

이날 발표에 나선 장기철 과학기술정보통신부 과장은 이번 사업의 목표가 '세계 최고' 수준의 특화 모델 확보에 있다고 못 박았다. 기존 '독자 AI 파운데이션 모델' 사업이 글로벌 표준의 95% 이상 성능을 목표했다면 이번 프로젝트는 특정 전문 분야에서만큼은 세계 1등을 차지하겠다는 구상이다.

과기정통부는 이번 사업이 단순 서비스 개발이 아닌 '파운데이션 모델' 개발 자체에 초점을 맞춘다는 점을 명확히 했다.

장 과장은 "기존 모델을 일부 조정하는 '파인튜닝' 방식은 지원 대상이 아니다"며 "처음부터 모델을 설계하거나 기존 범용 모델에 대규모 데이터를 사전학습 시키는 방식만 가능하다"고 설명했다. 이어 "구글의 단백질 구조 예측 모델 '알파폴드'나 법률 금융 특화 모델이 대표적인 예시"라고 설명했다.

더불어 과기정통부는 이번 특화 파운데이션 프로젝트의 사업 방식이 AI의 고질적인 '환각(Hallucination, 허위 정보 생성)' 오류를 최소화하는 데 효과적이라고 강조했다.

장 과장은 "특정 분야에 쓰이는 만큼 낮은 환각 발생 가능성이 중요하다"며 "사전학습 단계부터 정제된 고품질 데이터로 학습하는 '프롬스크래치' 방식이 높은 신뢰성과 정확도를 담보한다"고 설명했다. 이어 "이는 치명적 오류가 발생해서는 안 되는 전문 분야에서 세계 최고 수준의 모델을 만들겠다는 사업 목표와 직결된다"고 설명했다.

장기철 과기정통부 과장 (사진=조이환 기자)

참여 자격에도 파격적인 조건을 내걸었다. 먼저 기존 독자 AI 모델 사업에 주관기관으로 참여 중인 네이버, SK텔레콤, LG AI연구원, NC AI, 업스테이지 등 5개사는 이번 사업의 주관기관으로 참여할 수 없다. 장 과장은 역량이 분산되는 것을 막기 위한 조치라고 설명했다.

또 대기업은 주관이 아닌 참여기관으로만 함께할 수 있다. 더불어 '대학의 필수 참여'를 의무화했다. 산업계의 엔지니어링 역량과 학계의 연구 역량을 결합하고 학생들이 대규모 GPU 자원을 다뤄보는 경험을 쌓게 하려는 취지다.

정부는 참가팀에게 개발 분야나 목표 성능치, 서비스 종류 등을 자율적으로 제시하도록 완전한 자율성을 부여했다. 대신 개발된 모델은 오픈소스로 공개해 국내 AI 생태계 전반에 기여해야 한다. 프로젝트는 5개월 단위의 2단계로 진행되며 중간 평가에서 목표를 달성하지 못한 팀은 탈락할 수 있다.

장 과장은 "서바이벌을 의도한 것은 아니다"면서도 "자체적으로 설정한 목표를 달성하지 못하면 2단계 지원은 없을 수 있다"고 밝혔다.

NIPA "GPU 장당 월 660만원 가치…수준 따라 자부담 차등"

이어 발표를 맡은 박일준 정보통신산업진흥원(NIPA) 팀장은 사업의 구체적인 지원 조건과 사업비 산정 방식을 공개했다. 핵심은 민간 부담금의 규모와 산정 기준이다. NIPA는 이번에 지원하는 엔비디아 'B200' GPU 한 장의 한 달 사용 가치를 660만원으로 책정했다.

총 사업 기간은 오는 11월부터 내년 9월까지 약 10개월이다. 내년 3월까지 1단계를 수행한 뒤 단계 평가를 거쳐 2단계 지원 여부가 결정된다. 2단계는 내년 4월부터 9월까지 진행된다.

참여 기업은 이를 기준으로 민간 부담금을 계산해야 한다. 개발 모델을 상업용으로 사용하되 오픈소스로 공개할 경우 ▲대기업 10% ▲중견기업 6% ▲중소기업 5%의 부담 비율이 적용된다. 모델을 공개하지 않으면 부담 비율은 이보다 높아진다.

민간 부담금 중 현금 부담 비율도 정해졌다. 중소기업은 총 부담금의 10% 이상을 중견기업은 13% 이상을, 대기업은 15% 이상을 반드시 현금으로 마련해야 한다.

박 팀장은 "현물 부담은 참여 인력의 인건비와 유형 자산만 인정된다"며 "보유 데이터의 가치는 현물로 인정받을 수 없다"고 강조했다.

박일준 NIPA 팀장 (사진=조이환 기자)

데이터 확보의 책임은 전적으로 참여 기관에 있다. 박 팀장에 따르면 모델 개발에 필요한 데이터는 민간 부담으로 직접 구매하거나 자체 보유 데이터를 활용해야 한다. 컨소시엄 구성 시 데이터 보유 기업을 포함하는 것도 방법이다.

컨소시엄 구성에 대한 세부 지침도 공유됐다. 기업이나 연구기관은 하나의 컨소시엄에만 주관기관으로 참여할 수 있다. 대학의 경우 연구실 단위로 참여할 수 있으나 하나의 연구실이 두 개 이상의 컨소시엄에 중복으로 참여하는 것은 금지된다.

관련기사

NIPA는 평가 기준으로 ▲기술력 및 개발 경험 ▲개발 목표 ▲시장성 및 파급효과를 제시했다.

박 팀장은 "기존 시장의 최고 성능보다 낮은 목표를 제시하는 등 도전적이지 않은 과제는 좋은 평가를 받기 어렵다"며 "접수 마감 시간에 임박해 제출하면 오류가 발생할 수 있으니 최소 30분 전에는 전산 접수를 완료해달라"고 당부했다.