[유미's 픽] 업스테이지 中 모델 도용 논란 가열…'국대 AI' 검증 기준 시험대

정부 독자 AI 프로젝트 검증 기준 재정립 필요성 부상…'프롬 스크래치' 기준 구체화 필요

컴퓨팅입력 :2026/01/02 13:28    수정: 2026/01/02 14:52

정부에서 추진 중인 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참가한 업스테이지의 중국 모델 도용·파생 의혹이 제기된 후 논쟁이 기술 공방과 검증 기준 논의로 확대되고 있다. 이번 사안이 업스테이지를 넘어 이번 프로젝트 '정예 5팀'에 선발된 경쟁사들에게도 영향을 미칠지 주목된다.

2일 업계에 따르면 업스테이지는 이날 오후 3시 서울 강남역 인근에서 '솔라 오픈 100B'의 개발 과정 전반을 검증하는 공식 행사를 진행할 예정이다. 이 자리에는 김성훈 업스테이지 대표와 이번 모델 개발에 참여한 관계자, 참석을 희망한 70여 명의 업계 전문가들이 참석할 예정이다. 업스테이지 측은 '솔라 오픈 100B'의 중국 모델 표절을 주장한 고석현 사이오닉에이아이 대표도 공개적으로 초청했다.

김성훈 업스테이지 대표 (사진=지디넷코리아 DB)

이번 일은 고 대표가 지난 1일 깃허브를 통해 업스테이지의 '솔라 오픈 100B'의 기술 분석 보고서를 공개한 것이 발단이 됐다. '솔라 오픈 100B'는 지난 달 30일 업스테이지가 '독자 AI 파운데이션 모델' 1차 성과 발표회에서 공개한 모델이다.

고 대표는 '솔라 오픈 100B'가 중국 지푸AI의 'GLM-4.5-에어(Air)' 모델에 기반을 둔 파생 모델이라고 의혹을 제기하며 유감을 표했다. '독자 AI 파운데이션 모델' 프로젝트가 우리나라 AI 주권 확립을 위한 국가대표 AI 선발전인 데다 '프롬 스크래치(100% 독자 개발)' 준수가 공식 참여 조건으로 명시돼 있어서다. 이번 의혹이 사실일 경우 업스테이지는 자격 미달로 5개 팀 중 첫 탈락 1순위에 오르게 된다.

이에 업스테이지는 공개 검증회를 곧바로 열어 논란 잠재우기에 나섰다. 특히 이번에 학습에 사용한 중간 체크포인트(checkpoint)와 AI 모델 학습 과정과 실험 결과를 기록·관리하는 도구인 '웨이츠 앤 바이어시스(Weights & Biases·wandb)'를 모두 공개한다고 밝히는 초강수를 뒀다. '웨이츠 앤 바이어시스'는 블랙박스와 유사한 것으로, 로그 누락·사후 조작이 힘든 것으로 알려졌다.

'프롬 스크래치' 공방 본격화…'가중치 유사성'이 쟁점

이번에 고 대표가 제기한 의혹의 핵심은 두 모델의 가중치 구조 유사성이다. 그는 공개한 보고서를 통해 '솔라 오픈 100B'와 'GLM-4.5-에어'의 레이어별 파라미터를 비교한 결과, 신경망 구성 요소 중 하나인 레이어놈(LayerNorm)에서 매우 높은 수준의 유사도가 관측됐다고 주장했다. 또 이를 근거로 프롬 스크래치 방식으로 학습된 모델이라면 나타나기 어려운 수치라며 중국 모델을 기반으로 일부 가중치를 보존한 파생 모델일 가능성을 제기했다.

고 대표는 '솔라 오픈 100B'의 구동 코드 일부에서 GLM 모델과 동일한 설정 코드가 발견됐다고도 주장했다. 특히 'GLM-4.5-에어'가 46개 레이어 구조를 갖는 모델임에도 48개 레이어 구조인 '솔라 오픈 100B'의 코드에 GLM 전용 레이어 예외 처리 구문이 남아 있다는 점을 문제 삼았다. 여기에 논란이 제기된 이후 깃허브 저장소의 라이선스 파일에 중국 지푸AI 관련 저작권 문구가 병기된 점 역시 의혹을 키우는 대목으로 지목했다.

고석현 사이오닉에이아이 대표가 자신의 페이스북에 '솔라 오픈 100B'에 대한 의혹을 제기했다. (사진=고석현 사이오닉에이아이 대표 페이스북 캡처)

업스테이지는 이러한 주장에 대해 "기술적 사실과 다르다"며 정면 반박하고 있다. 회사 측은 레이어놈 유사성만으로 모델 파생 여부를 단정하는 것은 무리가 있고, 코드 내 일부 유사한 표현 역시 오픈소스 생태계에서 통용되는 관행이나 호환성 확보 과정에서 발생할 수 있는 문제라는 입장이다. 라이선스 표기 변경에 대해서도 법적 검토 과정에서의 정비 차원이라는 설명이다.

도용 단정은 이르다…업계 "종합 검증 필요"

업계와 학계에서는 이번 논쟁을 둘러싸고 신중론이 동시에 제기되고 있다. 레이어놈 파라미터는 초기값과 학습 특성상 구조와 학습 목표가 유사한 대규모 언어모델에서 높은 유사도가 나타날 수 있어 단일 지표만으로 도용 여부를 판단하기는 어렵다는 지적이다. 실제 도용 여부를 가리려면 어텐션의 Q·K·V 가중치나 레이어 전반의 구조적 일치 여부, 학습 경로에 대한 종합적인 검증이 필요하다는 의견도 나온다.

또 업계에선 고석현 대표의 문제 제기에 대해 단일 지표만으로 도용 여부를 단정하는 데에는 한계가 있다는 다수 의견도 나오고 있다. 특히 이승현 포티투마루 부사장은 사이오닉에이아이의 분석이 기술적으로 충분한 근거를 갖췄는지에 대해 의문을 제기하며, 현재 공개된 자료를 토대로 업스테이지의 '프롬 스크래치' 주장에 더 무게를 두는 모습을 보였다.

이 부사장은 "프롬 스크래치 여부는 모델 가중치가 어떻게 형성됐는지에 관한 기술적 문제로, 라이선스 표기나 소버린 AI 논의는 별도의 정책적 판단 영역"이라며 "레이어놈이나 임베딩과 같은 보조 파라미터의 유사성은 구조와 학습 목표가 유사한 대규모 언어모델(LLM)에서 통계적으로 나타날 수 있다"고 말했다.

김성훈 업스테이지 대표가 2일 오후 3시 강남역 인근에서 '솔라 오픈 100B' 공개 검증을 할 것이라고 예고했다. (사진=지디넷코리아 DB)

이에 고석현 대표 역시 이날 또 다른 게시글을 통해 기술적 유사성 문제와 별도로 이번 사안을 소버린 AI 관점에서 바라봐야 한다는 입장을 강조하며 업스테이지 논란에서 한 발 물러서는 모습을 보였다. 그는 해외, 특히 중국 모델의 코드와 구조를 적극적으로 학습·참고하는 방식이 정부 주도의 독자 AI 파운데이션 모델 사업 취지에 부합하는지에 대한 근본적인 질문을 던지며 기술적 도용 여부와는 별개로 정책적 기준에 대한 논의가 필요하다고 주장했다.

업스테이지 논란, 다른 정예 5팀에도 '설명 책임' 부담

일각에선 이번 사안이 업스테이지 한 곳에 그치지 않고 독자 AI 파운데이션 모델 프로젝트에 참여 중인 다른 '정예 5팀'에도 적잖은 영향을 미칠 수 있다는 관측이 나온다. LG AI연구원, 네이버클라우드, NC AI, SK텔레콤 등 다른 참여 기업들 역시 향후 모델 공개 과정에서 개발 경로와 외부 모델 활용 여부, 프롬 스크래치의 정의에 대해 보다 명확한 설명을 요구받을 가능성이 커졌다는 평가다.

관련기사

정부의 대응에도 관심이 쏠린다. 현재 독자 AI 파운데이션 모델 프로젝트는 성능과 활용 가능성을 중심으로 평가가 이뤄져 왔지만, 이번 논란을 계기로 학습 경로와 개발 과정에 대한 검증 기준을 보다 구체화해야 한다는 목소리가 커지고 있다. 일각에서는 중간 체크포인트 제출이나 학습 로그 관리·보관 의무화 등 제도적 보완이 필요하다는 지적도 제기된다.

업계 관계자는 "이번 논쟁은 특정 기업의 공방을 넘어 독자 AI를 어떤 기준으로 검증할 것인지에 대한 시험대가 되고 있다"며 "업스테이지의 공개 검증 결과에 따라 다른 참여 기업들과 정부 역시 개발 투명성과 설명 책임의 수준을 다시 설정해야 할 상황에 놓일 수 있다"고 말했다.