중국 스타트업 딥시크(DeepSeek)가 'R1' 등 자체 개발한 인공지능(AI) 모델을 오픈소스로 공개하면서 논란이 일고 있다. AI모델의 코드와 가중치를 공개했지만, 학습 데이터와 훈련 과정은 비공개이기 때문이다.
이에 일부 개발자들은 '오픈소스'라고 부르기에 부족하다는 비판에 나섰다. AI오픈소스 커뮤니티인 허깅페이스 측은 R1의 숨겨진 요소를 모두 분석해 재구축하는 '오픈-R1(Open-R1)'를 진행 중이기도 하다.
문제는 구글과 메타 등 빅테크 기업 역시 이런 논란에서 자유롭지 않아 관련 업계에서 '오픈소스'라는 용어가 마케팅 도구로 전락하는 것 아니냐는 '오픈워싱(Openwashing)'에 대한 우려의 목소리가 나오고 있다.
![](https://image.zdnet.co.kr/2025/02/05/4a00fc47a5387a2671dbfb2a178623de.png)
7일 업계에 따르면 최근 AI 오픈소스의 정의와 방향에 대해 기업과 사용자간 논쟁이 치열하게 일고 있다.
오픈소스 생태계 위협하는 오픈워싱
AI 모델을 '오픈소스'로 공개하는 것은 연구자들과 개발자들이 자유롭게 활용하고 발전시킬 수 있도록 하기 위한 취지다. 그러나 최근 많은 기업들이 핵심 기술을 비공개로 유지한 채 '부분적 개방'만을 내세우고 있다.
해당 논란이 거세지는 이유는 오픈소스 철학의 핵심인 개방성과 투명성이 훼손되며 개발 생태계를 악화시킨다는 지적이다. 이로 인해 오픈소스 AI의 의미와 방향을 둘러싼 논쟁은 단순한 기술적 논의에서 벗어나, AI 생태계 전체의 구조를 결정하는 중요한 요소로 자리 잡고 있다.
AI 발전 과정에서 오픈소스는 중요한 역할을 해왔다. 초기 AI 연구자들은 개방된 모델과 데이터를 활용해 기술을 발전시키고 협업을 통해 새로운 혁신을 이끌어냈다.
![](https://image.zdnet.co.kr/2020/03/10/haeunsion_TpjYzMfuuz.jpg)
대표적으로 구글과 메타 같은 기업들은 AI 연구에 필수적인 오픈소스 프레임워크와 모델을 공개하면서 생태계를 확장했다.
구글은 2015년 텐서플로를 공개해 AI 연구 및 개발의 표준을 만들었고, 2014년에는 쿠버네티스(Kubernetes)를 통해 클라우드 환경에서 AI 모델을 효율적으로 운영할 수 있도록 했다.
메타 역시 AI 오픈소스를 적극적으로 활용한 기업으로 꼽힌다. 2016년 공개한 파이토치(PyTorch)는 현재 가장 널리 사용되는 AI 개발 프레임워크 중 하나다. 2022년에는 리눅스 재단 산하 파이토치 재단으로 이관해 커뮤니티 주도의 발전을 지원하고 있다.
오픈소스 생태계 이끌어온 빅테크의 달라진 행보
하지만 이렇게 AI오픈소스 생태계를 이끌어온 기업들이 본격적인 AI모델 출시와 함께 행보가 달라지고 있다.
구글은 젬마(Gemma)라는 AI 모델을 공개했지만, 학습 데이터와 훈련 코드는 공개하지 않고 있다. 또 구글의 AI전용 프로세서인 TPU에 최적화돼 특정 클라우드 종속성을 강화하는 방식으로 운영되고 있다.
메타도 라마를 오픈소스로 제공하고 있다고 밝혔지만 훈련 데이터와 세부 알고리즘은 비공개로 유지하고 있는 추세다.
![](https://image.zdnet.co.kr/2024/11/06/82adf9a8b2a8c4939149c2343053ba79.jpg)
이에 비영리 오픈소스 표준화 단체인 오픈소스 이니셔티브(OSI) 측은 '오픈소스'란 용어를 사용해 사용자를 혼란스럽게 하고 오픈소스를 오염시켰다며 강도 높게 비판했다.
AI 오픈소스 커뮤니티인 허깅페이스도 오픈워싱 논란에 대해 비판적인 입장을 보이고 있다. 클레망 들랑브 최고경영자(CEO)는 AI 기업들이 오픈 모델이라는 용어를 남용하고 있으며, 진정한 오픈소스 AI는 학습 데이터와 훈련 과정까지 포함돼야 한다고 주장했다.
기술경쟁 심화된 AI, 기술 보호 중요성 커저
AI 오픈소스 생태계를 적극적으로 지원하며 생태계를 주도하던 기업들이 점점 폐쇄적인 방향으로 돌아서고 있는 이유는 AI 기술 경쟁이 심화되면서 '기술 보호'가 더 중요한 요소로 떠올랐기 때문이다.
오픈AI가 GPT-2까지는 공개했지만, GPT-3부터 모델을 비공개로 운영하며 API 기반 서비스로 전환한 것은 대표적인 사례다. 오픈AI는 학습 데이터와 훈련 알고리즘을 비공개로 유지하면서도 GPT 기반의 유료 API 서비스를 제공하며 AI 생태계를 선점하는 전략을 택했다. 마이크로소프트의 대규모 투자 이후 GPT-4는 완전히 비공개 모델이 됐다.
![](https://image.zdnet.co.kr/2020/06/15/firstblood_cTo0O89mE.jpg)
오픈AI 역시 연구 초기에는 'AI 기술을 모두에게 개방한다'는 비전을 내세웠지만, AI 기술이 상업화되면서 기업 중심의 폐쇄적인 운영 방식을 선택했다.
구글과 메타는 기술보호와 함께 AI 클라우드 서비스와의 연계를 강화하는 전략적 요소가 더 강해졌다. 막대한 비용이 소비되는 AI 연구 비용 지출을 클라우드 서비스와의 결합을 통해 완화할 수 있기 때문이다.
AI 모델의 훈련과 운영에는 막대한 비용이 소요된다. GPT-4의 훈련 비용은 수억 달러(수천억원)로 추정되며, 기업이 AI 모델을 공개하면 경쟁사들이 해당 모델을 무료로 사용할 가능성이 높아진다.
이에 따라 기업은 비용을 부담하고 연구한 기술을 다른 기업들이 쉽게 복제해 경쟁력을 갖출 수 있게 된다. 이런 이유로 AI 기업들은 오픈소스보다는 '부분적 공개' 또는 '제한된 라이선스' 전략을 선택하는 추세다.
특히 딥시크 사례는 AI 모델이 공개되지 않아도 충분히 복제될 수 있다는 가능성을 보여줬다. 이에 따라 기업들은 AI 모델을 더욱 폐쇄적으로 운영할 가능성이 높아졌으며, AI 오픈소스 시장 자체가 위축될 가능성이 커진다는 지적이다.
모두 공개보다 제한적 공개로 전환할 가능성 높아진 빅테크
AI 모델을 오픈한다는 것이 곧바로 기술 공유를 의미하지 않는다는 점이 분명해지면서, AI 기업들은 '어떤 부분을 공개할 것인가'에 대한 전략적 판단을 더욱 신중하게 내릴 것으로 보인다.
특히 관련 업계에선 AI 모델의 소스코드가 모두 공개되지 않아도 복제될 수 있다는 점이 확인되면서, 기업들은 오픈소스 전략을 제한적으로 운영할 가능성이 높을 것이란 전망이다.
이러한 흐름에 따라 최근 샘 알트먼 오픈AI CEO가 발언도 오픈워싱 전략이 포함된 것이란 해석이 제기되고 있다.
![](https://image.zdnet.co.kr/2025/02/04/0ddcf468c68c412e78f1370708ae8f43.png)
최근 샘 알트먼은 레딧에서 진행한 '무엇이든 물어보세요(AMA)' 코너에서 딥시크의 부상을 보며 현재 오픈소스 전략이 잘못된 것 같다며 더 개방적인 방향을 고려할 것이라고 밝힌 바 있다.
하지만 완전한 오픈소스로 전환할 경우 오픈AI의 수익 모델에 악영향을 미칠 가능성이 있고 1위를 유지하고 있는 상황에서 굳이 경쟁자에게 최신 기술을 공유할 이유가 없다는 분석이다.
국내 한 AI전문가는 "현재 오픈AI의 AI모델이 가장 좋은 성능을 보유한 것은 알려져 있지만 자세한 정보를 공개하고 있지 않아 기업들과 개발자들의 불만이 큰 상황"이라며 "이런 불만을 잠재우고 여론을 돌리기 위해서라도 긍정적인 발언을 할 필요가 있었을 것"이라고 분석했다.
AI 오픈소스 이끌 것으로 주목 받는 AI스타트업
![](https://image.zdnet.co.kr/2024/02/27/646af24d8bada9828985d99339848dda.jpg)
다만 딥시크를 비롯해 미스트랄 등 AI스타트업을 중심으로 AI 오픈소스 생태계가 변화할 것이란 전망도 나온다.
AI모델을 오픈소스로 공개하면 누구나 부담 없이 활용할 수 있을 뿐 아니라 외부 개발자들의 기여를 통해 개발 비용을 줄이고, 모델 개선 속도를 높일 수 있다는 장점이 있다.
또 오픈소스 프로젝트에 적극적으로 참여하는 AI 분야의 우수한 인재를 자연스럽게 확보하며 개발 생태계를 구축 가능하다. 더불어 개방적이고 투명한 AI 생태계를 지향하며 기존 AI기업과 차별화된 브랜드 이미지를 확보할 수 있다.
관련기사
- '정보유출 우려' 현대차그룹, 中 딥시크 사용 제한2025.02.07
- "오픈AI 넘사벽 아니더라...韓서 딥시크 수준 만들 수 있다"2025.02.06
- 구글, '제미나이 2.0' 출시…생성형 AI 시장 재편 나선다2025.02.06
- 딥노이드, '딥시크 R1'으로 자체 생성형AI 모델 업그레이드2025.02.05
구글과 메타 역시 이러한 전략을 바탕으로 클라우드를 비롯해 웹브라우저, 가상현실(VR), 데이터 인프라스트럭처 등의 분야에서 안정적인 생태계를 구축한 바 있다.
한 AI 전문가는 "미스트랄이나 딥시크가 오픈소스로 공개되면서 오픈AI와 비교되며 관심을 끌고 있지, 기술독점 방식이었다면 지금 같은 반응은 끌어내지 못했을 것"이라며 "앞으로의 AI 시장은 자본과 인프라를 앞세운 빅테크와 오픈소스를 강조하는 스타트업 간의 경쟁 구도가 될 것으로 예상된다"고 전망했다.