가성비 인공지능(AI)으로 돌풍을 일으킨 중국의 스트타업 딥시크가 고성능을 유지하면서도 단일 그래픽처리장치(GPU)로 실행 가능한 새로운 추론 모델을 공개해 주목받고 있다.
30일 테크크런치 등 외신에 따르면 딥시크는 자사 대표 AI 모델 'R1'의 매개변수 크기를 줄인 '딥시크-R1-0528-큐원3-8B'를 출시했다.

이 모델은 80억 규모 매개변수를 갖춘 추론 모델로, 이달 알리바바가 공개한 큐원3 모델에 자체 생성한 합성 사전 학습 데이터와 고도화된 추론 알고리즘을 파인튜닝해 개발됐다.
딥시크는 이번 모델이 논리 추론과 수학적 사고 등 고차원 문제 해결 영역에서 구글과 마이크로소프트의 동급 모델을 능가하는 성능을 보인다고 주장했다.
딥시크 측에 따르면 딥시크-R1-0528-큐원3-8B는 수학 경시인 AIME 2025에서 구글의 '제니마이-2.5 플래시'보다 높은 문제 해결 능력을 보였다. 또 다른 수학 기술 테스트인 HMMT에서도 마이크로소프트가 최근 출시한 소규모 제품 '파이-4 플러스' 모델과 유사한 성능을 보인 것으로 조사됐다.
특히 딥시크-R1-0528-큐원3-8B는 일반 모델 대비 컴퓨팅 연산량이 훨씬 적다는 게 강점이다. 알리바바의 큐원 모델은 구동하기 위해 다량의 엔비디아 H100 그래픽처리장치(GPU)가 필요한 반면, 이번 출시된 딥시크 모델은 단일 GPU 환경에서도 작동하는 것으로 알려졌다.
관련기사
- "예전만 못하네"…'챗GPT' 위협하던 中 딥시크, 韓 이용률은 고작 0.56%?2025.05.11
- MS, 中 딥시크 퇴출…"정보유출·선동 위험 우려"2025.05.09
- 스탠퍼드 "中 딥시크, 자국 인재로 AI 돌파…美는 더 이상 종착지 아냐"2025.05.02
- 中 '딥시크'에 자극 받은 메타, 첫 AI 개발자 회의로 주도권 잡기 본격화2025.04.29
현재 딥시크-R1-0528-큐원3-8B는 오픈소스로 공개돼 누구나 제약 없이 상업적으로 이용할 수 있다. 데스크톱 애플리케이션인 LM 스튜디오에서도 모델을 API로 제공 중이다.
딥시크는 허깅페이스를 통해 "딥시크-R1-0528-큐원3-8B는 추론 모델에 대한 학술 연구와 소규모 모델을 활용해 산업을 발전시키려는 모두를 위한 AI 모델"이라고 설명했다.