[안광섭 AI 진테제] 미국기업이 중국AI기업에 돈을 보내는 이유

우버(Uber)가 올해 AI 코딩도구 예산을 4개월 만에 전부 소진했다. 약 5000명의 엔지니어가 에이전틱 코딩 도구를 사용하면서 월 사용료가 엔지니어당 150달러에서 많게는 2000달러까지 치솟았고, CTO가 직접 "올해 AI 코딩 도구 예산을 이미 다 썼습니다"라고 시인하는 상황에 이르렀다. 결국 우버는 직원 1인당 월 1500달러의 사용 한도를 설정했다. COO 앤드루 맥도널드는 한 팟캐스트에서 "AI 도구 사용량과 실제 소비자 기능 개선 사이의 연결 고리가 아직 보이지 않습니다"라고 솔직하게 인정하기도 했다.

우버만의 이야기가 아니다. 미국 기업용 지출 관리 플랫폼 램프(Ramp)에 따르면 기업당 AI 토큰 지출은 2025년 1월 이후 13배 증가했다. AI 도구의 성능이 올라갈수록, 그리고 에이전틱 AI처럼 자율적으로 작업을 수행하는 도구가 확산할수록, 토큰 소비량은 기하급수적으로 늘어난다. 문제는 단순하다. 더 많이 쓸수록, 더 많이 나간다.이 비용 압박이 예상 못 한 곳으로 기업들을 향하게 하고 있다. 바로 중국이다.

"미국기업들 딥시크에 직접 결제"

램프는 5만 개 이상의 미국 기업이 사용하는 법인카드 및 청구 플랫폼으로, 매달 수십억 달러 규모의 기업 지출 데이터를 추적한다. 램프가 매월 발표하는 '트렌딩 소프트웨어 벤더' 목록은 기업이 특정 소프트웨어 벤더에 처음으로 결제한 건수를 기준으로 순위를 매긴다. 신규 도입의 흐름을 보여주는 선행 지표인 셈이다.

2026년 6월 발표한 이 목록에서 1위를 차지한 것은 중국 AI 스타트업 딥시크(DeepSeek)였다. 이벤트 관리 플랫폼 피드루프(PheedLoop)와 오픈소스 모델 서빙 플랫폼 파이어웍스AI(Fireworks AI)를 제치고 정상에 올랐다. 주목할 것은 결제 방식이다. 램프의 수석 이코노미스트 아라 카라지안(Ara Kharazian)은 "미국 기업들이 딥시크에 직접 결제하고 있습니다"라고 밝혔다. 이는 기업들이 딥시크의 오픈소스 모델을 자사 서버에 직접 올려 쓰는 것이 아니라, 중국에 위치한 딥시크 서버로 데이터를 보내고 받고 있다는 뜻이다.

미중 기술 갈등이 지속되는 상황에서 미국 기업이 자사 데이터를 중국 서버에 직접 전송하는 것은 상식적으로 이해하기 어려운 선택이다. 카라지안은 이를 두고 "기업들이 오픈AI와 앤트로픽의 대안을 찾고 있다는 가장 확실한 신호"라고 해석했다.

물론 절대적 규모로 보면 아직 미미하다. 램프 AI 인덱스 기준으로 올 4월 딥시크의 미국 기업 도입률은 0.1%에 불과했다. 같은 시점에 앤트로픽(Anthropic)은 34.4%, 오픈AI(OpenAI)는 32.3%로 시장을 양분하고 있었다. 딥시크가 시장 판도를 뒤집은 것은 아니다. 그러나 '트렌딩 1위'가 의미하는 것은 신규 진입 속도다. 지금 이 순간, 새로운 선택지로 딥시크를 처음 시도하는 기업이 가장 빠르게 늘고 있다는 뜻이다.

34배의 격차, 무시할 수 없는 숫자

이 선택을 이끈 것은 단 하나, 가격이다. 딥시크는 지난달 플래그십 모델 V4 프로(V4 Pro)의 75% 할인을 영구화했다. 원래 5월 31일 종료 예정이던 프로모션 가격이 그대로 정가가 된 것이다. 현재 V4 프로의 API 가격은 출력 토큰 100만 개당 0.87달러다. 캐시 히트(cache hit, 반복되는 입력을 재활용해 비용을 줄이는 방식) 가격은 100만 토큰당 0.0036달러까지 내려간다.

이 숫자만으로는 감이 잡히지 않을 수 있다. 경쟁사와 비교하면 격차가 선명해진다. 오픈AI의 최신 플래그십 GPT-5.5는 출력 토큰 100만 개당 30달러다. 앤트로픽의 클로드 오퍼스(Claude Opus) 4.7은 25달러다. 딥시크 V4 프로의 0.87달러와 비교하면 각각 약 34배, 약 29배의 차이다.

AI 벤치마크 평가 기관 아티피셜 애널리시스(Artificial Analysis)에 따르면 동일한 지능 지수 테스트를 수행하는 데 딥시크 V4 프로는 268달러, 클로드 오퍼스 4.7은 4811달러가 들었다. 같은 작업에 약 18배의 비용 차이가 발생하는 것이다.

이런 가격 격차가 가능한 배경에는 두 가지 구조적 요인이 있다. 첫째, 딥시크 V4 시리즈는 화웨이(Huawei)의 어센드(Ascend) 950 칩 위에서 최적화됐다. 미국의 반도체 수출 통제로 엔비디아(NVIDIA) GPU를 쓸 수 없게 된 상황에서, 오히려 국산 칩 기반의 저비용 추론 인프라를 구축한 셈이다.

둘째, 딥시크는 V4 프로의 장문맥(long-context) 추론 비용을 전작 대비 약 4분의 1 수준으로 낮추는 아키텍처 혁신을 이뤘다고 밝혔다. 가격 인하가 일시적 마케팅이 아니라 비용 구조 자체의 변화에 기반한다는 의미다.

오픈소스 진영의 집단적 추격

딥시크만의 현상이 아니다. 램프의 5월 데이터에서 트렌딩 상위 10개 벤더 중 4개가 AI 추론 플랫폼이었다. 파이어웍스AI, 팔AI(Fal AI), 딥인프라(DeepInfra), 바스트AI(Vast.ai)-모두 오픈AI나 앤트로픽을 거치지 않고, 더 넓고 저렴한 모델 선택지를 기업에 제공하는 플랫폼이다. 카라지안은 이를 두고 "기업들이 어떤 모델이 어떤 작업에 적합한지 선별하기 시작했다는 가장 깨끗한 신호"라고 분석했다. 어려운 문제에는 프론티어 모델을, 나머지에는 저가 모델을 배분하는 '모델 라우팅' 전략이 실무에서 확산되고 있다는 뜻이다.

성능 격차도 빠르게 좁혀지고 있다. AI 법률 에이전트 성능을 측정하는 하비(Harvey)의 리걸 에이전트 벤치마크(LAB)에서 중국 지푸AI(Zhipu AI, 현 Z.ai)의 GLM-5.1은 오픈소스 모델 중 최고점을 기록하며 앤트로픽의 클로드 오퍼스 4.7 바로 아래, 오픈AI의 GPT-5.5와 대등한 수준에 올랐다.

문샷AI(Moonshot AI)의 키미(Kimi) K2.6과 딥시크 V4 프로 역시 GPT-5.5 바로 아래에 자리 잡았다. 법률 업무처럼 정밀도가 요구되는 영역에서도 오픈소스 모델이 "충분히 쓸 만한" 수준에 도달했다는 평가다.

가격이 지정학을 이기는 순간

필자가 GTM(Go-To-Market, 제품의 시장 진입과 확산 전략) 전략을 수립해 온 관점에서 보면, 지금 AI 시장에서 벌어지는 일은 전형적인 범용재화(commoditization)의 초기 신호다.

범용재화는 세 단계를 거친다. 1단계: 제품 간 성능 차이가 줄어든다. 2단계: 가격이 구매 결정의 핵심 변수가 된다. 3단계: 공급자의 브랜드보다 유통 구조와 비용 효율이 경쟁력을 결정한다

. AI 모델 시장은 지금 1단계에서 2단계로 넘어가는 전환점에 있다. 하비 LAB 벤치마크가 보여주듯, 오픈소스 모델과 프로프라이어터리(proprietary, 비공개) 모델의 성능 격차는 좁혀지고 있다. 그리고 가격이 34배 차이 나는 상황에서, 기업의 선택은 놀랍도록 예측 가능하다.

물론 딥시크를 통해 중국 서버로 데이터를 보내는 것은 보안과 규제 측면에서 명백한 리스크가 있다. 유럽에서는 이탈리아가 2025년 1월 딥시크를 차단했고, 독일도 데이터 보호 우려를 이유로 앱스토어 퇴출을 검토한 바 있다. 미국에서도 연방 정부 차원의 규제 논의가 진행 중이다. 그럼에도 기업들이 이 리스크를 감수하는 것은, 비용 압박이 그만큼 현실적이기 때문이다. 램프의 카라지안도 이 추세의 지속성에 대해서는 유보적이었다. 그는 "이 트렌드의 내구성을 과대평가하지는 않겠습니다"라고 밝혔다.

맞는 말이다. 그러나 필자가 보기에 더 중요한 것은 딥시크 자체의 성패가 아니다. 핵심은 가격 압력의 방향이 되돌릴 수 없다는 점이다. 딥시크가 아니더라도, 파이어웍스AI나 딥인프라 같은 추론 플랫폼을 통해 동일한 오픈소스 모델을 미국 내 서버에서 저렴하게 돌리는 경로는 이미 열려 있다. 중국 서버 리스크를 회피하면서도 비용 절감을 추구할 수 있는 선택지가 늘어나고 있다는 뜻이다.

한국 기업이 읽어야 할 신호

이 흐름이 한국 기업에 던지는 시사점은 분명하다. 첫째, AI 모델 조달 전략을 단일 벤더 중심에서 멀티모델 전략으로 전환할 시점이다. 모든 작업에 최고가 프론티어 모델을 쓸 이유가 없다. 정밀도가 생명인 작업과, 속도와 비용이 우선인 작업을 구분해 모델을 배분하는 것이 합리적이다.

둘째, 토큰 비용을 IT 예산의 독립 항목으로 관리해야 한다. 우버의 사례가 보여주듯, AI 도구 도입은 쉽지만 비용 통제는 쉽지 않다. 에이전틱 AI 시대에 토큰 소비량은 인간의 사용 패턴이 아니라 기계의 작업 루프에 의해 결정된다. 사용량 예측 모델과 비용 거버넌스를 지금부터 설계해야 한다.