"차기 그래픽처리장치(GPU)인 '블랙웰'부터는 데이터센터에 수랭식(흐르는 물)을 도입하기 바랍니다."
일찌감치 발열 문제가 예고됐던 엔비디아의 차세대 인공지능(AI) 칩 '블랙웰'에서 설계 결함이 잇따라 발견돼 관련업체들이 곤란을 겪고 있다. AI 기술 고도화로 고성능 칩 '블랙웰' 확보가 중요해진 상황에서 대안 마련에 골몰하는 분위기다.
18일 로이터통신에 따르면 '블랙웰'을 사전 주문한 마이크로소프트(MS)·메타·오픈AI·xAI 등 빅테크 업체들은 제품 출시 지연에 대비해 엔비디아의 AI 칩인 'H100'과 'H200' 등 '호퍼' 제품군 주문을 늘리는 방안을 검토하고 있다. 이들은 AI 기술 우위를 점하기 위해 앞 다퉈 '블랙웰' 선주문을 통해 물량 확보에 나섰으나, 이번 일로 기술 개발 차질이 불가피할 것으로 보인다.
'블랙웰'은 2천80억 개 트랜지스터를 탑재한 AI칩으로, 트랜지스터 800억 개인 엔비디아의 차세대 AI칩 'H100' 보다 2.5배 많은 수준이다. 트랜지스터가 많을수록 칩 성능이 좋아진다.
그러나 '블랙웰'은 올 들어 생산 과정에서 수차례 결함이 발견되면서 출시가 계획대로 이뤄지지 않고 있다.
엔비디아는 지난 3월 '블랙웰'을 처음 공개하며 2분기 중 출시할 수 있다고 공언했다. 하지만 이후 설계 결함이 발견되면서 출시 시기가 예정보다 최소 3개월 늦춰졌다. 또 지난 8월에는 블랙웰을 4분기부터 양산할 계획이라고 발표했으나, 다시 서버 과열 문제가 발생하면서 제품 출시를 장담할 수 없게 됐다.
이로 인해 AI 기술 경쟁에 나선 글로벌 빅테크 기업들은 당황한 모습이다. 최신 AI칩 공급 지연으로 AI 기술 고도화 계획도 차질이 우려되기 때문이다.
마이크로소프트, 메타 등 주요 빅테크 기업들은 AI 시장 주도권을 선점하기 위해 올 들어서만 2천300억 달러 이상을 AI 인프라 구축에 투입하고 있다. 이 자금들은 ▲데이터센터 건설 ▲AI 모델 학습용 GPU 구매 ▲전력 공급 인프라 확충 등에 사용될 예정이다. 3분기 기준 각 기업별 자본 지출 증가율은 알파벳(구글) 62%, MS 51%, 아마존 81% 등이다.
업계에선 빅테크들의 투자금에 선주문 한 '블랙웰' 칩 가격도 포함돼 있을 것으로 보고 있다. '블랙웰' 칩 가격은 3만~4만 달러(약 4천500만~5천400만원)인 것으로 알려졌다. 빅테크들이 AI 데이터센터 구축을 위해 '블랙웰'을 대량 주문하면서 이미 12개월치 생산 물량은 매진됐다.
데이터센터에 서버를 공급하는 업체들도 난감하다. 델 테크놀로지스는 내년 초께 '블랙웰' 기반 서버를 선보일 계획을 갖고 있었으나, 이번 일로 차질을 빚을 것으로 보인다.
관련기사
- "작년 매출 벌써 넘었다"…챗GPT로 돈 번 오픈AI, 비용 부담에 수익성은 '글쎄'2024.09.04
- 엔비디아, AI 칩 '블랙웰' 설계 결함 발견...공급 내년으로 지연2024.08.04
- 'AI 3강' 엔비디아·MS·오픈AI, 美서 조사 대상됐다…무슨 일?2024.06.07
- 델 테크놀로지스, 호실적 달성했는데 주가 '뚝'…AI 거품 빠졌나?2024.05.31
일각에선 엔비디아 '블랙웰'의 대항마로 여겨지는 AMD의 '인스팅트 MI325X' 가속기가 시장을 대체할 수 있을지도 주목하고 있다. HPE, 슈퍼마이크로 등 서버 업체들은 최근 이를 탑재한 신제품을 잇따라 내놓은 상태다.
업계 관계자는 "AI 모델을 업그레이드 하기 위해선 고성능 AI 칩이 반드시 필요하다"며 "올해 글로벌 빅테크 기업들이 쏟아 부은 투자금 대부분이 AI를 가동하는 하드웨어인 AI 칩에 집중됐을 것이란 점에서 최신 AI 칩 공급 지연은 글로벌 빅테크 기업들의 AI 고도화 계획에도 일부 영향을 줄 수밖에 없을 것"이라고 말했다.