트렌드포스 "엔비디아 '블랙웰' 서버랙 대량 공급 내년 2~3분기로 지연"

GB200 서버랙, 소량 공급은 4분기에 개시

반도체ㆍ디스플레이입력 :2024/12/18 10:01

엔비디아의 최신 AI 반도체 '블랙웰'이 탑재된 AI 서버랙 'GB200'의 대량 공급 시기가 최대 3분기까지 늦춰진다는 전망이 나왔다.

18일 시장조사업체 트렌드포스는 엔비디아 AI 서버랙 'GB200'이 설계 최적화에 어려움을 겪으면서 대량 공급 시기가 내년 2~3분기로 지연된다고 전망했다. 고속 상호 연결 인터페이스, 열설계전력(TDP) 등에 추가 최적화 작업이 필요하다는 설명이다.

엔비디아 GB200 NVL72. GB200 GPU 세트를 72개 탑재한다. (사진=지디넷코리아)

트렌드포스는 “블랙웰 GPU 칩 생산은 4분기부터 소량 출하가 가능하지만, AI 서버 시스템은 설계 요구 사항과 여타 부품들의 공급망 조정이 필요한 상황”이라며 “이에 따라 AI 서버 랙의 올해 말 출하량은 업계 기대치에 미치지 못할 것으로 보인다”고 말했다. 다만, 일부 고객사를 대상으로 GB200 서버랙의 소량 공급은 4분기부터 시작됐다. 

이번 지연 소식은 앞서 11월 17일 IT 매체 디인포메이션이 보도한 내용과 맥을 같이한다. 디인포메이션은 엔비디아 직원을 인용해 “GB200 서버랙에서 블랙웰 GPU를 연결할 때 과열 현상이 발상해 엔비디아가 서버OEM사들에게 설계 변경을 요구했다”며 “서버 랙 제조사들은 최악의 경우 내년 6월 말쯤에야 제품을 공급할 수 있을 것”이라고 전했다.

이번 공급 지연은 빅테크 기업들의 AI 개발에 차질을 줄 수 있다는 우려가 제기된다. 메타와 구글은 이미 100억 달러 규모의 GB200 40만개를 구매했고, 마이크로소프트도 6만5000개를 주문한 상태다. 트렌드포스는 GB200 NVL72 모델이 내년 전체 서버 공급량의 80%를 차지할 것으로 예상했다.

엔비디아 블랙웰은 2080억개의 트랜지스터를 집적한 그래픽처리장치(GPU)로 사양에 따라 B100, B200으로 나뉜다. 블랙웰은 지난 2022년 나온 ‘호퍼’ 시리즈 보다 데이터 연산 속도가 2.5배 빠르다. 지난 3월 첫 공개돼 당초 2분기 출시가 목표였지만, 설계 결함으로 4분기로 연기돼 양산 중이다.

‘GB200’ AI 가속기는 2개의 블랙웰 GPU, 1개의 그레이스 중앙처리장치(CPU), HBM3E 8단 16개가 탑재된 제품이다. GB200 서버는 랙에 집적되는 개수에 따라 GB200 NVL3, GB200 NVL72 등으로 나뉜다. GB200 NVL72에는 72개 블랙웰 GPU, 36개의 CPU가 탑재되며, 엔비디아 독자 기술인 5세대 NVLink로 고속 연결을 구현했다. GB200 서버시스템은 종전의 H100보다 성능이 30배, 에너지 효율성이 25배 좋다.

다만 고성능에 따른 발열 문제가 과제로 떠올랐다. GB200 NVL72의 열설계전력(TDP)은 140kW로, 현재 주력 제품인 HGX AI 서버(60~80kW)의 두 배에 달한다. 이에 서버제조사들은 기존 공랭식에서 수랭식 냉각 솔루션으로의 전환을 서두르고 있다.

관련기사

한편, GB200 서버랙 공급 지연 우려가 크지 않다는 주장도 나온다. 델 테크놀로지스의 마이클 델 CEO는 지난 11월 19일 SNS를 통해 GB200 NVL72 서버랙 출하가 시작됐다고 알렸다.

또 지난 11월 20일 엔비디아 실적 컨퍼런스콜에서 젠슨 황 엔비디아 CEO는 “올 4분기에 과거 예상보다 더 많은 블랙웰 GPU를 공급할 수 있을 것으로 기대한다”고 밝혔다. 이날 콜렛 크레스 엔비디아 CFO 역시 "각종 고객사의 블랙웰 수요에 맞춰 공급 확대에 최선을 다하고 있으며 올 4분기 블랙웰 매출이 당초 예상인 50~60억 달러를 넘어설 것"이라고 설명했다.