엔비디아, 차세대 AI GPU 플랫폼 '블랙웰' 공개

4나노급 2천80억 개 트랜지스터 집적...연내 출시 예정

반도체ㆍ디스플레이입력 :2024/03/19 07:05    수정: 2024/03/19 08:52

엔비디아가 18일 오후(현지시간, 한국시간 19일 오전 5시) 미국 캘리포니아 주 새너제이에서 진행된 GTC 2024 기조연설을 통해 차세대 AI GPU '블랙웰'(Blackwell)을 공개했다.

엔비디아는 차세대 AI 칩에 게임 이론, 확률론, 정보 이론 등을 확립한 20세기 미국인 수학자인 데이빗 해럴드 블랙웰(1919-2010)의 이름을 따왔다.

젠슨 황 엔비디아 CEO는 이날 기조연설에서 "텍스트와 이미지, 그래프 뿐만 아니라 전세계 언어로 구성된 영상을 학습하고 이를 흉내내려면 더 큰 GPU가 필요하다"고 밝혔다.

엔비디아 블랙웰 GPU. (사진=엔비디아)

블랙웰 GPU는 대만 TSMC의 4나노급 공정(4NP)으로 만든 반도체 다이(Die) 두 개를 연결해 만든 칩이며 2천80억 개의 트랜지스터를 집적했다. 다이 두 개는 초당 10TB(테라바이트)의 데이터를 주고 받으며 하나의 칩처럼 작동한다.

최대 576개의 GPU 사이에서 양방향으로 초당 1.8TB 데이터를 주고 받는 연결 통로인 5세대 NV링크, 장시간 구동되는 데이터센터 환경에서 GPU와 메모리 신뢰성을 검증하는 AI 기반 RAS 엔진, 민감한 데이터를 암호화하고 신뢰성을 보장하는 시큐어 AI 등이 내장됐다.

블랙웰 GPU 두 개와 그레이스 CPU로 구성된 GB200 가속기. (사진=엔비디아)

블랙웰 두 개와 그레이스(Grace) CPU 한 개로 GB200이 구성된다. 이를 36개 모은 GB200 NVL72는 초당 1.4엑사플롭스 AI 연산이 가능하며 HBM3e 메모리를 30TB 내장한다. 엔비디아는 H100 36개로 구성된 기존 시스템 대비 LLM(거대언어모델) 처리 속도를 최대 30배 향상했다고 밝혔다.

엔비디아는 인텔 제온·AMD 에픽 등 기존 x86 기반 프로세서를 활용할 수 있는 가속기인 HGX B200도 출시할 예정이다. B200 텐서코어 GPU를 8개 내장했고 엔비디아 퀀텀2 이더넷 네트워크를 이용해 초당 최대 400Gbps로 데이터를 전송한다.

관련기사

엔비디아 블랙웰 기반 AI 플랫폼. (사진=엔비디아)

블랙웰은 올해 안에 출시될 예정이다. 시스코, 델테크놀로지스, HPE, 레노버, 슈퍼마이크로 등 주요 서버 업체 역시 블랙웰 기반 서버를 공급 예정이다.

엔비디아는 자체 운영하는 DGX 클라우드 이외에 AWS(아마존 웹 서비스), 구글 클라우드, 마이크로소프트 애저 등 전세계 주요 클라우드 사업자를 통해 블랙웰 인스턴스를 제공할 예정이다.