인텔 "가우디3, 납기·비용·성능 모두 뛰어난 엔비디아 대체재"

[컴퓨텍스 2024] 가우디3, 3분기 출시 예정...글로벌 공급 업체 10곳으로 확대

반도체ㆍ디스플레이입력 :2024/06/04 19:01

[타이베이(대만)=권봉석 기자] 인텔이 4일(이하 대만 현지시간) 오전 대만 타이베이 난강전시관에서 진행된 기조연설에서 AI 가속기 '가우디3'의 가격 대비 성능을 강조했다.

가우디3는 2022년 5월 출시된 가속기인 가우디2 후속 제품이며 TSMC 5나노급 공정에서 생산된다. 96MB S램과 128GB HBM2e 메모리를 이용해 최대 대역폭 3.7TB/s를 구현했다.

인텔이 4일(대만 현지시간) 컴퓨텍스 기조연설에서 가우디3 가속기의 가격 대비 성능을 강조했다. (사진=지디넷코리아)

서버용 프로세서와 PCI 익스프레스 5.0 규격으로 연결되며 200Gbps 이더넷으로 서로 연결된다. 전세계 10개 이상의 글로벌 공급업체가 올 3분기부터 가우디3 기반 솔루션을 공급 계획중이다.

■ "네이버도 가우디 선택했다...TCO·TTM에서 엔비디아 대비 우위"

이날 팻 겔싱어 인텔 CEO는 "현재 클라우드 이용 현황을 보면 전체 워크로드 중 60%가 클라우드에서 실행되며 생성된 데이터 중 80%가 여전히 활용되지 않는 상황"이라고 설명했다.

팻 겔싱어 인텔 CEO는 ”LLM과 RAG를 활용해 기업 내 데이터를 유효하게 활용할 수 있다”고 밝혔다. (사진=지디넷코리아)

이어 "LLM(거대언어모델)에 기업이나 기관의 데이터를 더한 검색증강생성(RAG)은 잠자는 데이터를 활용할 수 있는 기회를 줄 것이다. 6월부터 내년 1분기에 걸쳐 출시될 제온6 프로세서와 가우디 가속기는 이를 바꿀 수 있다"고 설명했다.

현재 AI용 GPU 시장은 엔비디아가 독식하고 있다. 팻 겔싱어 CEO는 "기업들은 대안과 개방형 구조를 원한다. 또 제품/서비스 출시 시간(TTM)을 단축하고 총소유비용을 낮추길 희망하고 있다"고 지적했다.

LLM과 RAG를 활용한 실시간 대화형 데이터베이스 구축 시연. (사진=지디넷코리아)

이어 "한국 네이버클라우드가 가우디를 쓰고 있다. 또 오픈소스 리눅스 재단과 기업용 AI 플랫폼 구축에 협업하고 있으며 제온6와 가우디가 기업 AI 워크로드에 도움을 줄 것"이라고 강조했다.

■ "가우디3, 덜 쓰고 더 얻을 수 있는 '가성비' 가속기"

팻 겔싱어 CEO는 올 3분기부터 공급될 차세대 가속기 가우디3에 대해 "같은 규모 클러스터 구성시 엔비디아 H100에서 추론 성능은 2배이며 H200 GPU 대비 경쟁력을 갖고 있다"고 설명했다.

가우디3 OAM 시제품. (사진=지디넷코리아)

인텔 자체 성능비교에 따르면 가우디3 8천192개 클러스터 구성시 같은 규모 엔비디아 H100 클러스터 대비 학습 시간은 40% 단축할 수 있다.

또 700억 개 매개변수로 구성된 LLM인 메타 라마2(Llama2) 구동시 가우디3 64개 클러스터는 엔비디아 H100 대비 최대 15% 빠른 학습 처리량을 제공할 예정이다.

팻 겔싱어 CEO는 ”가우디3는 '덜 쓰고 더 얻을 수' 있는 AI 가속기”라고 강조했다. (사진=지디넷코리아)

팻 겔싱어 CEO는 "가우디3는 '덜 쓰고 더 얻을 수' 있는 AI 가속기"라며 가우디3의 개방성도 강조했다.

그는 "가우디3는 업계 표준 인터페이스인 이더넷으로 작동하며 파이토치 등 오픈소스 AI 프레임워크에 최적화됐고 수십만 개의 AI 모델을 지원한다"고 말했다.

관련기사

■ 가우디3 솔루션 공급 업체 10개 이상으로 확대

가우디3는 서버용 OCP 가속화 모듈인 HL-325L, HL-325L을 8개 탑재한 UBB 표준 모듈인 HLB-325, 워크스테이션에 장착 가능한 확장 카드인 HL-338 등 3개 형태로 시장에 공급된다.

인텔은 폭스콘, 인벤텍, 콴타 등 대만 주요 ODM 업체가 가우디3 공급사로 추가됐다고 밝혔다. (사진=지디넷코리아)

인텔은 이날 가우디3 기반 AI 서버 공급업체로 델테크놀로지스, HPe, 레노버, 슈퍼마이크로에 더해 폭스콘, 기가바이트, 인벤텍, 콴타, 위스트론 등 총 10개 이상 글로벌 업체가 참여하고 있다고 밝혔다.