인텔, 데이터센터용 고성능 CPU·GPU 2종 공개

최종 진화형은 두 칩 융합한 XPU..."IDM 2.0 전략 결정판"

반도체ㆍ디스플레이입력 :2022/11/09 23:00

인텔이 오는 13일 미국 텍사스 주 댈러스에서 열리는 슈퍼컴퓨팅 컨퍼런스 'SC22'를 앞두고 데이터센터용으로 설계된 '제온 CPU 맥스', '데이터센터 GPU 맥스' 등 프로세서 신제품 2종을 9일 공개했다.

사전 브리핑에서 제프 맥베이 인텔 슈퍼컴퓨터그룹 수석부사장은 "슈퍼컴퓨터로 처리해야 하는 작업 중 50% 가량은 연산 위주, 30% 가량은 메모리 위주 작업"이라고 설명했다.

인텔이 9일(미국 현지시간) 데이터센터용 고성능 CPU/GPU 2종을 공개했다. (사진=인텔)

이어 "목표를 달성하려면 CPU의 코어 수를 늘리고 코어 자체의 성능을 향상시키는 방법, 또 많은 데이터를 병렬 처리할 수 있는 GPU를 강화하는 작업이 필요하다"고 지적했다.

또 "CPU 성능 향상에서 메모리 대역폭이 문제가 되며 GPU 성능 향상에서는 메모리 용량 제한과 기존 코드 재작성 등이 문제가 된다. 이런 양대 문제를 모두 해결하겠다는 것이 인텔의 목표"라고 설명했다.

■ HBM으로 메모리 대역폭 강화한 '제온 CPU 맥스'

제온 CPU 맥스는 지금까지 '사파이어래피즈 HBM'으로 불렸던 제품이다. P코어를 최대 56개 내장하고 HBM(고대역폭 메모리)을 프로세서 다이 안에 넣어 자주 쓰는 대용량 데이터를 보다 빨리 불러올 수 있다.

제온 CPU 맥스 개요. (자료=인텔)

제온 CPU 맥스는 HBM2e 16GB 모듈을 최대 4개(64GB) 내장한다. 메모리 대역폭은 초당 최대 1TB이며 코어당 HBM 메모리를 1GB 이상 쓸 수 있다. CPU 칩렛 위에 3D V캐시(S램)을 올려 지연 시간을 줄이고 반응 속도를 끌어올린 AMD 에픽 프로세서와 유사하다.

제온 맥스 CPU가 HBM을 활용하는 방법은 세 가지다.

먼저 HBM을 서버용 DDR5 메모리 대신 쓰는 것이다. 혹은 HBM을 DDR5 메모리 캐싱 용도로 쓸 수 있다. 두 방법 모두 기존 프로그램 수정·보완이 필요 없다. HBM과 DDR5 메모리를 함께 쓰는 것도 가능하지만 운영체제나 코드 수정이 반드시 필요하다.

인텔이 공개한 제온 CPU 맥스 성능 비교 자료. (사진=인텔)

인텔은 각종 시뮬레이션으로 측정한 결과를 토대로 "제온 맥스 CPU 2개가 AMD 에픽 7773X 2개 대비 물리 시뮬레이션에서는 최대 4.7배 이상의 성능을 낸다"고 주장했다.

■ 데이터센터 GPU 맥스, 소켓당 연산 밀도 최대

인텔은 자체 개발한 Xe 그래픽코어 128개를 조합해 기존 CPU로 처리할 수 없는 그래픽 처리나 AI 연산을 수행하기 위해 서버용 GPU인 '폰테 베키오'(Ponte Vecchio)를 개발했다. 이 GPU에는 '데이터센터 GPU 맥스'라는 새로운 이름이 붙었다.

데이터센터 GPU 맥스(개발명 폰테베키오). (자료=인텔)

데이터센터 GPU 맥스에는 최대 128GB HBM2e, 408MB 람보 L2 캐시 등이 내장되며 여러 개의 반도체 조각을 타일처럼 잇는 포베로스(FOVEROS) 기술이 동원됐다. AI 연산에 주로 쓰이는 행렬 연산을 최적화하는 XMX(Xe 행렬 확장) 명령어도 내장했다.

인텔은 ”데이터센터 GPU 맥스는 레이트레이싱 기능도 내장했다”고 설명했다. (자료=인텔)

데이터센터 GPU 맥스는 AI나 머신러닝, 시뮬레이션에 필요한 복잡한 연산과 함께 클라우드 환경에서 렌더링을 실행하는 GPU 역할도 함께 처리한다. 햇빛 등 자연광이나 인공광이 물체 표면에 비칠 때 효과를 처리하는 레이트레이싱도 내장했다.

서버나 워크스테이션의 PCI 익스프레스 슬롯에 꽂아 쓸 수 있는 데이터센터 GPU 맥스 1100. (자료=인텔)

데이터센터 GPU 맥스를 일반 PC나 워크스테이션에 꽂아 쓸 수 있는 확장 카드 형태 제품인 '데이터센터 GPU 맥스 1100'도 출시 예정이다. 이 제품에는 Xe 코어 56개와 HBM2e 48GB가 탑재되며 카드 4개를 병렬로 연결할 수 있다.

인텔은 엔비디아 A100을 대상으로 벤치마크 결과를 공개하며 "데이터센터 GPU 맥스는 원자로 반응 시뮬레이션에서는 엔비디아 A100 대비 1.5배 빠르다"고 주장했다.

■ 최종 진화형 'XPU', 첫 제품 2024년 출시 예정

인텔이 데이터센터와 서버용 프로세서의 최종 진화형으로 꼽은 형태는 바로 XPU다.

인텔이 제시한 XPU 개념도

XPU는 x86 명령어를 처리할 수 있는 CPU와 대량 데이터 병렬 연산에 유리한 GPU를 바탕으로 HBM 메모리는 물론 고객사가 원하는 반도체 조각을 모아 맞춤형 프로세서를 생산하겠다는 구상이다.

관련기사

인텔은 XPU에서도 IDM 2.0 전략을 강조했다. 핵심 제품(CPU)은 인텔 파운드리를 통해 자체 생산하지만 GPU나 입출력을 담당하는 칩은 TSMC나 삼성전자 등 다른 곳에서 생산해 조합하겠다는 것이다.

인텔은 XPU 구조를 적용한 '팰콘 쇼어'를 이르면 2024년 출시할 예정이다. (자료=인텔)

인텔은 XPU 구조 기반 서버용 칩인 '팰콘 쇼어'(Falcon Shore)를 이르면 오는 2024년 출시 예정이다.