[기고] 서버 시장의 변화 이끄는 '새로운 워크로드'

4세대 제온 x86 코어와 가속기 협동으로 와트당 성능 향상 가능

전문가 칼럼입력 :2023/06/20 13:58

박기순 에이수스코리아 서버 매니저

엔터프라이즈 시장은 24시간 365일 안정적인 서비스를 제공해야 한다는 특성상 일반 소비자용 PC 대비 변화와 발전 속도가 더디다. 그러나 서버용 프로세서에 요구되는 기본기는 큰 변함이 없다.

그 기본기란, 게임이나 스트리밍 등 최종 이용자의 요구에 맞춰 주어진 데이터를 최단 시간내에 처리하는 것이다. 또 여러 이용자를 위해 복합적인 작업을 효율적으로 처리할 수 있다면 금상첨화다.

박기순 에이수스코리아 서버 부문 매니저

이는 서버와 클라이언트를 떠나 모든 프로세서에 요구되는 사항이기도 하다. 일면 단순해 보이지만 한없이 어려운 작업이기도 하다.

최근에는 이런 기본기에 더해 빅데이터, AI(인공지능), 딥러닝 등 다양한 형태의 데이터까지 효율적으로 처리할 것을 요구한다.

이런 워크로드는 서버용 프로세서 시장에 작지만 큰 변화를 요구하고 있다.

전통적인 x86/x64 프로세서로 이들 워크로드를 처리하는 것은 불가능하지 않다.

그러나 GPU나 FPGA 대비 처리 시간 면에서 극히 비효율적이다. 이 문제를 해결하려면 종전에 없었던 다양한 형태의 연산을 전담해 처리하는 가속 기술이 요구된다.

인텔 4세대 제온 스케일러블 프로세서. (사진=인텔)

인텔이 1분기부터 공급하고 있는 4세대 제온 스케일러블 프로세서는 현재 요구되는 워크로드 뿐만 아니라 앞으로 등장할 다양한 워크로드에 대응한 가속 기능을 갖췄다. 이런 특성은 고객사의 다양한 요구에 대응해야 하는 클라우드 서비스 공급업체의 눈길을 끌기도 했다.

■ CPU와 협동하는 가속기로 와트 당 성능 향상

4세대 제온 스케일러블 프로세서는 AI 처리에 빼놓을 수 없는 행렬 곱셈을 빠르게 처리하는 어드밴스드 매트릭스 익스텐션(AMX), 대용량 벡터 데이터를 빠르게 처리하는 AVX-512 명령어, 암호화 및 대량 데이터 압축을 가속하는 퀵어시스트 기술 등을 내장했다.

4세대 제온 스케일러블 프로세서에 내장되는 데이터 스트리밍 가속기 엔진 작동 예. (자료=인텔)

여기에 패킷 처리를 최적화하는 다이내믹 로드 밸런서, 데이터베이스 향상을 위한 인-메모리 분석 가속기, 데이터 이동 속도를 가속하는 데이터 스트리밍 등 다양한 가속기가 탑재된다.

각종 가속기 활성화 여부에 따른 와트당 성능 비교. (자료=인텔)

이러한 가속기는 콘텐츠 전달 네트워크(CDN), 데이터 압축, 로드 밸런싱, 빅데이터 분석 등 다양한 워크로드를 소화할 수 있다. 단순 CPU 코어만 활용하던 종전 대비 와트당 성능도 최대 2.7배 향상됐다.

■ 원API 통해 CPU·GPU·FPGA 자원 활용

4세대 제온 스케일러블 프로세서에 내장된 다양한 가속기를 제대로 활용하려면 이를 100% 활용할 수 있는 소프트웨어 개발이 반드시 필요하다. 응용프로그램이 없다면 다양한 가속기는 실리콘 내 조각에 불과하다.

인텔이 지난 해 말 업데이트한 원API 2023. 4세대 제온 스케일러블 프로세서와 다양한 가속기를 통합 지원한다. (사진=인텔)

인텔 원API(oneAPI)는 x86 코어와 프로세서 내 가속기, GPU, FPGA 등 다양한 컴퓨팅 자원을 효과적으로 활용할 수 있도록 지원한다.

지난 해 말 업데이트된 '원API 2023'은 4세대 제온 스케일러블 프로세서, 제온 CPU 맥스, 데이터센터 GPU 등 지원 기능을 추가했다. 개발자들은 서버 환경 구축 전 인텔 디벨로퍼 클라우드를 통해 원하는 워크로드를 시험 구축할 수 있다.

■ 올플래시·10Gbps 이더넷으로 다양한 워크로드 지원

에이수스는 다양한 가속기를 탑재한 4세대 제온 스케일러블 프로세서 기반으로 데이터베이스, HPC, 미디어, 네트워크, AI 등 폭넓게 활용 가능한 서버 제품을 국내외에 공급하고 있다.

일례로 최근 출시한 RS720-E11-RS24U는 현재 가장 빠른 전송속도를 실현할 수 있는 PCI 익스프레스 5.0 기반 서버용 NVMe SSD를 최대 24개 설치해 구동할 수 있다.

에이수스 RS720-E11-RS24U 서버. 4세대 제온 칩을 최대 2개 탑재할 수 있다. (사진=에이수스)

이를 통해 지연 시간 단축이 요구되는 온라인 업무처리(OLTP) 및 분석, 서버 가상화 등 다양한 워크로드를 실현한다.

SSD 기반 올플래시 서버의 병목현상은 처리된 대용량 데이터를 주고받을 때 발생한다. 이를 해소하기 위해 10Gbps 이더넷 단자 2개가 기본 제공되며 OCP 3.0을 이용한 네트워크 모듈로 전송속도 고도화가 가능하다.

■ 다년간 노하우 살린 최적화 기능 탑재

클라우드 기반 렌더링이나 물리 시뮬레이션에는 별도 서버용 GPU 장착이 반드시 필요하다. RS720-E11-RS24U는 인텔 데이터센터 GPU 맥스(폰테베키오)나 엔비디아 A100 등 듀얼 슬롯 GPU를 탑재해 이러한 연산을 가속할 수 있다.

듀얼 슬롯 GPU를 활용해 엔비디아 A100이나 인텔 데이터센터 GPU 맥스 등을 장착할 수 있다. (사진=엔비디아)

에이수스는 SPEC CPU 2017 벤치마크 기준 싱글·듀얼 소켓 기반 서버에서 다양한 최고 기록을 보유하고 있다. 이런 기술력을 바탕으로 4세대 제온 스케일러블 프로세서의 잠재력을 최대한 끌어낼 수 있는 최적화 기능도 함께 제공한다.

관련기사

멀티코어 환경에서 프로세서 작동 클록을 최대한 높이는 '코어 옵티마이저', 정밀한 전압조절로 워크로드 가속을 돕는 '엔진 부스트' 등이 내장되었으며 필요한 워크로드에 맞게 조정된 바이오스 프로파일도 함께 제공한다.

에이수스는 향후 출시될 최신 프로세서에 최적화한 제품을 출시 예정이다. 사진은 올 연말 출시 예정인 인텔 5세대 제온 스케일러블 프로세서 시제품. (사진=인텔)

에이수스는 4세대 제온 스케일러블 프로세서는 물론 향후 출시될 최신 프로세서의 잠재력을 끌어낼 수 있는 최적화된 서버 제품으로 다양한 워크로드를 처리해야 하는 고객사의 요구에 부응할 수 있도록 최선을 다할 것이다.

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.