AI 시대 겨냥 CXL 기반 차세대 메모리 확장 플랫폼 개발

KAIST, "CPU-스위치-메모리 모두 포함한 프로토타입 첫 제작"

과학입력 :2022/08/01 13:31    수정: 2022/08/01 15:14

CXL(Compute Express Link)은 PCI 익스프레스(PCIe) 인터페이스 기반으로 컴퓨터 중앙연산장치(CPU) 등 여러 장치와 메모리를 연결하는 통합 인터페이스 표준이다. 기존 시스템의 데이터 처리 지연과 속도 저하, 확장성 문제를 해결할 방법으로 주목받고 있다.

1일 KAIST(총장 이광형)에 따르면, 전기및전자공학부 정명수 교수 연구팀은 대용량 메모리 장치와 프로세서 등 컴퓨터 시스템 주요 요소를 포함한 '컴퓨트 익스프레스 링크(CXL)' 2.0 기반 차세대 메모리 확장 플랫폼 '다이렉트CXL'을 개발했다.

다이렉트CXL 플랫폼 개요 및 CXL1.0/1.1과 CXL2.0의 차이 (자료=KAIST)

CXL 동작이 가능한 CPU와 CXL 스위치, 메모리 장치가 장착된 프로토타입을 만들어 운영체계를 동작시키고, 데이터센터에 대한 응용을 시연한 것은 처음이라고 연구진은 밝혔다.

■ 인공지능 데이터 처리 위한 고효율 메모리 수요 증가

최근 빅데이터 분석, 그래프 분석, 인메모리 데이터베이스 등 대규모 데이터에 기반한 응용 처리가 증가함에 따라 데이터센터에서는 이를 더 빠르고 효율적으로 처리하기 위해 시스템의 메모리 확장에 많은 투자를 하고 있다.

그러나 더블데이터대역폭(DDR) 인터페이스를 통한 메모리 확장은 추가할 수 있는 메모리 수의 제한이 있어 대규모 데이터 처리에 충분치 않다. 그래서 데이터센터에서는 CPU와 메모리로 이루어진 메모리 노드들을 따로 구성하고, 응용을 수행하는 호스트의 메모리가 부족하면 네트워크로 연결된 메모리 노드를 자신의 메모리 공간으로 사용하는 원격데이터전송기술(RDMA) 기반의 메모리 확장을 사용한다.

하지만 RDMA 기반 메모리 확장 시스템도 노드 간 데이터 이동 과정의 불필요한 데이터 복사, 소프트웨어의 개입, 프로토콜 전환으로 인한 지연으로 성능이 낮아진다. 메모리를 확장할 때 메모리뿐 아니라 메모리를 제어할 CPU까지 하나의 노드를 이루어 시스템에 추가돼야 하기 때문에 비용도 높다.

■ 메모리 확장성 높일 CXL 프로토콜

CXL 프로토콜이 최근 주목받는 이유다. 국내외 주요 기업들이 모인 CXL 컨소시엄은 2019년 CXL 인터페이스 표준 규역 1.0/1.1을 처음 제안했다. 

특히 이후 나온 CXL 2.0은 하나의 포트에 하나의 지역 메모리 장치만 연결할 수 있던 이전 버전의 확장성 문제를 스위치 네트워크를 통해 개선, 하나의 포트를 여러 포트로 확장할 수 있도록 했다. 확장된 포트에 다수의 원격 CXL 메모리 장치를 연결해 확장성을 높일 수 있다.

최근 인텔이 차세대 메모리 옵테인 사업에서 완전히 철수한다고 밝히면서, 메모리 성능 및 확장성 개선을 위해 CXL에 대한 관심이 더 커지고 있다.

그러나 아직 CXL 연구의 방향성을 제시할 시제품 개발 및 연구들이 진행되지 않아, 메모리 업계와 학계에서는 여전히 CXL1.0 및 1.1을 기반으로 지역 메모리 확장 장치와 시제품 개발을 진행하는 실정이다.

■ CXL2.0 기반 실제 작동하는 시스템 프로토타입 시연

정명수 교수 연구팀은 메모리를 확장하는 'CXL 메모리 장치'와 호스트 'CXL CPU', 여러 호스트를 다수의 CXL 메모리 장치에 연결해주는 'CXL 네트워크 스위치', 메모리 확장 플랫폼 전반을 제어할 리눅스 운영체제 기반의 'CXL 소프트웨어 모듈'을 개발해 다이렉트CXL 플랫폼을 구성했다.

연구팀이 제안하는 다이렉트CXL 프로토타입 시연 영상 (자료=KAIST)

이 시스템은 확장된 메모리 공간에 직접 접근해 데이터를 CPU 캐시로 가져오기 때문에 불필요한 메모리 복사와 소프트웨어 개입이 없다. PCIe 인터페이스만 사용, 프로토콜 전환을 없애 지연시간을 줄였다.

또 메모리 노드를 구성할 때 추가 CPU를 쓸 필요 없이 CXL 메모리 장치를 CXL 스위치에 연결하는 것만으로 메모리를 확장할 수 있다.

지금까진 국내외 소수 대기업에서 메모리 장치 일부 단품에 대한 구성을 보여준 준 사례만 있었다. 

정명수 교수는 "CXL은 CPU, 메모리, 스위치 제조사 모두 이득을 보는 구조를 제공한다"라며 "글로벌 테크 기업들도 관심이 높은 것으로 알려진만큼 상용화도 빠르게 진행될 수 있을 것"이라고 말했다.

■ 페이스북 추천 알고리즘 작업으로 성능 검증

연구팀은 다이렉트CXL의 성능을 검증하기 위해 CXL 동작이 가능한 다수의 자체 개발 호스트 컴퓨터가 CXL 네트워크 스위치를 통해 연결된 다수 CXL 메모리 장치들을 제어하는 환경을 구성했다.

이어 이 시스템을 기존 RDMA 기반 메모리 확장 솔루션과 비교했다. 페이스북 추천시스템의 기계학습 데이터 가속 등의 작업을 실시한 결과, 확장된 메모리에 대한 접근 시간 검증에서 RDMA 솔루션보다 8.3배 높은 성능을 보였다. 그래프 응용처리 및 인메모리 데이터베이스 응용 처리에서도 성능이 각각 2.3배와 2배 좋아졌다. 

관련기사

정명수 교수는 "다이렉트CXL은 데이터센터나 고성능 컴퓨팅 시스템에서 수요가 클 것"이라며 "CXL2.0 기반 단대단 프로토타입 플랫폼을 활용, CXL 적용 새 운영체제는 물론 시스템 소프트웨어, 솔루션 시제품 고도화를 통해 CXL 활용 시스템 구축의 초석을 제공할 것"이라고 말했다.

이번 연구는 미국 칼스배드에서 지난달 열린 시스템 분야 학술대회 '유즈닉스 연례 회의(USENIX Annual Technical Conference) 2022'에서 발표됐다. 또 2-3일 미국 산호세에서 열리는 '플래시 메모리 서밋(Flash Memory Summit)'에서 열리는 CXL포럼에 발표될 예정이다.