[바르셀로나(스페인)=박수형 기자] SK텔레콤이 컴퓨팅 자원 연결 분야 선도 기업 파네시아와 함께 AI 데이터센터 구조 혁신에 나선다. 최근 AI 모델이 고도화되면서 메모리 수요가 급증하는 가운데 GPU를 단순히 늘리는 대신 컴퓨팅 자원 연결 방식을 바꿔 성능과 비용 효율을 동시에 개선한다는 구상이다.

파네시아는 CXL 관련 글로벌 최고 수준의 기술력을 갖춘 국내 스타트업이다. ▲다수의 장치를 중간에서 연결해 데이터 흐름을 관리하는 장치(패브릭 링크 스위치) ▲링크 컨트롤러(장치 간 효율적 데이터 전송을 돕는 장치(링크 컨트롤러) 등 효율적인 AI DC를 구축하는 데 필요한 다양한 링크 반도체를 제공하고 있다.

CXL이란 CPU, GPU, 메모리 간 데이터를 유기적으로 연결해 초고속 저지연 처리를 가능하게 하는 데이터 연결 표준으로 서버 단위로 묶여 있던 컴퓨팅 자원을 유연하게 확장 활용할 수 있게 해준다.

SK텔레콤은 스페인 바르셀로나에서 열리고 있는 MWC26에서 파네시아와 ‘CXL 기반 차세대 AI DC 아키텍처’ 공동 개발을 위한 업무협약을 체결했다. 협력의 핵심은 CXL 기반 기술을 활용해 불필요한 장비 증설 없이도 AI 처리 효율을 높여 AI DC의 경제성을 높이는 데 있다.

기존 AI DC는 CPU, GPU, 메모리가 서버 단위로 고정된 구조다. 이 때문에 한 서버에서 특정 자원이 남아도 다른 서버에서 활용하기 어려웠다. 특히 메모리가 부족해지면 실제로는 필요하지 않은 GPU까지 함께 늘려야 하는 비효율이 반복됐다. 이 같은 구조는 GPU 활용률을 떨어뜨리고 AI DC 구축 운영 비용을 늘린다.

양사는 이러한 문제를 해결하기 위해 CXL 기반 기술을 적용해 CPU, GPU, 메모리를 서버 단위 고정 구조에서 벗어나 유연하게 연결 조합할 수 있는 구조로 전환한다. 기존에 서버 내부에 한정됐던 자원 연결 범위를 서버 여러 대를 묶은 랙 단위까지 넓혀 필요한 자원을 선택적으로 활용하는 방식이다.

이와 함께 양사는 자원 간 연결 방식도 바꾼다. 그동안 AI DC의 GPU 협업 연산은 이더넷 등 범용 네트워크를 통해 데이터를 주고받으며 이뤄졌는데, 이 과정에서 데이터 복사와 소프트웨어 개입이 발생해 속도가 지연되는 한계가 있었다.

양사는 이같은 범용 네트워크 대신 CXL 기반 기술을 적용해 자원을 보다 직접적으로 연결한다. CXL 기반 기술을 활용해 네트워크를 거치지 않고도 자원을 고속으로 연결할 경우 데이터 전송 과정을 단순화해 연산 효율을 높일 수 있다.

이번 협력에서 SK텔레콤은 대규모 AI DC 구축 운영 역량과 AI 모델 개발 및 상용화 경험을 바탕으로 실제 상용 환경에 최적화된 구조 설계를 주도한다. 파네시아는 다양한 링크 반도체 기술을 활용해 기존엔 서버 내부에만 국한돼 있던 연결 구조를 랙 단위 이상으로 확장한다.

양사는 실제 AI 모델을 구동하며 GPU 메모리 활용률, 지연시간, 처리량 등을 종합적으로 검증한 뒤 올 연말까지 차세대 AI DC 구조를 공개할 계획이다. 이후 실제 대형 AI DC 환경에서 실증을 거쳐 상용화·사업화를 추진할 방침이다.

정석근 SK텔레콤 AI CIC장은 “AI DC 경쟁력은 GPU 성능 경쟁을 넘어 메모리와 데이터 흐름까지 포함한 시스템 최적화에 달려있다”며 “이번 협력은 연산 성능이 높아져도 데이터 이동·공급이 이를 따라가지 못하는 구조적 병목인 '메모리 월'을 완화해 AI DC 성능과 경제성을 함께 끌어올릴 것”이라고 말했다.

정명수 파네시아 대표는 “차세대 AI 인프라는 개별 장비 성능이 아니라 다양한 링크 반도체가 만들어내는 ‘구조’가 성능을 좌우한다”며 “SK텔레콤과 함께 글로벌 시장이 주목할 고효율 AI DC의 표준 모델을 제시하겠다”고 밝혔다.