아크릴, 엔비디아 인피니밴드 대체 AI기술 개발 추진...55억 과제 선정

연세대, 성균관대, 아주대 산학협력단과 공동 연구...2028년 12월까지 수행

컴퓨팅입력 :2026/06/10 15:00

AX 전문기업 아크릴(대표 박외진)이 국내 AI 인프라의 핵심 병목으로 꼽히는 GPU 클러스터 네트워크 기술 국산화에 나선다.

아크릴은 과학기술정보통신부 산하 ‘정보통신기획평가원(IITP)’이 추진하는 ‘대규모 GPU 클러스터 환경에서의 네트워크 효율성 극대화를 위한 이더넷 기반 GPU 클러스터 네트워크 패브릭 시스템 및 최적화 기술 개발’ 국책과제에 주관기관으로 선정됐다고 10일 밝혔다.

이번 과제는 총 사업비가 약 67억원 규모(정부지원금이 약 55억원)인 대규모 연구개발 프로젝트다. 개발기간은 2026년 5월부터 2028년 12월까지다. 아크릴은 주관기관으로 연세대학교, 성균관대학교, 아주대학교 산학협력단과 공동 연구를 수행한다. 3개 대학은 각각 AI 데이터 처리 가속, 고신뢰 보안, 이더넷 기반 클러스터 네트워크 최적화 관련 원천 연구를 담당한다.

아크릴은 이번 과제를 통해 확보한 기술을 자사 상용 GPU 인프라 통합 플랫폼 ‘JONATHAN GPUBASE(GPU베이스)’와 결합할 계획이다. 이를 통해 클라우드서비스사업자(CSP), 관리형서비스사업자(MSP), 공공 AI 데이터센터, 의료 AI 인프라 등에 적용 가능한 국산 GPU 네트워크 패브릭 솔루션으로 완성한다는 목표다.

염익준 아크릴 CTO는 “AI 인프라 경쟁의 핵심은 수만 개 GPU를 안정적으로 묶는 네트워크 패브릭 기술”이라며 “이번 과제를 통해 인피니밴드 중심 구조의 비용·공급·자산 활용 한계를 해소할 개방형 이더넷 GPU 네트워크 대안을 제시하고, 국내 AI 인프라 생태계 자립 기반을 마련하겠다”고 밝혔다.

현재 대규모 GPU 클러스터 네트워크는 엔비디아 전용 네트워크 기술인 ‘인피니밴드’가 사실상 주도하고 있다. 클러스터 규모가 커질수록 인피니밴드 관리 소프트웨어인 ‘UFM(Unified Fabric Manager)’ 사용이 요구되고 있으며, 이에 따른 구독형 라이선스 비용은 CSP와 공공 AI 데이터센터의 운영비용(OPEX)을 높이는 요인으로 지적돼 왔다.

인피니밴드 중심의 벤더 종속 구조는 전용 스위치와 스마트 NIC(Network Interface Card) 공급 지연, 기존 이더넷 장비 활용 제약, 신규 장비 도입에 따른 자본적지출(CAPEX) 부담 등 운영 전반의 한계로 이어진다. 이에 글로벌 시장에서는 기존 이더넷 자산을 활용하면서 GPU 간 고속 통신을 구현할 수 있는 ‘RoCEv2(RDMA over Converged Ethernet v2)’ 기반 개방형 이더넷 패브릭이 인피니밴드 대안으로 부상했다.

염익진 아크릴 CTO가 회사 CI를 배경으로 포즈를 취했다.

이번 과제는 인피니밴드 중심의 독점적 AI 네트워크 구조에서 벗어나 이더넷/RoCE 기반의 개방형 인프라로 전환하는 과정에서 새롭게 발생하는 멀티 벤더 운영 복잡성과 벤더 종속 문제를 해결하는 데 의의가 있다. RoCE는 Arista, Cisco, Broadcom, NVIDIA 등 다양한 벤더의 경쟁을 가능하게 하지만, 각 벤더의 네트워크 운영체제 (NOS)와 패브릭 (내부 연결망) 관리 체계가 분리돼 있어 데이터센터 운영자는 다시 특정 벤더나 개별 관리 도구에 종속될 수 있다. 아크릴의 GPUBase는 이러한 공백을 메우기 위해 '멀티벤더 RoCE 패브릭'을 GPU 워크로드(workload) 관점에서 통합 관찰·관리·최적화하는 공통 제어 계층을 제공한다.

국내에서는 AI 데이터센터 네트워크가 여전히 인피니밴드 중심으로 인식되고 있으며, '이더넷/RoCE' 기반 AI 패브릭 도입과 운영 경험은 아직 제한적인 편이다. 그러나 해외 시장에서는 이미 변화가 빠르게 진행되고 있다. 시장조사기관 Dell’Oro Group에 따르면, 2025년 AI scale-out 네트워크용 데이터센터 스위치 시장에서 이더넷은 인피니밴드의 두 배 이상 규모로 성장했고, 2026년 1분기에도 AI 클러스터용 데이터센터 스위치 매출의 약 3분의 2를 이더넷이 차지한 것으로 보고됐다.

이는 글로벌 하이퍼스케일러와 AI 클라우드 사업자들이 개방형 표준, 공급망 다변화, 비용 효율성, 멀티 벤더 생태계 확보를 위해 이더넷/RoCE 기반 구조로 빠르게 이동하고 있음을 보여준다. 이에, 국내에서도 향후 이더넷/RoCE 기반 AI 인프라 전환이 본격화될 가능성이 높으며, 이 과정에서 멀티벤더 RoCE 패브릭을 통합적으로 관리하고 GPU workload에 맞게 최적화할 수 있는 GPUBase의 필요성은 더욱 커질 것으로 아크릴은 예상했다.

아크릴은 개방형 이더넷 RDMA 영역에서 국내외 연구 성과와 지식재산권을 축적해 왔다. 회사는 대규모 멀티테넌트 환경에서 RDMA 성능 격리 원천 기술인 ‘PeRF’를 컴퓨팅 시스템분야 대표 국제 학술대회인 ‘USENIX ATC 2024’에서 발표했다. RDMA 다중경로 전송 기술인 ‘UL-MPRDMA’는 글로벌 공약분야 국제 학술지 ‘IEEE Access’에 게재된 바 있다. RoCEv2 패브릭 및 RDMA 전송 최적화 분야에서도 해외 14건을 포함해 국내외 특허 22건을 보유하고 있다.

아크릴은 이미 인피니밴드와 RoCEv2를 모두 지원하는 상용 GPU 인프라 통합 플랫폼 GPU베이스를 운영 중이다. 이번 과제를 통해 GPU베이스에 개방형 이더넷 GPU 클러스터 패브릭 기술을 결합하고, 3차년도에는 아크릴 자체 IDC(Internet Data Center)에 구축한 RoCEv2 클러스터에서 대규모 실증을 진행할 예정이다.

특히 이번 과제는 엔비디아 ‘Spectrum-X’가 높은 성능 수준을 제시해 온 구간에서 개방형 네트워크 운영체제인 SONiC(Software for Open Networking in the Cloud) 기반으로 90% 이상의 유효 대역폭 달성을 목표로 한다. 이를 통해 국내 CSP, 공공 AI 데이터센터, 의료 AI 인프라 운영자가 인피니밴드 중심 구조에 종속되지 않고 RoCEv2 기반 개방형 이더넷 GPU 네트워크를 실질적 대안으로 선택할 수 있는 기반을 마련한다는 계획이다.

아크릴은 이번 과제 선정 이전부터 국산 AI 인프라 성능과 안정성을 실증하는 ‘K-Scale evaluation’ 등 국가 주도 AI 인프라 평가·실증 이니셔티브에 선제적으로 참여해 왔다. 상용 GPU 베이스 플랫폼을 실제 국가 AI 인프라 실증 현장에 투입해 온 이력이 이번 주관기관 선정의 배경이 됐다는 평가다.