레드햇-리벨리온, NPU 기반 '오픈시프트 AI' 출시…추론 환경 개선

NPU·vLLM 통합…대규모 추론 워크로드 위한 풀스택 구조 제공

컴퓨팅입력 :2025/12/11 11:48

레드햇이 리벨리온 손잡고 신경처리장치(NPU) 기반 플랫폼을 개발해 인공지능(AI) 추론 환경을 개선했다. 

레드햇은 리벨리온과 '리벨리온 NPU 기반 레드햇 오픈시프트 AI'를 발표했다고 11일 밝혔다. 이 플랫폼은 레드햇 오픈시프트 AI, 리벨리온의 NPU, 가상거대언어모델(vLLM) 엔진을 결합해 엔터프라이즈급 풀스택 AI 추론 환경을 제공한다.

리벨리온 NPU는 AI 추론에 특화된 아키텍처다. 그래픽처리장치(GPU) 대비 에너지 효율을 높여 데이터센터 구축·운영 비용을 줄인다. 또 자체 소프트웨어(SW) 스택과 오픈소스 프레임워크 지원을 통해 GPU와 유사한 개발 환경을 제공한다.

레드햇이 리벨리온 손잡고 신경처리장치(NPU) 기반 플랫폼을 개발해 인공지능(AI) 추론 환경을 개선했다. (사진=레드햇)

새 솔루션은 하드웨어(HW)부터 모델 서빙까지 전 영역을 아우르는 풀스택 구조를 제공한다. 리벨리온 SW 스택은 레드햇 오픈시프트 AI에서 네이티브 실행돼 배포 속도를 높인다. 레드햇 오픈시프트 인증을 받은 NPU 오퍼레이터는 온프레미스·멀티클라우드 환경에서 모두 작동한다.

해당 플랫폼은 랙 스케일 NPU와 vLLM 기반으로 고처리량, 저지연, 전력 효율성을 제공한다. 이를 통해 고객은 LLM 등 다양한 추론 워크로드를 안정적으로 운영할 수 있다. 데이터 온프레미스 유지와 규제 준수 측면에서도 강화된 보안 환경을 제공한다. 코어에서 엣지까지 선형 확장을 지원해 배포 유연성도 확보했다.

관련기사

브라이언 스티븐스 레드햇 AI 부문 수석부사장 겸 최고기술책임자(CTO)는 "우리 솔루션을 리벨리온의 NPU와 통합해 엔터프라이즈에 검증된 풀스택 대안을 제공할 것"이라며 "고객은 실제 운영 환경의 AI에 필수인 효율성과 저지연성, 수평 확장성을 갖추고 AI 추론 워크로드를 배포할 수 있다"고 밝혔다.

박성현 리벨리온 대표는 "이번 협력으로 기업들이 보다 효율적이고 안전하게 AI 서비스를 확장할 수 있도록 지원할 것"이라며 "GPU 중심 환경을 넘어 NPU 기반 추론 인프라의 새로운 대안을 제시하는 첫 사례가 될 것"이라고 밝혔다.