AI 반도체 기업 퓨리오사AI가 2세대 칩 RNGD(레니게이드) 1차 양산물량 4천장을 인도받기 시작했다고 28일 밝혔다.

RNGD는 파운드리(반도체 위탁생산) 협력사인 대만 TSMC가 제조를 완료한 뒤, 아수스(ASUS)의 카드 제조 공정을 거쳐 출고된다. 회사는 올해 약 2만장 수준의 양산을 계획 중이다.

퓨리오사AI가 TSMC로부터 인도받은 RNGD 칩을 기반으로 카드 양산 출하작업을 거치고 있다.(사진=퓨리오사 AI)

RNGD는 앞서 2024년 하반기 미국 스탠퍼드대학교 세계 반도체 기업 연례 학술행사 ‘핫 칩스 2024’에서 공개된 바 있으며, 이후 엄밀한 제품화 과정을 거쳤다. 이번 양산은 세계적으로도 HBM을 탑재한 고성능 NPU(신경망처리장치)가 개발을 넘어 양산 단계까지 이른 드문 경우라 글로벌 반도체 업계의 관심을 모으고 있다.

RNGD는 두 가지 형태로 제공된다. ‘RNGD PCIe 카드’는 180W TDP의 저전력 설계를 적용해 기존 서버에 바로 장착 가능한(drop-in) AI 가속기로 제공된다. ‘NXT RNGD 서버’는 RNGD 카드 8장을 탑재한 4U 랙마운트 서버로, 시스템 전체 소비 전력은 3kW에 불과하다. 표준 랙 환경에 최대 5대까지 장착 가능하며, 랙당 최대 20 PFLOPS(INT8)의 AI 추론 성능을 제공한다.

퓨리오사AI는 양산 물량 인도를 계기로 엔터프라이즈 시장 공략에 본격 나선다는 구상이다. 실제로 이미 이달 초 국내 대기업 계열사 한 곳에서 RNGD 구매를 발주하는 등 글로벌 엔터프라이즈 단에서 RNGD 검증을 마치고 정식 채택하는 사례가 늘어나고 있다.

퓨리오사AI는 그동안 하드웨어 안정화와 소프트웨어 스택 고도화를 진행해 왔으며, 이를 토대로 작년 하반기 LG 엑사원(EXAONE) 도입 확정과 오픈AI와의 GPT-OSS 모델 공개 시연 등 실사용 기반의 성과를 축적해 왔다. TSMC, SK하이닉스 등 글로벌 파트너들과의 협력 체계를 바탕으로 안정적인 양산·공급 라인망도 구축했다.

RNGD는 인프라 총소유비용(TCO)를 절감할 것으로 기대된다. 이 칩은 기존 인프라 변경 없이 바로 쓸 수 있다. 현재 데이터센터 냉각 방식의 주류를 이루는 공냉식을 기반으로 동작하기 때문이다.

아울러 RNGD는 AI 추론에 최적화된 TCP 아키텍처를 기반으로, 표준 환경에서 GPU 기반 시스템 대비 2.5배 높은 ‘랙당 연산 밀도’를 제공한다. 이는 동일한 공간과 전력 조건에서 더 많은 AI 추론 워크로드를 처리할 수 있음을 의미한다.

백준호 퓨리오사AI 대표는 “RNGD 양산은 글로벌 AI 3강·반도체 2강 도약을 위한 진일보”라며 “박차를 가해 글로벌 시장 매출 확대를 이루어내겠다”고 말했다.