IBM, '스파이어 엑셀러레이터' 가속기로 메인프레임 AI 시대 연다

AI 추론 전용 HW로 생성형·에이전트형 업무 가속…온프레미스 보안·효율성 동시 확보

컴퓨팅입력 :2025/10/28 14:46

IBM이 메인프레임과 서버 인프라에 적용 가능한 차세대 인공지능(AI) 가속기를 선보였다. 보안성과 복원력을 유지하면서도 생성형 및 에이전트 기반 AI를 효율적으로 처리할 수 있는 전용 하드웨어(HW)를 통해 기업 워크로드 성능과 확장성을 강화하겠다는 목표다.

IBM은 메인프레임 시스템 'IBM z17'과 'IBM 리눅스원 5'에 적용 가능한 AI 가속기 '스파이어 엑셀러레이터'를 정식 출시한다고 28일 밝혔다.

스파이어 엑셀러레이터는 생성형 및 에이전트 기반 AI 업무를 지원하는 빠른 추론 기능을 제공하며 핵심 업무의 보안과 복원력을 최우선으로 고려해 설계됐다. IBM은 오는 12월 초부터 파워11 서버용 제품도 추가로 선보일 예정이다.

스파이어 엑셀러레이터 AI 가속기 (사진=IBM)

최근 IT 환경은 논리 기반 업무 흐름에서 에이전트 기반 AI 추론 중심으로 빠르게 전환되고 있다. 기업들은 저지연 추론과 실시간 반응성을 필요로 하는 AI 모델을 기존 업무와 함께 안정적으로 처리할 수 있는 인프라를 요구하고 있다.

IBM은 이러한 수요에 대응해 보안성과 운영 효율성을 동시에 확보한 AI 추론 전용 HW를 개발했다.

이번에 공개된 스파이어 엑셀러레이터는 IBM 리서치 AI HW 센터의 기술과 인프라 사업부의 개발 역량이 결합된 결과물이다. IBM 요크타운 하이츠 연구소와 올버니대학교 산하 신흥 AI 시스템 센터와의 협업을 통해 빠른 반복 개발 과정을 거치며 완성도를 높였다.

상용화된 제품은 32개의 가속 코어와 256억 개 트랜지스터를 탑재한 5나노미터 기반 시스템온칩(SoC) 형태로, 75와트 PCIe 카드에 장착된다. IBM Z 및 리눅스원 시스템에는 최대 48개, IBM 파워 시스템에는 최대 16개까지 클러스터 구성이 가능하다.

스파이어 엑셀러레이터를 통해 메인프레임과 온프레미스 서버 상에서 AI를 활용할 수 있다. (사진=IBM)

스파이어 엑셀러레이터를 통해 IBM 고객은 온프레미스 환경에서 빠르고 안전한 AI 추론 기능을 활용할 수 있다. 특히 IBM Z 및 리눅스원 시스템에서는 텔럼 II 프로세서와 결합해 고도화된 사기 탐지, 유통 자동화 등 예측 기반 업무에서 다중 AI 모델을 적용할 수 있다.

파워 기반 서버에서는 AI 서비스 카탈로그를 통해 생성형 AI 모델을 업무에 손쉽게 통합할 수 있으며 128개 토큰 길이의 프롬프트 입력을 지원해 시간당 800만 건 이상의 대규모 문서를 지식 베이스에 통합할 수 있다.

관련기사

IBM 인프라 사업부 배리 베이커 최고운영책임자(COO)는 "스파이어 엑셀러레이터를 통해 우리 시스템은 생성형 및 에이전트 기반 AI를 포함한 다중 모델 AI를 지원할 수 있는 역량을 갖추게 됐다"며 "고객이 AI 기반 핵심 업무를 보안성·복원력·효율성을 저해하지 않고 확장할 수 있도록 돕는 동시에, 기업 데이터의 가치를 효과적으로 끌어낼 수 있도록 지원한다"고 말했다.

IBM 반도체·하이브리드 클라우드 부문 무케시 카레 부사장은 "최근 고도화된 AI 역량에 대한 수요가 높아지는 가운데 AI HW 리서치 센터에서 개발된 첫 번째 칩이 상용화 단계에 진입해 자랑스럽다"며 "이번 스파이어 칩의 정식 출시로 메인프레임 및 서버 고객에게 향상된 성능과 생산성을 제공할 수 있게 됐다"고 강조했다.