IBM, '스파이어 엑셀러레이터' 가속기로 메인프레임 AI 시대 연다

IBM이 메인프레임과 서버 인프라에 적용 가능한 차세대 인공지능(AI) 가속기를 선보였다. 보안성과 복원력을 유지하면서도 생성형 및 에이전트 기반 AI를 효율적으로 처리할 수 있는 전용 하드웨어(HW)를 통해 기업 워크로드 성능과 확장성을 강화하겠다는 목표다.

IBM은 메인프레임 시스템 'IBM z17'과 'IBM 리눅스원 5'에 적용 가능한 AI 가속기 '스파이어 엑셀러레이터'를 정식 출시한다고 28일 밝혔다.

스파이어 엑셀러레이터는 생성형 및 에이전트 기반 AI 업무를 지원하는 빠른 추론 기능을 제공하며 핵심 업무의 보안과 복원력을 최우선으로 고려해 설계됐다. IBM은 오는 12월 초부터 파워11 서버용 제품도 추가로 선보일 예정이다.

최근 IT 환경은 논리 기반 업무 흐름에서 에이전트 기반 AI 추론 중심으로 빠르게 전환되고 있다. 기업들은 저지연 추론과 실시간 반응성을 필요로 하는 AI 모델을 기존 업무와 함께 안정적으로 처리할 수 있는 인프라를 요구하고 있다.

IBM은 이러한 수요에 대응해 보안성과 운영 효율성을 동시에 확보한 AI 추론 전용 HW를 개발했다.

이번에 공개된 스파이어 엑셀러레이터는 IBM 리서치 AI HW 센터의 기술과 인프라 사업부의 개발 역량이 결합된 결과물이다. IBM 요크타운 하이츠 연구소와 올버니대학교 산하 신흥 AI 시스템 센터와의 협업을 통해 빠른 반복 개발 과정을 거치며 완성도를 높였다.

상용화된 제품은 32개의 가속 코어와 256억 개 트랜지스터를 탑재한 5나노미터 기반 시스템온칩(SoC) 형태로, 75와트 PCIe 카드에 장착된다. IBM Z 및 리눅스원 시스템에는 최대 48개, IBM 파워 시스템에는 최대 16개까지 클러스터 구성이 가능하다.

스파이어 엑셀러레이터를 통해 메인프레임과 온프레미스 서버 상에서 AI를 활용할 수 있다. (사진=IBM)

스파이어 엑셀러레이터를 통해 IBM 고객은 온프레미스 환경에서 빠르고 안전한 AI 추론 기능을 활용할 수 있다. 특히 IBM Z 및 리눅스원 시스템에서는 텔럼 II 프로세서와 결합해 고도화된 사기 탐지, 유통 자동화 등 예측 기반 업무에서 다중 AI 모델을 적용할 수 있다.

파워 기반 서버에서는 AI 서비스 카탈로그를 통해 생성형 AI 모델을 업무에 손쉽게 통합할 수 있으며 128개 토큰 길이의 프롬프트 입력을 지원해 시간당 800만 건 이상의 대규모 문서를 지식 베이스에 통합할 수 있다.

IBM, '스파이어 엑셀러레이터' 가속기로 메인프레임 AI 시대 연다

관련기사

지금 뜨는 기사

이시각 헤드라인

엔비디아는 왜 액침냉각을 인증하지 않을까

국정자원 화재 후 최대 격전지된 'DR'…대형·중견 IT서비스 기업 각축전

[써보고서] 접으면 폰, 펼치면 10형 태블릿...'갤럭시 Z 트라이폴드'

"금값, 720만원까지 간다"…골드만삭스 전망, 근거는?

ZDNet Power Center