인텔이 24일(현지시간) AI 인프라 스타트업 삼바노바와 함께 AI 추론 시장 확대를 위해 다년간 협업한다고 밝혔다. 삼바노바가 공개한 AI 추론 전용 칩인 SN50과 인텔 제온 프로세서, 인텔 GPU를 결합해 확장성 높은 AI 추론 서비스를 제공한다는 것이다.

삼바노바가 공개한 새로운 AI 추론용 칩인 SN50은 엔비디아 등 GPU 대비 초당 토큰 생성 등 처리 속도는 최대 5배 높이고 총소유비용(TCO)은 30% 수준으로 낮췄다.

삼바노바는 SN50이 에이전틱 AI 등 자율적 모델 실행과 상호작용을 필요로 하는 워크로드에 최적화됐다고 설명했다.

삼바노바 SN50 칩. (사진=삼바노바)

SN50은 고대역폭 네트워크, 대규모 배치 처리, 낮은 지연시간 등 인프라적 요소를 대폭 강화해 실제 대규모 기업용 및 통신사 수준의 서비스에 적합한 퍼포먼스를 제공한다는 평가를 받고 있다.

초기 고객사인 소프트뱅크는 일본 내 AI 데이터센터에 SN50을 도입해 초저지연 추론 서비스를 제공할 예정이다.

고성능 P코어 기반 제온 6700/6500 시리즈 프로세서. (사진=인텔)

인텔은 AI 전처리(프리필) 과정을 서버용 제온 프로세서와 데이터센터용 GPU로 처리하고 핵심인 추론 작업을 삼바노바 SN50으로 처리하는 랙 수준 솔루션을 글로벌 공급할 예정이다.

인텔은 "인텔의 CPU와 네트워크, 스토리지 기술과 삼바노바 SN50을 결합한 솔루션은 기존 GPU 중심 데이터센터 전략을 보완하는 동시에 대규모 추론 워크로드에 매력적인 옵션이 될 수 있다"고 강조했다.

로드리고 리앙 삼바노바 공동 설립자 겸 CEO는 "AI 경쟁이 대형 모델 구축에서 에이전틱 AI를 전 데이터센터 규모로 확장하는 단계로 이동하고 있으며 인텔과 긴밀한 협력이 이 전환을 촉진할 것”이라고 밝혔다.