모레, GPU 대체 AI 인프라 성능 글로벌 입증

모레가 텐스토렌트 기반 시스템에서 엔비디아 DGX A100급 이상의 거대언어모델(LLM) 추론 성능을 달성하며 그래픽처리장치(GPU) 중심 AI 인프라 대안 전략을 제시했다.

모레는 텐스토렌트 '갤럭시 웜홀' 시스템에 자사 MoAI 추론 프레임워크를 적용해 LLM 추론 성능을 입증했다고 4일 밝혔다. 모레의 MoAI 추론 프레임워크는 엔비디아·AMD·텐스토렌트 등 이종 GPU 및 신경망처리장치(NPU)를 단일 클러스터에서 통합 운용하는 분리 추론 솔루션이다. 특정 벤더에 종속되지 않고 다양한 AI 가속기를 유연하게 활용하는 인프라 전략 구축이 가능하다.

GPT-OSS·큐원·GLM·딥시크 등 최신 혼합전문가(MoE) 모델 기준 테스트에 따르면 MoAI 추론 프레임워크는 엔비디아 DGX A100급 또는 그 이상의 성능을 달성했다. 모레는 GPU와 텐스토렌트 웜홀 칩을 결합한 '이종 분산 서빙' 구조로 비용 효율성도 개선했다. 텐스토렌트 칩을 프리필(prefill·입력 처리) 전용 가속기로 활용해 고비용 구조의 고대역폭메모리(HBM) 사용을 줄이고 전체 인프라 비용을 절감했다.