레드햇, AI 포트폴리오 업데이트…추론·모델 검증 강화

레드햇 AI 인퍼런스 서버로 하이브리드 클라우드 추론 일관성·효율성 제고

컴퓨팅입력 :2025/05/26 17:04

레드햇이 인공지능(AI) 포트폴리오를 업데이트해 엔터프라이즈 AI 분야에서 고객 선택권을 확대했다. 

레드햇은 레드햇 AI 인퍼런스 서버와 레드햇 AI 서드파티 검증 모델·라마 스택·모델 컨텍스트 프로토콜(MCP) API를 통합하고 엔터프라이즈 AI 포트폴리오 전반에 걸친 주요 업데이트를 진행했다고 26일 밝혔다.

신규 레드햇 AI 인퍼런스 서버는 레드햇 오픈시프트 AI와 레드햇 엔터프라이즈 리눅스(RHEL) AI에 통합됐으며 독립형 솔루션으로도 제공된다. 이를 통해 조직은 하이브리드 클라우드 전반에서 대규모로 빠르고 일관되며 비용 효율적인 추론을 제공할 수 있다.

레드햇 공식 로고 (사진=레드햇)

레드햇 AI 서드파티 검증 모델은 허깅페이스의 검증된 AI 모델 컬렉션과 배포 가이드를 제공한다. 모델 압축 기술을 활용해 크기를 줄이고 추론 속도를 높여 자원 소비와 운영 비용을 최소화한다.

라마 스택과 MCP 통합 API는 생성형 AI 애플리케이션과 에이전트 개발을 위한 표준화된 인터페이스를 지원한다. vLLM 추론 검색 증강 생성 모델 평가 가드레일 에이전트 기능을 단일 API로 제공하며 외부 도구 연계도 가능하게 해 배포 복잡성을 해소한다.

관련기사

레드햇 오픈시프트 AI v2.20은 최적화된 모델 카탈로그 분산 학습 기능 저장소 기술 프리뷰 등을 포함해 대규모 AI 워크로드를 구축 학습 배포 모니터링할 수 있도록 강화됐다. RHEL AI 1.5는 구글 클라우드 마켓플레이스 가용성과 다국어 모델 커스터마이징 기능을 제공한다. 향후 일본어, 힌디어, 한국어를 지원할 예정이다. 레드햇 AI 인스트럭트랩 온 IBM 클라우드 서비스도 출시돼 모델 맞춤화 과정을 간소화한다.

조 페르난데스 레드햇 AI 사업 부문 부사장 겸 총괄 매니저는 "더 빠르고 효율적인 추론이 생성형 AI 혁신의 새로운 의사 결정 포인트로 부상하고 있다"며 "레드햇 AI 인퍼런스 서버를 통한 향상된 추론 기능과 새로운 검증된 서드파티 모델 컬렉션을 갖춰 조직이 필요한 곳에 원하는 방식으로 서비스를 제공할 것"이라고 밝혔다.