엔비디아 만난 클라우데라, AI 추론·개발 안전성 높였다

클라우데라가 엔비디아 기술로 생성형 인공지능(AI) 추론 기능과 개발 안전성을 업그레이드했다. 개발자는 개발 과정을 간소화하고 생성형 AI 애플리케이션 개발을 더 빠르고 안전하게 추진할 수 있을 전망이다.

클라우데라는 엔비디아의 추론 마이크로서비스 엔비디아 NIM으로 구동되는 '클라우데라 AI 인퍼런스'를 출시했다고 10일 밝혔다.

클라우데라 AI 인퍼런스는 업계 최초로 NIM 기능을 제공하는 AI 추론 서비스다. 거대언어모델(LLM) 배포와 관리를 간소화해 기업이 데이터를 최대한으로 활용하고, 생성형 AI를 파일럿 단계에서 완전 생산 단계로 완성할 수 있게 돕는다.

클라우데라가 엔비디아 기술로 생성형 인공지능(AI) 추론 기능과 개발 안전성을 업그레이드했다. (사진=클라우데라)

서비스 주요 기능은 ▲고급 AI 기능 ▲하이브리드 클라우드 및 프라이버시 ▲확장성 및 모니터링 ▲오픈 API 및 지속적 통합·배포(CI/CD) 통합 ▲엔터프라이즈 보안 ▲위험 관리된 배포 등이다.

이 제품은 고급 AI 기능을 통해 엔비디아 NIM으로 라마, 미스트랄 등 오픈소스 거대언어모델(LLM)을 최적화한 자연어처리, 컴퓨터 비전, AI 분야 개발을 돕는다. 워크로드를 온프레미스, 클라우드에서 실행하 가능하고 가상 사설 클라우드(VPC) 배포로 보안·규제 준수를 강화했다.

클라우데라 AI 인퍼런스는 자동 확장을 비롯한 고가용성(HA), 실시간 성능 추적으로 문제를 탐지·수정할 수 있다. 이를 통해 효율적인 리소스 관리를 가능케 한다. 또 모델 배포, 관리, 모니터링을 위한 표준 준수 API에 접근할 수도 있다. 이를 통해 CI·CD 파이프라인, ML옵스 워크플로우 통합을 지원한다.

클라우데라는 해당 서비스가 높은 보안성을 갖췄다는 점도 강조했다. 안전한 개발과 배포를 진행할 수 있도록 민감한 데이터가 비공개 영역을 벗어나 공급업체가 호스팅하는 AI 모델 서비스로 유출되는 것을 방지해서다. 이를 통해 빠른 속도로 AI 챗봇, 가상 비서, 에이전트 애플리케이션의 효율적인 개발을 도와 기업의 생산성 향상과 신규 사업을 강화할 수 있다는 설명이다.

개발자들은 엔비디아 텐서코어 그래픽처리장치(GPU)로 최대 36배 빠른 성능과 중앙처리장치(CPU) 대비 약 4배 더 높은 처리량으로 엔터프라이즈급 LLM을 구축·맞춤화· 배포할 수 있다.

클라우데라 AI 인퍼런스는 사용자인터페이스(UI), API가 엔비디아 NIM 컨테이너와 직접 통합돼 명령줄 인터페이스(CLI), 별도의 모니터링 시스템이 필요 없다.

클라우데라는 개발자들이 이 서비스로 기존보다 더 안전하고 빠른 AI 추론 기능을 경험할 수 있다는 입장이다. 최근 딜로이트 조사에 따르면 개발 업계에서 복잡한 접근법을 지양하고 보안성과 확장성을 갖춘 솔루션 요구가 늘어난 것으로 알려졌다.

클라우데라 딥토 차크라바티 최고제품책임자(CPO)는 "이용자는 소프트웨어(SW)로 강력한 AI 애플리케이션을 만들고, 고성능 AI 애플리케이션을 실행할 수 있게 됐다"며 "신뢰할 수 있는 데이터 기반으로 신뢰할 수 있는 AI 애플리케이션을 구축해 고객을 위한 혁신을 지원할 것"이라고 밝혔다.