AI 시대 핵심 인프라 '쿠버네티스'…메타넷 "캐스트 AI로 운영·비용 자동 최적화"

AI 워크로드 확대로 비용·운영 부담 심화…쿠버네티스 기반 자동화 핀옵스 전략 제시

컴퓨팅입력 :2025/11/26 15:32    수정: 2025/11/26 15:33

인공지능(AI) 시대 기업의 인프라 운영 방식이 급격히 변화하며 비용 효율성과 운영 민첩성을 동시에 확보하기 위한 핵심 플랫폼으로 '쿠버네티스'가 부상했다. 이 가운데 메타넷은 AI 네이티브 전환을 선도하기 위한 인프라 운영 관리 해법을 제시했다.

메타넷엑스 오창훈 이사는 26일 진행된 'AI-레디 2026' 웨비나에서 "AI 워크로드 증가로 인해 그래픽처리장치(GPU) 자원·멀티 클러스터 환경 관리가 필수 영역으로 떠오르면서 쿠버네티스는 이제 애플리케이션 배포 기술을 넘어 AI 인프라를 효율적으로 운영하기 위한 핵심 플랫폼이 됐다"고 강조했다.

메타넷엑스 오창훈 이사(왼쪽), 이준석 이사 (사진=메타넷)

쿠버네티스의 중요성은 AI 도입 흐름과 맞물려 더 커지고 있다. AI·머신러닝(ML) 기반 모델을 운영하려면 확장 가능한 인프라, 효율적 GPU 관리, 멀티 클라우드 운영 능력이 필수다. 쿠버네티스는 이를 표준화된 방식으로 구현할 수 있는 사실상 유일한 플랫폼으로 자리 잡았다.

특히 대규모언어모델(LLM) 배포까지 단일 플랫폼으로 다룰 수 있어 기업의 AI 인프라 경쟁력을 결정하는 핵심 요소로 꼽힌다.

메타넷은 이같은 쿠버네티스 시장의 핵심 변화로 ▲AI·ML 워크로드의 본격적 융합 ▲GPU 중심 인프라 확산 ▲멀티 클라우드 운영 일반화 ▲보안·규제 대응 요구 증가 등을 제시했다. 기업이 특정 클라우드 서비스 제공자(CSP)에 종속되지 않고 유연하게 인프라를 설계할 수 있다는 점도 쿠버네티스의 강점으로 평가된다.

특히 금융권과 제조·물류 산업에서 쿠버네티스 도입이 빠르게 늘고 있다. 메타넷엑스 이준석 이사는 "전자금융감독규정 개정 이후 컨테이너 기반 재해복구(DR) 체계 구축이 사실상 금융권 표준으로 자리잡으며 레드햇 '오픈시프트'와 같은 엔터프라이즈급 쿠버네티스 플랫폼 도입이 활발해졌다"며 "공공·제조 분야에서도 보안 규제와 스마트팩토리 대응을 위한 클라우드 전환이 급증하고 있다"고 설명했다.

아울러 메타넷이 쿠버네티스 도입·전환 지원을 통해 창출한 인프라 비용 60% 절감, 멀티 클러스터 중앙 관리, 서비스 출시 속도 2배 향상과 같은 실질적 성과가 소개됐다.

쿠버네티스를 구축했다고 해서 운영 효율화가 끝나는 것은 아니다. 오 이사는 "클러스터가 늘어날수록 운영 복잡성은 폭발적으로 증가하기 때문에 이후 단계에서는 비용 최적화와 운영 자동화가 필수"라고 말했다.

이어 "GPU 인스턴스는 가격 변동성이 크고 리전·가용성별 재고가 수시로 바뀌기에 엔지니어가 실시간으로 관리하는 것은 구조적 한계가 있다"고 덧붙였다.

메타넷엑스 김병기 이사 (사진=메타넷)

이러한 배경에서 메타넷엑스는 핵심 솔루션인 '캐스트 AI'를 공급 중이다. 캐스트 AI는 쿠버네티스 클러스터를 AI가 실시간 분석하고 자동으로 리소스를 재배치·조정하는 AI 기반 자동화 '핀옵스' 플랫폼이다. 기존 모니터링 중심 핀옵스를 넘어 인프라를 스스로 최적화·조치하는 자율형 자동화 플랫폼(APA)을 구현하는 것이 특징이다.

캐스트 AI가 제공하는 대표 기능은 ▲AI 기반 리소스 자동 선택 ▲라이트 사이징 ▲빈 패킹 ▲GPU 공유·통합 ▲스팟 인스턴스 자동화 ▲멀티 클라우드 최적화 등이다. 특히 GPU 비용은 전체 AI 운영비 중 가장 큰 비중을 차지하는데 캐스트 AI를 통해 최대 90% 수준까지 GPU 비용을 절감할 수 있다는 점이 강조됐다.

다양한 기업 도입 사례도 소개됐다. 아카마이는 캐스트 AI 적용 후 40~70% 인프라 비용 절감을, 허깅페이스는 GPU 비용 10배 절감, 닐슨IQ는 최대 80% 절감 성과를 거뒀다. 중견기업 역시 스팟 인스턴스 자동화만으로 상당한 비용 개선 효과가 나타난다는 게 메타넷 측 설명이다.

관련기사

또 캐스트 AI는 클라우드·리전별 가격·가용성을 실시간 수집해 최적의 GPU 위치를 자동으로 찾아주는 기능을 지원한다. 가장 저렴한 리전에 워크로드를 자동 라우팅하는 방식이다.

메타넷엑스 김병기 이사는 "캐스트 AI는 클러스터 연결만 하면 초기 분석 보고서를 통해 즉시 절감 가능성을 확인할 수 있고 기술검증(PoC)만으로도 평균 30% 정도의 절감 효과를 거둘 수 있다"며 "캐스트 AI의 한국 공식 파트너로서 PoC·교육·설계를 전담해 고객이 빠르게 투자수익률(ROI)을 확보할 수 있도록 지원한다"고 강조했다.