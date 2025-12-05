에이전틱 인공지능(AI) 시대가 오면서 AI 산업 초점이 모델 훈련에서 초저지연 추론으로 이동하고 있다. 이제 모델 데이터가 생성되는 곳에서 추론까지 실시간 처리해야 AI 서비스 속도와 품질 유지가 가능하다. 글로벌 엣지 네트워크와 분산 클라우드의 중요성이 커지고 있는 이유다.

이에 발맞춰 아카마이는 전 세계에 구축한 초대형 엣지 인프라 기반으로 AI 추론 시대를 주도하겠다고 포부를 밝혔다. 단순히 기술을 제공하는 것을 넘어 고객 산업에 맞는 초저지연 환경을 안정적으로 구축하겠다는 목표다.

이경준 아카마이코리아 대표와 강모윤 상무는 최근 지디넷코리아를 만나 'QCP(Qualified Compute Partner)' 프로그램을 핵심 전략으로 내세우며 이같이 밝혔다.

이경준 아카마이코리아 대표(오른쪽)와 강모윤 상무.

QCP는 아카마이의 기술 구조를 이해하고, 고객별 환경에 맞춰 시스템을 구현할 수 있는 파트너사만 참여할 수 있는 인증 체계다. 아카마이의 엣지·보안·컴퓨트 구조를 완전히 이해하고 구현할 수 있는 기업만 인증을 받을 수 있다.

강 상무는 QCP 선정 기준은 매우 엄격하다고 말했다. 그는 "우리는 콘텐츠 전송 네트워크(CDN) 기반으로 성장했지만, 최근 클라우드와 엣지 컴퓨팅을 결합한 구조를 강화했다"며 "이 두 영역을 얼마나 정교하게 통합할 수 있는 능력이 QCP 선정 핵심"이라고 설명했다.

이어 "기술적 우수성, 보안 규정 준수, 엣지 네트워크를 얼마나 안정적으로 활용할 수 있는지도 주요 평가 항목"이라며 "특히 데이터 주권 이슈가 강화되는 만큼 컴플라이언스를 충족하는 능력도 중요하다"고 덧붙였다.

강 상무가 QCP 프로그램을 소개하고 있다.

운영 역량도 QCP 프로그램 핵심 조건이다. 파트너사는 24시간 365일 글로벌 고객을 모두 지원하는 조건도 갖춰야 한다. 그는 "특정 국가 지원만 가능한 기업도 QCP 인증을 받을 수 없다"며 "모든 지역 고객을 상대할 수 있어야 한다"고 설명했다.

QCP 인증을 받은 파트너사는 아카마이 고객에게 맞춘형 솔루션을 제공하고, 시스템 구축·최적화·보안 설정 등 기술 지원 전반을 수행한다. 고객 환경을 분석해 가장 적합한 엣지·컴퓨트 구조를 설계하거나 운영 과정에서 발생하는 문제에 실시간 대응한다. 고객은 엄격한 인증 체계를 받은 파트너사로부터 서비스를 받을 수 있다.

지금까지 전 세계에서 약 40여 개 기업만 QCP 인증을 획득했다. 현재 국내 기업 두 곳이 심사를 받고 있다. 강 상무는 "인증 보안 기준이 매우 높아 기술력만으로는 통과하기 어려울 것"이라고 말했다.

그는 "QCP는 고객 경험을 지키기 위한 최소 조건"이라며 "우리 인프라 확장성과 보안 역량을 그대로 고객에게 전달해야 한다"고 덧붙엿다.

엔비디아 손잡은 아카마이..."AI 핵심은 '초저지연 분산 추론'"

아카마이는 최근 엔비디아와 협력해 초저지연 AI 추론 시대를 열겠다는 포부를 밝혔다. 아카마이의 분산 클라우드 플랫폼에 엔비디아 그래픽처리장치(GPU)를 결합해 글로벌 엣지 네트워크 전반에서 지연 없이 AI 인퍼런스를 제공할 전략이다.

이경준 대표가 아카마이와 엔비디아 협력에 대해 설명하고 있다.

이경준 대표는 AI 시장 중심이 모델 훈련에서 초저지연 추론으로 이동하고 있다고 진단했다. 그는 "사용자와 가장 가까운 지점에서 모델을 실행해야 지연 시간을 최소화할 수 있다"며 엣지 기반 AI 추론 필요성을 강조했다.

이 대표는 아카마이가 이런 구조를 가장 효율적으로 구현할 수 있는 기업이라고 평했다. 그는 "우리는 전 세계 37만 개가 넘는 엣지 노드를 운영하고 있다"며 "대규모 GPU를 한곳에 두는 하이퍼스케일러 방식보다 추론 비용·확장성·안정성에서 모두 우월하다"고 강조했다.

아카마이와 엔비디아의 협력은 단순한 GPU 공급을 넘어 '분산 인퍼런스 인프라' 공동 설계 단계로 확장될 전망이다. 엔비디아는 아카마이 엣지 환경에 최적화된 GPU 아키텍처와 소프트웨어 스택을 제공하고, 아카마이는 이를 기반으로 엣지 단에서 대규모 모델 추론을 직접 수행하는 분산 구조를 구현할 계획이다.

이에 따라 기업들은 중앙 데이터센터로 트래픽·연산을 몰지 않고도 OTT·게임·커머스·실시간 영상 분석 등 고성능 AI 워크로드를 사용자 가까운 위치에서 처리할 수 있게 된다. 이는 지연시간을 줄이는 동시에 운영 비용을 절감할 수 있는 방식이다.

이 대표는 분산 인퍼런스 시대 표준이 될 것이라고 포부를 밝혔다. (사진=아카마이)

이 대표는 특히 에이전틱 AI 시대에 추론량이 폭증해도 엣지 기반 분산 구조로 이를 막을 수 있다고 강조했다. 분산 클라우드를 통해 늘어난 추론량에 효과적으로 대응할 수 있다는 이유에서다.

그는 "향후 AI 인퍼런스의 핵심은 데이터가 생성되는 곳에서 바로 추론까지 이뤄지는 구조"라며 "중앙집중형 클라우드보다 성능과 비용을 동시에 관리할 수 있다"고 주장했다.

이어 "AI 시대에는 물리적 서버 위치보다 최적 경로를 설계하는 능력이 경쟁력”이라며 "우리는 앞으로 분산 인퍼런스 시대 표준이 될 것”이라고 포부를 밝혔다.