AWS, 자체 칩 '그래비톤5' 출격…에이전틱 AI 인프라 정조준

AI 무게중심 GPU서 CPU로 이동…추론·데이터 처리 성능 높인 차세대 설계 칩 상용화

컴퓨팅입력 :2026/06/15 11:29

아마존웹서비스(AWS)가 차세대 자체 설계 프로세서 '그래비톤5'를 정식 출시하며 에이전틱 인공지능(AI) 시대를 겨냥한 클라우드 인프라 경쟁력 강화에 나선다. 실시간 추론과 코드 생성, 다단계 작업 오케스트레이션 등 AI 에이전트 워크로드에 최적화된 성능을 앞세워 AI 인프라 시장 공략을 본격화한다는 전략이다.

AWS는 그래비톤5 기반 '아마존 EC2 M9g'와 'M9gd' 인스턴스를 정식 출시했다고 15일 밝혔다. 그래비톤5는 지난해 'AWS 리인벤트 2025'에서 처음 공개된 이후 프리뷰 단계를 거쳐 이번에 상용화됐다.

최근 AI 산업은 생성형 AI를 넘어 스스로 판단하고 여러 업무를 수행하는 에이전틱 AI 중심으로 빠르게 전환되고 있다. 이에 대규모 동시 작업 처리와 저지연 응답, 높은 메모리 대역폭을 제공할 수 있는 인프라 수요도 증가하는 추세다.

AWS 그래비톤5 (사진=AWS)

AWS는 이러한 변화에 대응하기 위한 차세대 프로세서로 그래비톤5를 선보였다. 실시간 추론과 코드 생성, 다단계 업무 수행 등 에이전틱 AI 워크로드를 지원하도록 설계됐으며 대규모 동시 실행 환경에서도 안정적인 성능을 제공하는 것이 특징이다.

앞서 메타는 에이전틱 AI 개발을 위해 수천만 개 규모 그래비톤 코어 도입을 결정했으며 우버와 스노우플레이크도 관련 워크로드에 그래비톤을 활용 중이다. 현재 전 세계 12만 개 이상 고객이 그래비톤 기반 환경을 구축한 것으로 집계됐다.

회사 측에 따르면 그래비톤5는 칩당 192개 코어와 이전 세대 대비 5배 확대된 캐시, DDR5-8800 메모리, PCIe 젠 6 등을 지원한다. 특히 코어 간 데이터 이동 거리를 줄여 지연시간을 최대 33% 단축했으며 네트워크와 스토리지 대역폭도 향상했다. 이를 통해 실시간 게임과 데이터베이스(DB), 빅데이터 분석, 전자설계자동화(EDA) 등 고성능 워크로드를 보다 효율적으로 처리할 수 있다는 설명이다.

성능 개선 폭도 크다. M9g 인스턴스는 이전 세대 대비 최대 25% 향상된 컴퓨팅 성능을 제공하며 웹 애플리케이션과 머신러닝 추론은 최대 35%, DB는 최대 30% 더 빠르게 실행할 수 있다. M9gd 인스턴스는 최대 11.4테라바이트(TB) NVMe SSD 스토리지와 최대 30% 향상된 입출력 성능을 지원해 고속 로컬 스토리지가 필요한 환경을 겨냥했다.

보안성도 강화했다. 두 인스턴스 모두 6세대 AWS 니트로 시스템 기반으로 구축됐으며 새롭게 적용된 '니트로 아이솔레이션 엔진'은 워크로드 간 격리를 수학적으로 검증하는 방식으로 구현됐다. AWS는 이를 통해 클라우드 환경에서 보안성과 신뢰성을 더욱 높일 수 있을 것으로 보고 있다.

그래비톤5는 실제 고객 환경에서도 성과를 내고 있다. 에어비앤비는 검색 워크로드 테스트에서 이전 세대 그래비톤4 대비 최대 20%, 동세대 다른 시스템 아키텍처 대비 최대 25% 성능 향상을 확인했다고 밝혔다. SAP 역시 그래비톤5 기반 환경에서 SAP HANA 클라우드 OLTP 쿼리 성능이 35~60% 향상됐다고 평가했다. 시놉시스·지멘스·아틀라시안 등도 반도체 설계와 엔터프라이즈 소프트웨어 분야에서 성능 개선 효과를 확인한 것으로 나타났다.

관련기사

업계에선 AI 인프라 경쟁이 단순 그래픽처리장치(GPU) 확보를 넘어 중앙처리장치(CPU)와 메모리, 네트워크, 보안 아키텍처를 아우르는 종합 플랫폼 경쟁으로 확대되고 있다고 보고 있다. 특히 AI 에이전트가 대규모로 확산될수록 추론 성능과 효율성을 동시에 확보할 수 있는 자체 설계 칩 중요성이 더욱 커질 것이란 전망이 나온다.

AWS 측은 "그래비톤5는 에이전틱 AI와 고성능 컴퓨팅 환경을 지원하기 위해 설계된 차세대 프로세서"라며 "고객이 다양한 워크로드를 보다 효율적으로 운영할 수 있도록 성능·확장성·보안성을 지속 강화해 나갈 것"이라고 밝혔다.