엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

EC2 G7 인스턴스에 엔비디아 RTX 프로 4500 블랙웰 서버 에디션 GPU

컴퓨팅입력 :2026/06/24 18:31

엔비디아와 아마존웹서비스(AWS)가 기업용 인공지능(AI) 추론과 벡터 검색, 대규모 학습 환경을 업그레이드했다. 

엔비디아는 '아마존 EC2'와 '아마존 오픈서치' 전반에 엔비디아 AI 인프라 적용 범위를 넓혔다고 24일 공식 홈페이지에서 밝혔다. 핵심은 엔비디아 블랙웰 기반 그래픽처리장치(GPU)를 탑재한 'EC2 G7 인스턴스'와 '엔비디아 cuVS' 기반 오픈서치 서버리스 벡터 검색 가속이다.

아마존 EC2 G7 인스턴스는 엔비디아 RTX 프로 4500 블랙웰 서버 에디션 GPU를 기반으로 작동한다. AI 추론과 그래픽, 공간 컴퓨팅, GPU 가속 데이터 분석 업무를 겨냥한 신규 인스턴스다.

젠슨 황 엔비디아 최고경영자(CEO)

G7은 기존 G6 인스턴스와 비교해 AI 추론 성능을 최대 4.6배 높였다. 그래픽 성능은 최대 2.1배 향상됐다. 아마존 EMR에서 엔비디아 cuDF 라이브러리를 활용한 아파치 스파크 업무도 더 빠르게 처리할 수 있다.

G7 인스턴스는 최대 8개 GPU와 총 256기가바이트(GB) GPU 메모리, 초당 700기가비트(Gbps) EFA 지원 네트워킹, 최대 7.6테라바이트(TB) 로컬 NVMe SSD 스토리지를 지원한다. 1개, 2개, 4개, 8개 GPU 구성과 베어메탈 구성을 제공해 기업이 업무에 맞춰 인프라를 선택할 수 있도록 했다.

이를 통해 AI 개발팀은 낮은 지연시간에 추론 환경을 구축할 수 있으며, 미디어·엔터테인먼트 기업은 고해상도 영상 제작과 렌더링 업무에 활용할 수 있다. 시뮬레이션과 컴퓨터 지원 설계, 가상 데스크톱 인프라, 게임, 공간 컴퓨팅 분야도 같은 인스턴스를 쓸 수 있다.

AWS는 오픈서치 서버리스에도 엔비디아 cuVS를 적용했다. 차세대 아마존 오픈서치 서버리스는 모든 벡터 컬렉션에서 GPU 가속 벡터 인덱싱을 기본 컴퓨팅 방식으로 사용한다.

이는 검색증강생성(RAG), 의미 기반 검색, 추천 시스템, 에이전틱 AI 애플리케이션을 구축하는 기업에 의미가 크다. 기존에는 별도 최적화 프로젝트에 가까웠던 GPU 기반 벡터 검색을 AWS 기본 기능처럼 활용할 수 있기 때문이다.

관련기사

엔비디아는 cuVS 적용으로 벡터 인덱싱 속도가 중앙처리장치(CPU) 기반 방식보다 최대 10배 빨라지고, 비용은 4분의 1 수준으로 낮아질 수 있다고 설명했다. 이를 통해 수십억 단위 벡터 데이터베이스(DB)도 1시간 내에 구축할 수 있다고 밝혔다.

엔비디아는 "이번 협력은 AWS의 AI 인프라 계층 전반을 강화하는 데 초점을 맞췄다"며 "운영 부담을 늘리지 않으면서 대규모로 작동하는 생산급 AI 인프라"라고 밝혔다.