엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

엔비디아와 아마존웹서비스(AWS)가 기업용 인공지능(AI) 추론과 벡터 검색, 대규모 학습 환경을 업그레이드했다.

엔비디아는 '아마존 EC2'와 '아마존 오픈서치' 전반에 엔비디아 AI 인프라 적용 범위를 넓혔다고 24일 공식 홈페이지에서 밝혔다. 핵심은 엔비디아 블랙웰 기반 그래픽처리장치(GPU)를 탑재한 'EC2 G7 인스턴스'와 '엔비디아 cuVS' 기반 오픈서치 서버리스 벡터 검색 가속이다.

아마존 EC2 G7 인스턴스는 엔비디아 RTX 프로 4500 블랙웰 서버 에디션 GPU를 기반으로 작동한다. AI 추론과 그래픽, 공간 컴퓨팅, GPU 가속 데이터 분석 업무를 겨냥한 신규 인스턴스다.

G7은 기존 G6 인스턴스와 비교해 AI 추론 성능을 최대 4.6배 높였다. 그래픽 성능은 최대 2.1배 향상됐다. 아마존 EMR에서 엔비디아 cuDF 라이브러리를 활용한 아파치 스파크 업무도 더 빠르게 처리할 수 있다.

G7 인스턴스는 최대 8개 GPU와 총 256기가바이트(GB) GPU 메모리, 초당 700기가비트(Gbps) EFA 지원 네트워킹, 최대 7.6테라바이트(TB) 로컬 NVMe SSD 스토리지를 지원한다. 1개, 2개, 4개, 8개 GPU 구성과 베어메탈 구성을 제공해 기업이 업무에 맞춰 인프라를 선택할 수 있도록 했다.

이를 통해 AI 개발팀은 낮은 지연시간에 추론 환경을 구축할 수 있으며, 미디어·엔터테인먼트 기업은 고해상도 영상 제작과 렌더링 업무에 활용할 수 있다. 시뮬레이션과 컴퓨터 지원 설계, 가상 데스크톱 인프라, 게임, 공간 컴퓨팅 분야도 같은 인스턴스를 쓸 수 있다.

AWS는 오픈서치 서버리스에도 엔비디아 cuVS를 적용했다. 차세대 아마존 오픈서치 서버리스는 모든 벡터 컬렉션에서 GPU 가속 벡터 인덱싱을 기본 컴퓨팅 방식으로 사용한다.

이는 검색증강생성(RAG), 의미 기반 검색, 추천 시스템, 에이전틱 AI 애플리케이션을 구축하는 기업에 의미가 크다. 기존에는 별도 최적화 프로젝트에 가까웠던 GPU 기반 벡터 검색을 AWS 기본 기능처럼 활용할 수 있기 때문이다.

엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

관련기사

지금 뜨는 기사

이시각 헤드라인

전남광주 반도체 新공장 투자, 업계는 당혹스럽다

삼성전자 "3년 안에 AI 모듈러 홈 1만채 판매 목표"

AI 민원부터 AI 순찰차·재해복구까지…미래 행정기술 총출동

김용범 정책실장 "호남·충청 반도체 클러스터 조만간 발표...용인 이전 아냐"

ZDNet Power Center