MS, 생성 AI 개발 가능한 대규모 클라우드 공개

컴퓨팅입력 :2023/03/14 09:59

마이크로소프트(MS) 애저에 생성 인공지능(AI) 모델 설계 및 실행에 특화된 새로운 클라우드 서비스가 추가됐다.

13일(현지시각) 실리콘앵글 등 외신에 따르면 마이크로소프트는 신규 인스턴스 제품 ND H100 v5 VM을 미리보기 버전으로 공개했다고 공식 애저 블로그를 통해 밝혔다.

신규 인스턴스는 챗GPT 이후 급증한 고객사의 생성 AI 또는 대규모 언어 모델(LLM) 등의 개발 및 연구 요구에 맞춰 개발됐다. 생성 AI 개발에 필요한 대규모 컴퓨팅 인프라와 AI 교육워크로드를 가상머신(VM) 환경에서 제공한다.

마이크로소프트 애저 데이터센터

ND H100 v5 VM의 기본 성능은 4세대 인텔 제온 프로세서 기반 사파이어 래피즈이며 엔비디아 H100 GPU 8개, 16채널 4800MHz DDR5 DIM 등으로 구성돼 있다.

이 인스턴스의 특징은 대규모 AI개발을 위해 모든 컴퓨팅파워를 옵션을 통해 조절할 수 있다는 점이다. 특히 GPU는 엔비디아의 퀀텀2 인피니밴드를 이용해 기본 8개에서 최대 수천 개까지 확장 가능하다.

인스턴스에 적용된 GPU 엔비디아 H100은 4나노미터 공정을 사용하여 AI전용 모델이다. 트랜스포머 신경망 아키텍처를 기반으로 AI 모델의 속도를 높이도록 설계된 특수 모듈 적용됐다.

또한 효율적인 컴퓨팅 파워 활용을 위해 같은 NV링크라는 GPU간 전용 연결장치로 PCIe 5.0보다 7배 빠른 초당 3.6테라비트의 대역폭을 제공한다

사파이어 래피즈는 지난 1월 출시된 서버 전용 CPU다. AI 가속기 12개를 탑재해 AI 처리 성능을 최대 10배 향상시켰다.

관련기사

마이크로소프트는 ND H100 v5 VM를 통해 클라우드 환경에서 엑사스케일의 환경을 클라우드 환경에 구축하고 생성적AI나 대규모 언어 모델 등을 개발할 수 있다고 밝혔다.

마이크로소프트 애저의 맷 베가스 고성능 컴퓨팅 및 AI 그룹 수석 프로젝트 관리자는 "최근 고객사에서 필요한 고급 AI를 구현하기 위해서는 기하급수적으로 증가하는 데이터와 복잡성을 해결할 수 있는 슈퍼컴퓨팅 인프라, 서비스 및 전문 지식이 필요하다”며 “마이크로소프트는 10년 간의 슈퍼컴퓨팅 개발 및 대규모 AI 교육 워크로드 경험을 기반으로 이를 제공해 고객의 과제를 해결하려 하고 있다"고 말했다.