메타, 자체설계 AI 반도체 공개

인공지능 학습과 추론 처리에 맞춤 설계

컴퓨팅입력 :2023/05/19 10:08

메타가 자체설계한 인공지능(AI) 학습 및 추론 전용 프로세서를 공개했다.

18일(현지시간) 미국 지디넷에 따르면, 메타는 AI 프로그램 구동을 위해 설계된 1세대 맞춤형 실리콘 '메타 트레이닝 및 추론 가속기(MTIA)'를 발표했다.

MTIA는 병렬로 작동하는 회로 블록의 메시 구조로 구성됐다. 메타의 AI 프레임워킈인 '파이토치'를 사용해 최적화 소프트웨어를 실행한다.

마크 저커버그 메타 최고경영자가 자신의 페이스북에 올린 'MTIA' 칩'

메타는 이 칩을 AI 기반 추천 모델에 최적화됐다고 설명했다. 소셜네트워크 상의 사용자 활동 패턴을 인지하고 사용자에게 개인화된 콘텐츠를 추천하는 시스템이다.

메타는 MTIA를 2020년부터 개발하기 시작했다고 밝혔다. MTIA는 8x8 그리드로 배열된 64개의 프로세서 요소를 가졌고, 데이터가 이동할 수 있는 시스톨릭 어레이를 채택했다.

흥미로운 건 AI 전용 반도체 하나로 학습과 추론을 모두 처리하게 했다는 점이다. 일반적으로 컴퓨팅 측면에서 학습과 추촌의 요구사항이 다르며, 별개의 칩 설계로 처리된다.

MTIA 아키텍처

메타는 MTIA 칩에 대해 1와트 에너지당 초당부동소수점연산 수에서 GPU보다 최대 3배 효율적이라고 설명했다. 단 더 복잡한 신경망을 작업할 때 CPU보다 뒤떨어진다고 덧붙였다.

메타뿐 아니라 구글, 마이크로소프트, 아마존 등이 엔비디아의 GPU 사용 외에 AI 전용 반도체를 발표했거나 개발중이다.

메타는 MTIA와 함께 자사 데이터센터를 AI에 최적화된 설계와 수냉식 AI 하드웨어, 대규모 슈퍼클러스터(SC)를 지원하도록 업그레이드할 것이라고 밝혔다. 메타의 슈퍼클러스터는 AI 훈련을 수행하는 데이터센터 규모의 컴퓨팅 클러스터다.

메타의 리서치슈퍼클러스터(RSC)는 1만6천개의 엔비디아 A100 텐서코어 GPU와 엔비디아 퀀텀인피미밴드 16Tbps 인터커넥트를 갖췄다. 대규모 언어 모델과 자연어 AI 번역 시스템을 훈련하는데 사용된다. 컴퓨팅 파워는 5엑사플롭스다.

비디오 인코딩용 맞춤형 칩도 공개됐다. '메타 스케일러블 비디오 프로세서(MSVP)'란 이름의 이 실리콘은 비디올르 더 효율적으로 압축 및 압축해제하고, 페이스북 사용자의 업로드를 다양한 형식으로 인코딩하게 설계됐다. MSVP 칩은 최고 품질 구성의 경우 15fps에서 4K 피크 트랜스코딩 성능을 제공하고, 표준 품질 구성의 경우 60fps에서 4K까지 확장할 수 있다.

베타는 "엔비디아 GPU나 인텔 CPU에 의존하기보다 미래의 AI 사용 사례를 주시하고 있다"며 "전용 하드웨어가 컴퓨팅 성능과 효율성 측면에서 최고의 솔루션이라고 믿는다"고 밝혔다.

관련기사

메타는 파이토치와 전용 칩의 공동 설계를 강조하고 있다. 메타의 AI 칩에서 실행될 코드의 작성에 파이토치나 C++ 외에 '나이프(KNYFE)란 전용 언어를 사용할 수 있다. '나이프'는 ML 연산자에 대한 짧고 높은 수준의 설명을 입력으로 받아 MTIA용으로 연산자를 구현하는 최적화된 C++ 커널 코드를 생성한다.

메타는 엔지니어의 코드 작성에 도움을 주는 생성 AI 기반의 코드 작성 보조도구 '코드컴포즈'도 공개했다. 코드컴포즈는 오픈소스로 공개된다.