AWS, 머신러닝 모델 훈련 칩 '트레이니엄' 공개

처리 성능 30% 향상·비용 45% 절감 가능

컴퓨팅입력 :2020/12/02 18:09    수정: 2020/12/03 07:23

글로벌 1위 클라우드 사업자 아마존웹서비스(AWS)가 클라우드 컴퓨팅 성능 향상과 비용 절감을 위해 커스텀 칩 개발을 이어가고 있다. 이번에는 머신러닝 모델 훈련에 특화된 커스텀 칩 '트레이니엄(Trainium)을 공개했다.

AWS는 1일(현지시간) 온라인으로 개최된 연례 기술 컨퍼런스 'AWS리인벤트'를 통해 내년부터 '트레이니엄'이 적용된 인스턴스를 제공할 예정이라고 밝혔다. 

트레이니엄은 AWS가 지난해 리인벤트 행사에서 공개한 고성능 머신러닝 추론 칩 '인퍼런시아'의 보완재 역할을 하기 위해 탄생했다. 

AWS가 머신러닝 모델 훈련에 특화된 커스텀 칩 AWS 트레이니엄을 공개했다.

인퍼런시아는 머신러닝 인프라 비용의 90% 를 차지하는 '추론' 비용 줄여주기 위해 등장했다. 인퍼런시아로 추론 비용에 대한 부담은 줄었지만, 여전히 만만치 않은 머신러닝 모델 훈련 비용 때문에 개발자들이 제한을 받고 있었다. 

이에 대한 AWS의 해법이 트레이니엄이다. 트레이니엄은 클라우드에서 머신러닝 모델 훈련 비용을 낮추면서, 성능은 높이는 데 초점을 맞춰 디자인됐다. 

AWS에 따르면 트레이넘은 표준 AWS GPU 인스턴스와 비교해 처리량을 30% 높였고, 비용(추론 당 모델 훈련에 소요되는 비용)은 45% 낮췄다. 

내년 중 트레이니엄 기반 EC2가 출시될 예정이다. 또, AWS의 머신러닝 플랫폼 '아마존 세이지메이커'에도 내장될 예정이다.

트레이니엄은 텐서플로우, 파이토치, MX넷 등 인기 머신러닝 프레임워크를 지원한다. 또, 인퍼런시아와 같은 SDK를 사용한다.

관련기사

AWS 측은 "트레이니엄과 인퍼런시아를 모두 사용하면 학습 워크로드를 확대하고 가속화된 추론을 배포하기까지 일련의 과정을 원활하게 진행할 수 있게 될 것"이라고 강조했다.

이날 AWS는 인텔과 협력해 머신러닝 훈련용 '하바나 가우디 기반 EC2'를 출시할 계획이라고도 밝혔다. AWS에 따르면 하바나 가우디 기반 EC2는 현재 GPU 기반 EC2와 비교해, 가격 대비 성능이 최대 40% 향상됐다. 텐서플로우와 파이토치를 지원하며, 출시일은 내년 초로 예정됐다.