HPE "GPU 기반 AI개발 전면 지원"

'아폴로 6500 Gen10' 등 주목....125테라플롭스(Tflops) 성능 구현

컴퓨팅입력 :2018/08/23 16:49

모든 산업분야가 인공지능(AI) 기술 활용에 주목하고 있다. 분야를 막론하고 대다수 엔터프라이즈 기업에게 AI 도입은 피할 수 없는 숙제다.

산업연구원 '미래전략산업 브리프' 보고서에 따르면 세계 AI시장은 2022년까지 매년 51.1%씩 성장할 것으로 전망된다. 시장조사업체 스태티스타는 올해 세계 AI 시장 규모를 작년 48억2천만 달러에서 52.5% 성장한 73억5천만 달러로 예상했다. 2025년에는 898억5천만 달러 규모로 커질 전망이다.

많은 엔터프라이즈 기업은 AI 솔루션을 찾고 있다. 그러나 현실 속에 한번에 모든 걸 해결해줄 완성형 AI 솔루션은 없다. AI는 클라우드 서비스나 소프트웨어 구매로 해결할 수 없는 영역이다. 기업마다 비즈니스 특성과 요건에 맞게 도입 전략을 세우고, 꾸준한 투자와 개발로 독자적인 AI 애플리케이션을 만들어가야 한다.

HPE 아폴로 6500

이런 가운데 휴렛팩커드엔터프라이즈(HPE)는 AI 도입을 바라는 기업, 조직과 손잡고 시작부터 끝까지 함께 만들어가는 사업 전략을 취하고 있다. HPE 제품을 완성된 솔루션으로 포장하기보다 AI 개발을 원초적 단계부터 지원해 빌드업하는 파트너란 것이다.

정석원 한국HPE 이사는 “딥러닝을 위한 HPE 의 전략은 ‘쉬운 시작’ 혹은 '겟 스타티드(Get started) 솔루션'으로 정의할 수 있다”며 “HPE가 고객의 시작을 편하게 하고, AI를 활용하는 방법을 안내하고, 함께 전문가로 성장하는 것으로 동행한다”고 설명했다.

HPE는 동경공업대학 츠바메 3.0 슈퍼컴퓨터, 피츠버그슈퍼컴퓨터센터 등의 AI 개발에 참여했다. 미항공우주국(NASA)과 슈퍼컴퓨터 ‘스페이스본’을 개발하고 있다.

동경공업대학의 츠바메 3.0은 HPE SGI 8600, 엔비디아 GPU를 활용하는 AI 전용 슈퍼컴퓨터다. 피츠버그슈퍼컴퓨팅센터는 HPE 슈퍼돔 인메모리컴퓨팅 시스템과 HPE 아폴로를 기반으로 AI를 개발했다. NASA 스페이스본은 국제우주정거장(ISS)에 실려 우주 공간에서 작동되는 AI 시스템이다.

카네기멜론대학은 포커 게임 AI인 '리브라투스(Libratus)'를 HPE와 함께 만들었다. 리브라투스 AI는 상대 플레이어의 패를 보지 않고 경쟁해 승부에서 승리할 수 있다. 20일 간 실제 프로 포커선수들과 승부를 벌여 180만달러를 따냈다.

HPE는 이처럼 다양한 프로젝트에 처음부터 끝까지 참여하며, 해당 프로젝트에 가장 적합한 AI를 개발한다. 그 과정에서 쌓은 노하우를 상용 제품에 녹여 시장에 출시하고, 또 다른 기업에 파트너로 참여한다.

그렇게 만들어진 대표 제품이 HPE 아폴로 6500 Gen10이다. GPU 워크로드 성능 가속에 초점을 맞춰 개발된 아폴로 6500 Gen10은 125테라플롭스(Tflops) 성능을 낼 수 있으며, 엔비디아의 GPU 클러스터 연결 기술인 NVLink 2.0 대역폭 활용을 극대화했다. 서버당 8개의 GPU를 장착할 수 있고, PCIe 인터페이스 기반의 GPU-CPU 조합을 4대1, 혹은 8대1로 할 수 있다.

아폴로 6500 Gen10은 이전 세대인 Gen9 대비 AI 모델 트레이닝 속도를 3배 높였다. 텐서플로우, 카페2 등 다양한 프레임워크와 모델에서 현격한 성능 향상을 기록했다.

아폴로 6500 Gen10은 쉬운 시작을 위한 하드웨어 중 하나다. HPE는 이밖에 SGI 8600, 아폴로 SX40, HPE 아폴로2000, 엣지라인 EL4000 등 산업분야와 목적에 맞는 여러 하드웨어를 공급한다.

엔비디아(왼쪽)와 휴렛팩커드엔터프라이즈(HPE) 로고

정 이사는 “엔비디아의 기반 기술에 다양한 OS 지원, 통합 매니지먼트 등 HPE 기술을 녹이고, 컨설팅, 유지보수 등을 결합하고 있다”고 밝혔다. 또다른 핵심은 HPE 포인트넥스트다. HPE 포인트넥스트는 프로젝트 디자인부터 설계, 컨설팅, 유지보수, 기술지원 등을 제공한다.

HPE 포인트넥스트는 AI 프로젝트를 고려하는 고객사와 하루짜리 워크숍을 진행하는 것으로 시작한다. 이를 통해 고객사 보유 데이터를 통해 AI 기술에 결합해 어떤 성과를 낼 수 있는지 도출한다. HPE 소속 데이터 과학자가 참여하고, 콘셉트와 기본 아키텍처를 잡아준다. 이후로 8~12주에 걸쳐 실제 데이터를 기반으로 가치를 검증한다.

실제 프로젝트에 돌입하는 단계에서 HPE는 다양한 방법론과 툴을 제공한다. 일단 HPE 딥러닝 쿡북이란 툴이 있다. 딥러닝 벤치마킹 스위트이자 딥러닝 성능 시뮬레이션 툴이다. 텐서플로우, 카페2, MXNET 등 범용 AI 프레임워크를 HPE 제품에서 작동했을 때 얼마나 성능을 내는 지 시뮬레이션해 보여준다. 직접 시스템을 구축하지 않고도 각종 프레임워크와 하드웨어, 소프트웨어의 최적 조합을 찾게 해주는 역할을 한다.

관련기사

이밖에 HPC 워크로드 매니지먼트, 브라이트 클러스터 매니저 등이 있다. 브라이트는 효율적인 딥러닝 환경을 쉽게 설치할 수 있게 각종 소프트웨어 라이선스를 패키지로 만들어 제공하는 것이다.

정 이사는 “HPE의 AI 투자에서 하드웨어는 일부에 불과하며, 고객에 맞는 수많은 레퍼런스 아키텍처와 소프트웨어를 만들어 내는데 집중하고 있다”며 “HPE는 솔루션이 아니라 고객이 원하는 툴을 최고 수준으로 올려놓는데 주력함으로써 엔터프라이즈의 AI 도입을 지원한다”고 강조했다.