"최근 몇년새 GPU 연산능력이 급격히 발전했다. 더불어 GPU 연산을 활용하는 심층신경망의 복잡성도 증가했다. 현실에서 이를 활용한 인공지능(AI) 기술 개발과 시스템 운영은 복잡하다. 오픈소스 소프트웨어 컴파일과 튜닝을 반복해야 하고 그 운영 시스템을 계속 유지보수해야 한다. 더불어 AI에 활용되는 기존 솔루션은 스토리지부터 애플리케이션까지 데이터 병목에 시달리고 있다. 특화된 스토리지가 중요한 이유다."
퓨어스토리지 송성환 부장은 28일 서울 중구 서울신라호텔에서 지디넷코리아가 개최한 제15회 어드밴스드컴퓨팅컨퍼런스플러스(ACC+) 'AI 인프라 최적화를 위한 스토리지 전략' 주제강연을 통해 이같이 말했다.
그에 따르면 1955년 미국에서 시작된 초기 인공지능(AI) 기술 개발은 실패로 돌아갔고 사람들의 기억에서 잊혔다. 이후 2012년 이미지인식 컴퓨터알고리즘 경진대회 이미지넷에서 그래픽처리장치(GPU)를 활용한 딥러닝 알고리즘으로 정확도 80%의 벽을 돌파한 이래로 GPU를 활용한 딥러닝 기술 연구와 애플리케이션 개발이 유행하고 이를 지원하는 다양한 프레임워크가 등장했다.
이후 여러 대의 GPU를 활용한 연산으로 딥러닝 AI 기술을 개발하는 연구가 이어졌다. 단일 GPU 연산능력이 발전하면서 AI 데이터를 처리하는 딥러닝 네트워크의 복잡성이 늘어났다. 딥러닝 네트워크에 입력하는 데이터의 품질과 함께 입력 데이터의 양을 통해 알고리즘의 정확도와 결과물을 개선할 수 있게 됐다. 대규모 데이터를 학습하는 딥러닝 네트워크를 구성하고 가동하기 위한 데이터센터 인프라의 필요성이 커졌다.
이런 배경에 따라 GPU제조사 엔비디아, 스토리지제조사 퓨어스토리지, 네트워크장비업체 아리스타네트웍스가 각자 역량을 결합한 통합솔루션을 내놨다. 통합솔루션은 'AI레디인프라스트럭처(AIRI, 아이리)'라는 이름으로 소개됐다. AIRI는 확장성을 갖춘 서버 기반으로 구동되는 딥러닝 학습용 자체 소프트웨어 툴킷, 엔비디아가 최적화한 딥러닝 프레임워크, 테슬라 V100 GPU 기반 연산 장비, 퓨어스토리지의 스케일아웃 파일 및 오브젝트 스토리지, 데이터를 저장하는 스케일아웃 스토리지시스템 등으로 구성됐다.
AIRI의 개별 구성요소를 보면 엔비디아 GPU와 인텔 CPU를 탑재한 AI 머신 'DGX-1' 서버 시스템에 퓨어스토리지의 플래시블레이드, 아리스타네트웍스 기가비트 이더넷 스위치 장비를 결합한 하드웨어를 갖췄다. 엔비디아 GPU 클라우드 딥러닝 스택 프레임워크와 AIRI 스케일링 툴킷이라는 학습 알고리즘 최적화 프레임워크를 기본 소프트웨어로 제공한다. 네트워크 스위치는 시스코 장비로도 사용할 수 있다.
관련기사
- "AI 모델 구축보다 데이터 중요"2018.08.28
- "악성 봇은 계속 진화중…적극적인 솔루션 필요"2018.08.28
- "클라우드 전환 시작…최적 백업복구 전략은"2018.08.28
- "비즈니스 위협하는 IT, 풀스택 클라우드로 혁신하라"2018.08.28
AIRI에 포함된 퓨어스토리지 플래시블레이드는 NVMe 올플래시 저장장치를 탑재한 오브젝트스토리지 시스템이다. 이 시스템의 플래시 저장장치는 4U 크기의 '섀시'로 구성된다. 시스템 한 대에 여러 대 섀시를 장착할 수 있다. 섀시 하나당 1페타바이트(PB)까지 저장할 수 있다. 이는 모듈형 저장장치 '블레이드'를 15개 결합했을 때 제공되는 용량이다. 블레이드는 전용 FPGA와 D램을 사용하는 컨트롤러 기판에 3D낸드플래시 모듈 탑재 기판을 부착한 형태로, 범용 SSD를 사용하는 올플래시스토리지 대비 고성능을 제공한다는 게 회사측 설명이다.
딥러닝 학습을 활용하는 제품 완성도를 GPU 연산에는 캐시 처리성능이 필요하다고 언급했다. 그에 따르면 퓨어스토리지의 플래시블레이드는 섀시에 결합한 블레이드 수만큼 선형적 성능 및 용량 확장을 지원하고, DGX-1 시스템 역시 서버를 추가해 선형적인 GPU 연산 성능을 선형 확장할 수 있다. 또 이런 구성요소를 탑재한 AIRI는 기가비트이더넷 스위치만으로 DGX 서버와 플래시블레이드를 연결하면서도 데이터 병목 없는 처리 성능을 낼 수 있다는 설명이다.