"AI 컴퓨팅, 스토리지도 고민하라"

광주과학기술원 AI 대학원의 인프라 구성

컴퓨팅입력 :2021/07/07 17:10    수정: 2021/07/07 17:18

"아무리 좋은 GPU 서버라도 스토리지 성능이 좋지 않으면 좋은 성능을 누리지 못한다."

퓨어스토리지코리아는 6일과 7일 양일간 오후 2시부터 5시까지 ‘퓨어//액셀러레이트 디지털 코리아 2021’ 버츄얼 컨퍼런스를 개최했다.

7일 행사에서 광주과학기술원(GIST) AI대학원의 자르갈 교수는 지난해 구축한 AI-X 클러스터 센터의 인프라를 소개했다.

광주과학기술원 AI대학원 자르갈 교수

GIST AI대학원은 작년 10월 엔비디아 DGX-1과 A100 GPU 서버, 퓨어스토리지 플래시블레이드 스토리지를 도입했다.

10억원 이상을 투자해 구축된 GIST AI-X클러스터센터 인프라는 쿠버네티스와 슬럼(Slurm)으로 배포됐다. 엔비디아 딥옵스(Deep-Ops) 기반 GPU 클라우드 배포 소프트웨어를 활용하고 하이브리드 형태의 AI 환경을 구축했다.

센터에 AI 대학원 소속 연구자 누구나 시스템에 접속하고 머신러닝 트레이닝 데이터를 GPU 서버에 올려 연구에 활용할 수 있다. 관련 데이터는 퓨어스토리지 플래시블레이드에 저장된다.

퓨어스토리지 플래시블레이드는 스케일아웃 방식의 초고속 통합 파일 및 오브젝트 스토리지 플랫폼이다. 방대한 병렬 아키텍처를 기반으로 설계돼 수페타바이트 용량으로 확장할 수 있으며, IO처리 병목현상을 줄여 고성능과 간소화 효과를 동시에 누릴 수 있다.

GIST AI대학원 AI-X클러스터센터

자르갈 교수는 AI 인프라 구축에서 스토리지를 간과하지 말라고 조언했다.

그는 "보통은 AI 인프라에서 GPU 서버만 집중하고, 스토리지를 크게 생각하지 않는다"며 "이런식으로 시스템을 구축하면 성능 문제가 많이 벌어질 수 있다"고 말했다.

또한 검증되고 신뢰할 수 있는 솔루션을 선택하라고 강조했다.

그는 "AI 컴퓨팅 구축에 화이트박스 장비에 GPU와 SSD를 탑재해 구축하려는 경우가 많은데 이는 많은 실수가 있을 수 있다"며 "화이트박스에 여러 오픈소스를 올려 구축하면 운영 중에 성능이나 관리 이슈가 여러번 나타날 수 있다"고 설명했다.

그는 "인력이 많다면 상관없지만, 담당자가 많지 않은 곳에선 검증되고 신뢰가능한 장비를 도입할 것을 추천한다"고 강조했다.

관련기사

자르갈 교수는 플래시블레이드 도입 후 느낀 장점을 높은 안정성이라고 꼽았다.

그는 "작년 10월 플레시블레이드 도입 후 스토리지 이슈가 한차례도 없었다"며 "인프라 관련 담당자가 많지 않은 상황에서 플래시블레이드 도입으로 네트워크나 서버에 집중하고 스토리지를 집중하지 않아도 되는 게 가장 큰 장점"이라고 설명했다.