'블레이드와 어레이' 퓨어스토리지 아키텍처의 차이

AI는 플래시블레이드, OLTP는 플래시어레이

컴퓨팅입력 :2023/06/16 22:19

[라스베이거스(미국)=김우용 기자] 퓨어스토리지는 2종류의 하드웨어 아키텍처를 갖고 있다. 초저지연시간 기반 고성능 스토리지인 ‘플래시어레이’와, 스케일아웃형 고성능 스토리지인 ‘플래시블레이드’다. 원래 플래시어레이는 미션크리티컬 워크로드의 블록 스토리지로, 플래시블레이드는 파일과 오브젝트 스토리지로 구분됐지만 올해부터 플래시어레이에서 파일시스템도 쓸 수 있게 됐다. 두 제품의 경계나 성격이 모호해질 수 있는 상황에서 각 제품군의 담당 임원들에게서 각자의 차별점을 들을 수 있었다.

퓨어스토리지는 14일부터 15일(현지시간) 양일간 미국 라스베이거스에서 개최한 ‘퓨어 액셀러레이트 2023’ 컨퍼런스에서 ‘플래시어레이//E’를 출시하고, 기존 플래시어레이의 ‘X’ 제품군과 ‘C’ 제품군의 4세대를 공개했다. 그에 앞서 플래시블레이드//E가 지난 3월 공개돼 4월말부터 출하되고 있다.

이에 따라 플래시어레이 제품군은 매우 빠른 응답시간을 요하는 OLTP 데이터베이스 등을 위한 ‘X’와 ‘XL’ 시리즈, 운영계 워크로드와 VDI 환경 등 비즈니스 운영환경을 위한 ‘C’ 시리즈, 대용량 보관과 데이터 활용을 동시에 추구하는 ‘E’ 시리즈로 구성되게 됐다. 그간 미션크리티컬, 비즈니스 크리티컬 등 티어0, 티어1 급만 보유했던 퓨어스토리지가 통상적인 ‘하이엔드’, ‘미드레인지’, ‘엔트리’ 등의 구성을 모두 갖추게 된 것이다. 반면, 플래시블레이드는 확장성과 성능 양측의 수요를 위한 ‘S’ 시리즈와, 대용량 파일 저장을 위한 ‘E’ 시리즈로 구성되게 됐다.

에이미 파울러 퓨어스토리지 플래시블레이드사업 부사장

퓨어스토리지는 플래시블레이드의 가장 큰 활용처로 인공지능(AI)’을 꼽는다. 작년초 메타의 대규모 언어모델(LLM)을 위한 전용 슈퍼컴퓨터인 ‘리서치슈퍼클러스터(RSC)’에 데이터 저장소로 플래시블레이드를 제공했던 게 가장 대표적인 사례다.

퓨어액셀러레이트2023 컨퍼런스 현장에서 만난 에이미 파울러 퓨어스토리지 플래시블레이드 사업총괄 부사장은 “생성 AI는 많은 처리량, 넓은 대역폭, 큰 규모의 오브젝트 데이터 처리 등을 필요로 한다”며 “플래시블레이드 같은 스케일아웃 플랫폼은 이를 위한 레시피”라고 밝혔다.

에이미 파울러 부사장은 “메타와 협력 이전에 플래시블레이드와 엔비디아의 결합으로 AI를 위한 인프라 ‘에이리’를 구축했고, 이를 통해 기업 전반에 걸쳐 매우 폭넓은 성공을 거뒀다”며 “몇달씩 걸리던 1천개의 CT 스캔을 몇주만에 수행하는 대학 의료센터 사례나, 미디어젠이란 회사의 음성인식 텍스트 변환 모델 개발 기간을 12개월에서 2주로 줄인 사례도 있다”고 말했다.

퓨어스토리지는 현재 전세계 100여개의 대규모 AI 프로젝트에 플래시블레이드를 제공하고 있다.

그는 “생성 AI는 새로운 차원의 기술이고, 적용 분야에 따라서 더 작은 데이터세트든 더 방대한 데이터세트든 필요로 하고, 대규모 훈련을 처리하기에 매우 적합한 솔루션으로 플래시블레이드를내세운다”고 강조했다.

엔비디아와 협력에 대해선 경쟁사의 협업 대비 차별화 요소로 성능과 에너지효율을 꼽았다.

그는 “플래시블레이드는 방대한 규모의 머신러닝 데이터 수집에서 높은 처리량을 보여주며, 데이터 파이프라인 프로세스의 다른 부분에 도달했을 때 랜덤 읽기 및 쓰기를 올바르게 수행하면서 짧은 지연시간, 높은 처리량, 순차적 혹은 랜덤 등 다목적으로 잘 작동하며, 고가의 GPU 처리량을 충분히 끌어내게 한다”며 “AI의 경우, 특히 GPU가 전력을 많이 소비하기 때문에 에너지 효율성 측면에서 플래시블레이드의 기가바이트당 10와트의 용량 대비 전력 밀도는 훌륭한 해법”이라고 강조했다.

플래시블레이드//E는 출시 직후부터 뜨거운 반응을 얻었다고 했다. 빠른 복원을 원하지 않지만, 다른 목적으로 데이터를 보관해야 하는 모든 종류의 백업에 유용하다는 게 에이미 파울러 부사장의 설명이다.

그는 “플래시블레이드//E는 4월 GA 직후 첫 구매 주문을 받을 정도로 가장 빠르게 성장한 제품 라인”이라며 “빠른 복원을 원하지 않지만 다른 목적으로 데이터를 보관해야 하는 모든 데이터에 대한 장기적인 백업 대상으로 활용하려는 경우, 비디오 감시를 위한 의료 영상, 기타 여러 페타바이트급 티어2 저장소 사례에서 관심을 받고 있다”고 설명했다.

그는 “플래시블레이드//E는 4PB에서 시작해서 점점 더 커지기 때문에 '만약 내가 1페타만 갖고 있다면 어떻게 할 것인가'란 고객 피드백을 많이 받았고, 1~4 PB 시장을 위해 플래시어레//E 제품군도 출시하게 된 것”이라고 덧붙였다.

플래시어레이//E 제품군의 경우 완전한 구성을 완료했다는 점에서 퓨어스토리지에게 큰 전환점으로 꼽힌다. 플래시어레이는 초고성능의 핵심 애플리케이션 시장을 차지하고 페타급 규모로 증가하는 데이터를 어느정도 수용했다가, 더 큰 규모의 플래시블레이드 저장소로 넘기는 브릿지도 갖게 된 것이다.

피터 스코브럽 퓨어스토리지 플래시어레이 제품관리 부사장

피터 스코브럽 퓨어스토리지 플래시어레이 제품관리 부사장은 “플래시어레이는 짧은 대기 시간에 매우 최적화되어 있고, 비즈니스 크리티컬 사용 사례와 블록 워크로드의 속도를 위한 것”이라며 “반면 플래시 블레이드는 큰 대역폭에 최적화돼 많은 워크로드를 수행하는 것을 상정했을 때 높은 성능을 낸다”고 설명했다.

그는 “AI는 학습 데이터세트는 스토리지 시스템 측면에서 무엇을 선택할지 결정하게 하는 측면이 있다”며 “AI는 많은 양의 다양한 데이터세트이므로 확장할 수 있는 유연성과 기능을 원한며, 학습을 위한 데이터세트를 그대로 유지할 가능성이 높기 때문”이라고 말했다.

그는 “AI 추론의 경우 성능을 필요로 하지만, 얼마나 빨리 데이터를 수집하고 캐시 상에서 데이터세트를 실행하기 때문에 플래시어레이의 저지연시간이 반드시 필요한 건 아니다”라고 설명했다.

블록과 파일을 하나의 플랫폼에서 수용하는 플래시어레이의 유니파이드 스토리지 전략에 대해선상당한 수요를 기대할 수 있다고 밝혔다.

그는 “고객은 늘 블록과 파일을 모두 갖고 있으며, 데이터 세트는 계속 증가하고 단일 시스템에 점점 더 많은 워크로드를 배치하려고 하기 때문에 언제나 워크로드 통합에 관심을 가져왔다”며 “플래시어레이는 블록과 파일을 매우 간단하면서도 똑같이 잘 실행되도록 했고, 일관성 있는 방식으로 파일과 블록 모두에서 플래시의 이점을 활용하게 했다”고 강조했다.

관련기사

플래시어레이//E의 유용성에 대해 플래시블레이드와 플래시어레이의 비용 효율성으로 설명했다.

그는 “//E 시리즈를 블레이드 대 어레이로 보지 말고, 비용 효율성의 차이로 이해해달라”며 “플래시어레이의 비용 효율성은 실제로 규모의 문제이며 이를 가장 비용 효율적으로 만드는 방법은 무엇인가 볼 때 E 시리즈는 하드디스크보다 경쟁력있는 가격으로 데이터를 저장하게 한다”고 말했다.