아마존 S3, 테이프라이브러리 대체할까

가트너 보고서 '클라우드 스토리지가 새로운 테이프일까?' 요약

컴퓨팅입력 :2016/04/11 18:24

클라우드스토리지가 테이프라이브러리를 대체할 수 있을까? 테이프라이브러리는 기업 데이터센터 환경에서 효율적인 장기 데이터 백업 수단으로 수십년간 쓰여 왔다. 이젠 클라우드 스토리지가 그보다 더 높은 백업 효율성을 보장할 수 있지 않겠느냐는 의문이 제기된다. 기업 시장에 저렴한 퍼블릭클라우드 기반 스토리지 활용 사례가 늘면서다.

이런 관측은 4년전 아마존웹서비스(AWS)가 '글레이셔(Glaicier)'라는 이름의 클라우드 기반 데이터 아카이브 서비스 출시 이래 꾸준히 증폭됐다. AWS는 글레이셔 서비스를 통해 높은 안정성과 당시 기준 기가바이트(GB)당 월 1센트, 무제한 저장용량(확장)이라는 조건을 들고 나와 업계 관심을 모았다. 지난해 미국 공공기관이 글레이셔를 활용해 기존 테이프라이브러리 시스템을 대체한 사례도 공개됐다.

[☞관련기사: 아마존 클라우드 "테이프 백업도 먹겠다"]

[☞관련기사: "인구 200만 공공기록, 클라우드에 담아보니"]

그러나 클라우드스토리지는 테이프라이브러리의 핵심 역할을 완전히 대체할 수 없다. 그러기엔 클라우드스토리지의 특성이 모든 상황에 효율적이지 않다. 퍼블릭클라우드 환경에 기존 백업 데이터의 장기 저장소 역할을 맡기기보다는, 원래 클라우드에서 쓰일 데이터를 더 잘 활용하기 위한 수단으로, 그런 데이터 저장 서비스를 사용하는 게 알맞다. IT 시장조사업체 가트너의 애널리스트가 최근 내린 결론이다.

가트너의 푸샨 리넨 애널리스트는 지난달 '클라우드 스토리지가 새로운 테이프일까?(Is Cloud Storage the New Tape?)'라는 제목의 보고서를 통해 이같은 결론을 제시했다. 보고서는 AWS, 구글, 마이크로소프트(MS)같은 퍼블릭클라우드 기반 서비스형인프라(IaaS) 스토리지와, IaaS 사업자들의 디스크 기반 오브젝트 스토리지를 백업 수단으로 활용할 수 있겠느냐는 고객사들의 의문에 답하기 위해 작성됐다.

아마존S3 서비스 소개 영상의 한 장면. [출처=아마존웹서비스]

테이프 백업을 클라우드스토리지로 대체하는 시나리오는 2가지로 압축된다.

하나는 온프레미스백업을 통해 만들어지는 재해복구 복본 데이터를 오프사이트 테이프로 제작해 보내는 대신, 클라우드에 일간 및 주간 단위 백업 데이터로 보내는 방식이다. 중복제거 어플라이언스를 배치한 상태에서 테이프 사용을 하지 않고 어플라이언스의 원격 복제를 수행하는 조직들이 꽤 있다고 한다.

다른 하나는 월간, 분기간, 연간 단위의 덜 빈번한 백업 데이터를 클라우드에 보내는 것인데, 이는 장기 보존을 위해 온프레미스 인프라나 오프사이트테이프를 쓰는대신 클라우드스토리지를 쓰는 방식에 해당한다. 가트너는 장기 보존 목적이라면 백업데이터가 아니라 아카이브데이터를 클라우드에 둘 것을 추천했지만, 장기 아카이브 방식의 데이터를 백업 용도로 쓰는 조직들이 많다고 한다.

리넨 애널리스트는 이같은 진단 후 AWS가 제공하는 퍼블릭클라우드스토리지 'S3' 서비스를 로컬 디스크 백업, 전체 데이터 백업 데이터의 장기 보관 등 용도로 사용하는 시나리오의 가격을 비교 분석했다. 수십~수천 테라바이트(TB) 규모의 백업 또는 아카이빙 데이터를 이 클라우드스토리지에 보관할 때 용도, 중복제거 및 압축 적용 여부에 따라 해당 기간의 서비스 사용료가 어떻게 달라지는지 파악했다.

앞서 업계에 테이프 대체 서비스로 알려져 있던 AWS 글레이셔 서비스는 분석에서 제외됐다. 현재 글레이셔 서비스는 GB당 월 0.007달러에 불과한 저렴한 스토리지 서비스로, 장기 데이터 보존 목적에 유리해 보인다. 그러나 리넨 애널리스트는 S3 서비스에 비해 그 데이터 처리 속도가 느리고 다른 제약 사항 때문에 S3 활용시 가능한 원형 수준의 복구를 위한 기능이 부족하다는 이유에서, 글레이셔 서비스를 다루지 않기로 했다고 설명했다.

■TCO 관점의 클라우드스토리지 vs. 테이프

그는 클라우드스토리지와 테이프 시스템을 재해복구 또는 장기 보존 목적의 데이터 용도로 쓸 때 총소유비용(TCO)에 영향을 미치는 요인을 ▲원격지 저가스토리지 저장공간 ▲SW와 HW를 포함한 온프레미스 백업 인프라 ▲백업 데이터 오프사이트 재해복구 ▲장기 데이터 보존 ▲관리 및 프로세스 등 5가지 기준으로 바라봤다.

원격지 저가스토리지 저장공간을 활용한다는 관점에서, 테이프는 장기 보존, 장비(테이프 라이브러리 및 드라이브) 확장성과 수명주기 측면에서 드는 비용이 상대적으로 저렴했다. 클라우드스토리지의 경우 데이터 크기, 백업 방식, 중복제거 비율, 사용 빈도, 보존 기간에 따라 비용이 극적으로 변화한다.

온프레미스 백업 인프라를 활용한다는 관점에서, 테이프는 주 서버 및 스토리지 환경의 데이터를 테이프 아카이핑 시스템에 아카이빙할 때 백업SW 가격에 기반한 용량과 온프레미스 백업 인프라 비용을 절감할 수 있다. 다만 새로운 온프레미스 아카이빙SW 가격은 여기에 추가될 수 있다. 클라우드스토리지의 경우 중복제거 비율에 따라 네트워크 트래픽과 클라우드 스토리지 비용을 추가로 낮출 수 있지만 이는 추가 시스템 비용과 별도 관리 프로세스를 야기한다.

백업사이트 오프사이트 재해복구 인프라를 쓴다는 관점에서, 테이프는 저장매체 수송, 매체 관리와 설비 임대 등 절차를 마련해야 하는 특성이 있다. 그런데 이런 서비스는 대규모 환경에서 비싸질 수 있고, 대다수 조직에 부담으로 작용하게 된다. 클라우드스토리지의 경우 네트워크를 통한 데이터 전송 또는 오프라인 수송과 대량의 복구 비용이 가격 결정 요인으로 작용한다. 그리고 테이프 사용 환경에서와 달리, 백업SW가 클라우드 사업자에서 실어보낸 물리적 저장매체를 추적할 수 없다.

장기 데이터 보존 인프라 관점에서, 테이프에 수행하는 아카이빙 작업은 장기간 테이프 백업을 유지하는 것보다 스토리지 비용을 절감할 수 있다. 그러나 이는 테이프 아카이브 관리SW 비용 문제를 낳는다. 온프레미스 테이프 아카이빙은 디스크 계층이나 캐시를 두지 않을 경우 읽기 성능의 손해를 볼 수도 있게 된다. 클라우드스토리지의 경우, 백업 복본을 유지하는 것보다 아카이빙과 계층화 방식을 시도하는 게 더 비용효율적이다. 클라우드 사업자들은 저가 또는 무료로 다중 데이터센터에 데이터 복제를 수행한다.

관리 및 프로세스 부담 관점에서, 테이프는 물리적인 테이프 저장매체를 다루는 과정이 종종 노동집약적이고 사람의 실수에 더 많이 노출되는 경향을 띠게 된다. 여기에는 테이프를 다루는 데 특화된 전문성이 요구된다. 클라우드스토리지의 경우 테이프보다 노동집약적인 경향이 적고 관리 측면에서 자동화돼 있다. 다만 백업SW가 클라우드 커넥터 구성을 지원하지 않을 경우, 백업 관리자는 클라우드에 최적화된 툴이나 클라우드 게이트웨이 어플라이언스 툴과 같은 새로운 도구 사용법을 습득해야 한다.

■"클라우드스토리지, 백업용 테이프 대체 불가…아카이브 활용 OK"

리넨 애널리스트는 ▲클라우드에 주기적인 백업을 수행하기보다는 주 서버와 스토리지의 온프레미스 데이터를 클라우드 영역에 아카이브하거나 클라우드를 스토리지 계층화 영역으로 사용할 것 ▲온프레미스 디스크 백업 복제가 가능한 2차 저장소를 쓸 수 없을 땐 로컬 백업의 재해복구용 복본을 클라우드에 보내는 방식도 있다는 점을 염두에 두고, 빠른 복구를 위해 단기 보존 성격의 온프레미스 디스크 백업 계층을 상시 유지할 것 ▲파일시스템 기반의 영구 증분 백업과 네트워크 대역폭 및 클라우드 스토리지 소비 절감을 위한 가상머신 백업 등 상이한 데이터 타입에 따라 상이한 백업 기술과 방법을 사용하라는 것 ▲용도가 백업이든 아카이빙이든간에, 기업의 SLA 요구사항에 클라우드 데이터 전달 빈도와 보존 정책을 맞추라는 것, 4가지 조언을 제시했다.

보고서에 따르면 기업들의 판단 기준으로 다음 3가지가 권장된다.

첫째, 수년 이상의 장기 데이터 보존을 목적으로 백업을 수행하는 기업들은 퍼블릭클라우드의 역할을 기존 테이프와 같은 '최종 저장소'가 아니라 별개라 봐야 한다. 이보다는 아카이브 또는 스토리지 계층화 방식으로 클라우드에서 생성된 데이터와 인프라의 회복탄력성(resiliency)을 활용하라는 조언이다.

둘째, 데이터센터 인프라에서 대규모 백업 작업을 처리하기에 충분할 만큼 클라우드에 연결되는 네트워크 처리성능(throughput)을 보장해야 한다.

셋째, 백업할 데이터의 유형과, 그걸 복원할 때 요구되는 특징과, 확장시 중복제거를 채택했는지 여부에 따라서 상이한 백업 방식을 적용해야 한다.

보고서에서 다양한 분석을 바탕으로 내린 핵심 결론은 다음 4가지다.

첫째, 클라우드 오브젝트 스토리지는 장기간 아카이브(long-term archive), 일일 온프레미스 백업의 단기 보조수단(short-term tertiary) 겸 재해복구 데이터 복본(copy)에 비용 효율적인 수단이다.

둘째, 클라우드 오브젝트 스토리지가 대규모 백업 환경에서 테이프를 대체할 수는 없다. 일차적으로 온라인 대역폭과 오프라인 데이터 전송 방식의 비효율성 때문이지만, 하이브리드클라우드 관리 기능이 부족한 탓도 있다.

관련기사

셋째, 100테라바이트(TB) 규모의 현업 스토리지를 운영하는 조직에선 초당 10기가비트(Gbps) 광역네트워크(WAN) 접속과 중복제거 기술을 적극 도입해 클라우드 환경에 일일 전체 백업 데이터를 보낼 수 있게 만들어야 한다.

넷째, 장기간 데이터 보존을 위해 백업 생성 위치를 테이프에서 클라우드 스토리지로 바꿀 때, 여기에 중복제거 기술을 쓰거나 백업 방식 및 정책 변경을 수반하지 않으면, 클라우드스토리지 비용이 테이프를 쓸 때보다 오히려 높아진다.