IT 산업의 시작과 함께 백업은 꽤 오랜 역사를 가지고 있다. 지금은 각 애플리케이션 서버에 직접 연결해 백업하는 형태를 더 이상 찾아보기 힘들다. 끊임없이 새롭게 소개되는 백업 방식은 과거 방식의 결점을 보완하기 위해 고안됐으며, 백업 시간의 단축, 성능 향상, 애플리케이션의 영향 최소화 등을 염두에 둔 전략으로 이어지고 있다. 일반적인 백업 방식에는 4가지가 있다.·전용 백업 네트워크(Dedicated Backup Network) : 네트워크를 통해 특정 백업 서버에서 백업·공유 백업 네트워크 자원(Shared Backup Network Resources) : 라이브러리 자원을 공유하며 SAN을 통해 백업·제로 임팩트 백업 : 스토리지 장비와 라이브러리를 통해 직접 백업이 진행되며 애플리케이션 서버에는 전혀 영향을 미치지 않음·어드밴스드 백업 : 완벽하고 신속 정확한 백업과 즉각적인 복구를 보장하는 제로임팩트 백업을 조합한 형태
전통적인 백업 형태기업의 데이터는 곧 중요한 자산이므로 잘 보호하고 관리해야 한다. 초기에는 각 애플리케이션 서버에 개별적인 백업 테이프 드라이브가 할당돼, 백업이 애플리케이션 서버별로 이뤄졌다. 이런 백업 방식은 백업에 대한 부하가 분할되기 때문에, 속도는 빠르지만 관리하는 데에는 상당한 어려움이 따른다. 애플리케이션 서버마다 백업 애플리케이션이 별도로 필요하고, 애플리케이션 별로 할당된 테이프 드라이브를 관리해야 하며 테이프 교환은 일일이 사람 손을 거치는 작업이기 때문이다. 또 기업의 규모가 커짐에 따라 서버 수가 증가하고 백업해야 하는 데이터의 양도 무제한으로 증가하고 있다. 결과적으로 백업 장비와 소프트웨어를 관리하는데 드는 시간, 서버마다 필요한 백업 애플리케이션을 구입하는데 드는 비용, 데이터 무결성을 저해하는 데이터 조작 실수 가능성 등을 감안해 볼 때, 전통적인 백업 방식의 한계점은 더욱 분명해진다. 네트워크 백업 등장전통적인 백업 방식인 서버별 백업 전략의 한계점을 극복하기 위한 노력으로 백업에 네트워크 개념을 접목한 방식이 소개됐다. 이 백업 방식에서는 모든 애플리케이션 서버는 LAN을 통해 연결되고, 백업 애플리케이션 서버로 별도 서버를 지정한다. 백업 소프트웨어는 백업 애플리케이션 서버에 위치하며, 백업 애플리케이션 서버는 LAN을 통해 각 서버로 백업 명령을 보낸다. 백업 파일은 네트워크를 통해 다시 백업 서버로 보내진 후, 이를 마지막으로 테이프 라이브러리에 저장하게 된다.
(그림 2)에서도 알 수 있듯이, 백업 자원과 메타데이터는 지정된 백업 서버에 설치된 백업 애플리케이션 소프트웨어에서 관리하며, 백업 애플리케이션은 각 다른 애플리케이션 서버에 설치돼 돌고 있는 백업 에이전트와 네트워크를 통해 통신한다. 백업 에이전트는 백업 일정을 관리하고, 디렉토리 구조에 대한 접근을 통제하며, 데이터 전송을 초기화해 파일 레벨에서 백업·복구할 수 있도록 한다. 대부분의 기업에서 이 방식을 이용해 주 단위 전체 백업과 일 단위 증가분 백업을 하고 있다. 전체 백업은 시스템을 통째로 백업하는 것을 말하며, 증가분 백업은 전체 백업 이후 변경된 정보에 대한 백업을 말한다. 백업은 주로 서비스하지 않는 시간에 이뤄지며, 이를 백업 윈도우(Backup Window)라고 한다. 백업 윈도우는 정상적인 서비스를 할 때와 구분되며 네트워크 트래픽 량이 거의 없는 때를 의미한다. 계속 사용해야 하는 파일이나 데이터베이스의 경우에는 백업을 할 수 없다. 백업해야 하는 데이터가 점차 늘어나고, 24x7 서비스가 기본 전제조건이 되는 환경에서 백업 윈도우는 거의 0에 가깝게 단축되고 있는 실정이다. 백업 트래픽이 백업 윈도우를 초과하면 백업으로 인해 LAN 흐름이 원활하지 않으며 정상 서비스 트래픽에 필요한 대역폭을 차지하게 된다. 그렇게 되면 백업은 더 이상 제 기능을 제대로 수행하지 못한다. 전용 백업 네트워크 일반 트래픽과 백업 트래픽을 독립시켜 대역폭 문제를 해결하기 위한 방법으로 전통적인 백업 방식에 전용 백업 네트워크(Dedicated Backup Network)를 도입하는 방안이 소개됐다. 전용 백업 네트워크로는 기가비트 이더넷 또는 10/100Mbps를 쓰는 것이 일반적이다. 앞에서 설명한 백업 방식과 마찬가지로 백업 애플리케이션은 전용 백업 서버에, 백업 에이전트는 각 애플리케이션 서버에 위치한다. 단지 모든 메타데이터와 파일 트래픽이 전용 백업 네트워크에서 일어난다는 점이 유일한 차이점이라 할 수 있겠다.전용 백업 네트워크를 통해 백업 트래픽을 완전히 독립시켜 LAN에서는 그 외의 트래픽만 발생하므로 LAN은 백업 트래픽에서 완전히 자유롭게 됐다. 또한 백업 자원을 통합해 백업 관리가 보다 수월해졌다. 이런 장점에도 불구하고 기존 네트워크에서 데이터 전송 속도의 문제점이나 백업 소프트웨어와 에이전트 구입비용의 문제점은 여전히 해결해야 할 숙제다. 무엇보다도 전용 백업 네트워크를 이용한 백업 방식은 개별 애플리케이션 서버에 부하를 증가시킨다는 부담을 안고 있다. 또한 백업이 진행되는 동안 각 서버는 데이터를 백업 서버로 전송해야 하기 때문에, 사용중인 파일을 백업할 수 없고, 백업 동안 트랜잭션 무결성을 위해 데이터베이스를 중지해야 하는 문제가 여전히 남아 있다.
LAN-프리 백업의 진화SAN의 도입으로 LAN-프리 백업 기능에 대한 아이디어가 나왔다. LAN-프리 설정으로 전용 백업 네트워크가 필요없고, 기존의 비즈니스 네트워크의 대역폭에 부정적인 영향을 주지 않으면서 백업이 수행될 수 있다. 이런 시나리오에서는 테이프 장치가 스위치를 통해 저장 네트워크에 직접 연결된다. 대부분의 라이브러리가 현재 광 채널 연결을 직접적으로 또는 내외부의 FC(Fiber Channel)에서 SCSI 브리지를 통해 지원한다. SAN이 가능한 백업 애플리케이션은 각 애플리케이션 서버가 전용 백업 서버를 사용하지 않고, 자신의 SAN 연결을 통해 테이프 라이브러리를 공유하게 한다.LAN-프리 백업에서는 각 애플리케이션 서버가 백업 소프트웨어 복사본 한 개를 실행하고, 서버는 해당 테이프에 관한 메타데이터를 위한 주 데이터베이스 역할을 수행한다. 각 애플리케이션 서버는 SAN을 통해 라이브러리 자원에 붙게 되고, 각각 자격과 통제권을 동등하게 소유한다. 각 애플리케이션 서버는 필요할 때마다 로봇과 테이프 드라이브로 명령 메시지를 보냄으로써 백업을 시작한다. 메타데이터는 마스터 서버에 위치한 마스터 데이터베이스로 보내진다. 이 메타데이터는 서버에서 실행되는 백업 에이전트를 통해서 서버에 사용 가능하며 모든 자원의 집중 방식으로 보도록 한다. 백업 명령은 각 애플리케이션 서버로부터 나오지만, 데이터 전송은 저장 장치와 테이프 라이브러리 사이에 직접적으로 이뤄진다. LAN-프리 백업은 전송이 기존 LAN 네트워크가 아니라, 고속의 SAN을 통해 이뤄지기 때문에 데이터 전송 성능 문제 해결에 집중적으로 접근한다. 데이터가 10/100Mbps IP LAN 대신에 현재는 광 채널이나 기가비트의 SAN을 통해 전송된다. LAN-프리 백업은 또한 일반적인 LAN 채널을 통한 백업 네트워크 통신을 제거한다. 이 두 가지의 장점으로 그동안 IT 백업 전략에 문제였던 몇 가지 성능 문제와 LAN 전송 문제를 해결했다. LAN-프리 백업이 해결할 수 없었던 것은 디스크와 테이프 자원 사이에 데이터의 전송에 필요한 추가적인 프로세서 부하 뿐 아니라, 백업 애플리케이션과 각 애플리케이션 서버에 대한 에이전트의 구매·유지가 비싸다는 것이다. 그러나 이 시나리오가 가져오는 장점은 이런 관련 비용보다는 훨씬 크다.
SAN에 최적화된 서버리스 백업서버리스 백업은 SAN 환경에서 최적화된다. 많은 백업 소프트웨어 업체들이 서버리스 백업 모델을 지원하는 쪽으로 움직이고 있다. 이 모델은 애플리케이션 서버에 최소한의 영향을 주면서 데이터를 전송하는데 ‘데이터 전송자’와 ‘확장된 복사 명령’을 활용한다. CPU와 메모리의 성능에 지대한 영향을 주는 애플리케이션 서버가 데이터를 강제로 밀어 넣도록 하는 방식 대신에, 백업 서버가 테이프로 전송돼야 할 파일 리스트를 취합한다. 이 파일 리스트는 디스크에서 테이프로 다량의 정보를 전송하는 데이터 전송자에게 전달된다.일반적으로 데이터 전송자의 기능을 수행하기 위해서는 별도의 값비싼 장치가 필요하다. 그러나 펠콘스토어의 경우는 IPStor가 데이터 전송자의 역할을 수행해 별도의 장치를 준비하지 않아도 되는 장점이 있다. 공인된 제 3자 백업 소프트웨어는 작동중인 애플리케이션에 최소한의 영향을 보장하면서 스토리지에서 테이프로 데이터를 전송하기 위해서 단지 IPStor와 통신만 하면 된다. 백업 가능자 옵션(Backup Enab ler Option)으로 제공되는 서버리스 백업 가능자는 백업 애플리케이션이 IPStor을 확장된 복사 프로토콜로서 사용하도록 허용해, 데이터가 디스크에서 테이프로 직접 전송하도록 확장 복사 프로토콜에 대한 지원을 더한다. 따라서 LAN과 SAN의 데이터 전송량은 효과적으로 줄어들며, 애플리케이션 서버에 부여된 처리 주기도 줄어든다. 그러나 진행 작업에 대해 주기적으로 업데이트하는 것 뿐 아니라, 백업 요청을 수행하는 백업 에이전트나 클라이언트 에이전트로 불리는 백업 소프트웨어의 일 부분을 실행하기 위해 애플리케이션 서버가 여전히 필요하다. 이 문제는 제로임팩트 백업 가능자 옵션을 통해 해결된다.
서버리스 백업을 확장한 제로임팩트 백업 제로임팩트 백업은 SAN 환경에서부터 만들어졌으며, 데이터 센터 관리자에게는 혁신적인 새로운 개념이다. IPStor의 백업 가능자 옵션의 일부로서 제공되는 제로임팩트 백업 가능자는 백업·복구 동작중에 애플리케이션 서버의 간섭에 대한 필요를 완전히 제거해 서버리스 백업의 개념을 더욱 확장한다. 각 애플리케이션에 추가적인 프로세서 또는 메모리 탑재가 필요없으며 부가적인 백업 애플리케이션 에이전트도 필요없다. 이 시나리오의 바탕이 된 아이디어는 명령과 통제, 메타데이터, 어떤 서버 활동도 없는 데이터 흐름 등이 어떻든지 간에 애플리케이션 서버의 간섭없이 일어난다는 것이다. 이때 가능자는 테이프 자원, 메타데이터, 테이프로의 데이터 이동을 취급하는 지능적인 데이터 전송자의 사용에 존재한다. 데이터 전송자는 원시장치(raw-device) 백업 애플리케이션이 작동하는 IPStor 서버이다. 대표적인 업체로는 베리타스, 레가토, 그리고 백본(BakBone) 등이 있다. IPStor 서버는 백업 통제, 테이프 라이브러리 통제, 그리고 백업 테이프의 메타데이터 체제를 관리한다. 백업 과정 동안 어떤 애플리케이션 서버와도 상호 작용이 필요없다. 백업을 하는 동안 IPStor 서버는 모든 이미지를 포착하고, 요청된 데이터의 동급 복사를 차단하며 그것을 테이프 라이브러리로 바로 이동한다. 애플리케이션 서버 요청도 발생하지 않으며, 데이터 전송자와 라이브러리 자원사이에 정보도 교환되지 않는다. 한번 시작되면, 데이터 복사는 스토리지에서 라이브러리 자원으로 바로 이뤄진다. 명령과 데이터 경로가 IPStor 서버에게 배타적으로 로컬화되기 때문에, SAN의 애플리케이션 서버는 백업·복구 작업과 관련된 성능 향상과 오버헤드의 제거라는 긍정적 결과를 얻을 수 있다. 결과적으로는 디스크와 테이프 사이에 최적의 데이터 전송을 가져오며 또한 디스크나 테이프 엔진에 의해서만 제한을 받는 순 전송률을 달성하는 유일한 방법이다. 스냅샷 에이전트는 줄어든 백업 윈도우 환경에서 작동중인 데이터베이스가 확실히 보호될 수 있도록 한다. 완벽한 데이터·트랜잭션 무결성은 특정 시간의 복사, 제 3자 백업 애플리케이션, 그리고 재해 복구 계획을 위해 안전하고 신뢰성 있게 데이터베이스 스냅샷을 취하는 완전하며 자동화된 프로세스를 통해 얻을 수 있다. 이런 에이전트는 제로임팩트 백업 가능자, 타임마크 옵션, 스냅샷 복사 옵션, 그리고 복제 옵션 등과 부드럽게 작동하는데, 모두 내장 스냅샷 엔진에 기반을 두고 있다. 스냅샷 에이전트는 결과적으로 생산된 데이터의 복사본이 특정 시간 일관성 뿐 아니라, 트랜잭션의 무결성을 확실히 가질 수 있도록 한다. 이는 트랜잭션의 일부분을 롤백하기 위해 긴 시간의 데이터베이스 재구축없이 데이터베이스 복사본이 작동할 수 있다는 것을 의미한다. 이로서 복구 상황시 많은 귀중한 시간을 절약할 수 있다.제로임팩트 백업의 장점은 속도다. 디렉토리 구조의 복사가 필요 없기 때문에, 데이터가 블록 단위로 쓰여진다. 따라서 빠른 백업이 가능하다. 오버헤드도 없고 백업 장치는 블럭 크기의 성능으로 최적화된다. IPStor를 데이터 전송자로 사용하면, 테이프 장치의 최대 속도로 백업이 가능하다. 최고속의 데이터 백업이 필요한 상황에서 이보다 더 나은 방법은 없다. 또 다른 큰 장점으로는 각 애플리케이션 서버에 에이전트가 있을 필요가 없어져 비용을 절감할 수 있다. 데이터 전송자가 에이전트로부터 아무런 정보도 필요로 하지 않기 때문에 애플리케이션 서버에 백업 에이전트가 설치될 필요가 없다는 것이다. 어떤 상황에서는 이것이 고객에게 중대한 비용 절감을 제공할 수 있다. 제로임팩트 백업은 애플리케이션 서버에 추가적인 프로세스 탑재를 필요하지 않는다. 모든 데이터의 전송은 데이터 전송자에 의해 애플리케이션 서버에 아무런 영향도 없이 관리되며 따라서, 제로임팩트 백업이라는 용어가 나온 것이다. 제로임팩트 백업은 전체 이미지, 블럭 단위 백업이기 때문에 복구도 전체 이미지 블럭 단위이다. 따라서 전체 볼륨의 복구 속도는 최고의 속도가 된다.
즉각적인 더욱 작은 단위로 복구 IT 관리자는 일반적으로 두 가지 형태의 데이터 손실 문제에 대한 걱정을 해야한다. 첫째는 하드웨어(디스크) 고장과 ‘소프트 에러’인데, 이는 실수로 인한 삭제, 디스크 파티션, 파일 시스템 파손, 애플리케이션 수준의 결함이나, 바이러스 공격을 포함한다. RAID, 미러링, 복제가 하드웨어 문제를 처리하지만 소프트에러의 유일한 방어책은 효과적이며 빈번한 백업이다. 둘째는 얼마나 자주 디스크가 테이프에 백업돼야 하는가이다. 일반적으로 주말에는 전체 이미지 백업이, 그리고 요일별로 증가분에 대한 백업 보완이 이뤄진다. 대규모 데이터베이스 경우는 데이터가 계속해서 변경되기 때문에 증가분 백업(파일 기반의) 조차도 효과적일 수는 없다. 펠콘스토어의 경우는 TimeMark으로 시간 당 가상 TimeMark 스냅샷(주 당 5일, 일 당 24개의 TimeMark = 120 TimeMark/주)의 스케쥴을 정할 수 있고 자동적으로 주 단위로 공간을 재활용할 수 있게 한다.화요일 오후 5:32에 거대한 바이러스 공격이 디스크를 망가뜨렸고, 해당 바이러스에 대한 바이러스 스캔·복구 툴을 사용할 수 없는 상황을 가정해 보자. 오후 5:02에 실행했던 감염된 프로그램이 문제를 일으켰다는 것을 발견할 수 있다. 감염된 드라이브를 오른쪽 클릭하고, TimeMark -> Rollback을 선택한 후, 화요일 오후 5:00를 선택한다. 순간 전체 드라이브의 내용이 오후 5:00의 정확한 내용으로 타임머신처럼 복귀된다. 이는 오후 5:02분에 발생한 실수를 효과적으로 원상 복귀시킨다.무결성 보장하는 어드밴스드 백업시간 별 스냅샷으로 설정돼 있으면 가장 많이 잃을 수 있는 것은 한 시간의 일량이다. 분 당 스냅샷도 가능하다. TimeView는 디스크 볼륨처럼 IPStor가 지원되는 모든 애플리케이션 서버에 즉시 할당된다. 이것으로 관리자는 특정 시점의 디스크 내용으로 복구할 수 있어, 전체 볼륨을 복사할 필요가 없이 몇 개의 파일을 즉각적으로 복구할 수 있다.증가분 백업을 위해서 대규모 데이터베이스 파일의 블록 수준에서의 변경을 감지할 수 있는 방법을 백업 소프트웨어에게 제공한다. 각 TimeMark는 디스크에 대한 정확한 변경을 나타내기 때문에 TimeM arks를 백업함으로써, 증가분 백업이 효과적으로 이뤄진다. TimeMark 없이는 일반적인 백업 소프트웨어가 대형의 데이터베이스 파일에 들어가서 증가분 백업을 위한 변경 내용을 찾아내기는 불가능하다. 일부 백업 소프트웨어는 변화된 레코드를 구별하기 위해서 DBMS의 API를 사용하는 에이전트를 제공하지만, 데이터베이스 API에 크게 종속되며 API, 운영체제, 네트워크를 거쳐야 하기 때문에 느리다. 전통적인 테이프 백업·복구 모델은 점진적인 데이터 백업·복구를 제공하기 위해 디스크 저널링과 함께 사용돼 데이터의 보호를 상당히 향상시킬 수 있다. 어드밴스드 백업의 특징은 제로임팩트 백업 가능자가 TimeMark 옵션과 동시에 가동됨으로, 제 3자 백업 소프트웨어가 전체 또는 증가분 또는 차등분 백업·복구를 블럭 수준에서 수행할 수 있도록 해준다. 증가분 그리고 차등분 제로임팩트 백업을 수행할 수 있는 기능은 처음으로, 이전에는 오직 전체 제로임팩트 백업만이 가능했었다. 따라서 초고속의 전체 이미지 복구로 이전의 제로임팩트 백업을 구현하지 못하게 했던 장애 요인이 제거됐다. 강화된 제로임팩트 백업 인터페이스는 데이터센터 관리자에게 그들의 백업 윈도우에 잘 맞는 백업 시나리오를 디자인하는데 우수한 선택의 폭과 융통성을 제공한다. 특히 데이터베이스를 복사할 때 필수적인 거래 무결성을 보장하는 백업 가속 기능은 IPStor의 스냅샷 에이전트와 그룹 스냅샷 에이전트 기능과 통합된다. IT 관리자는 온라인 증가분, 차등분 데이터베이스(익스체인지, 오라클, MS-SQL 2000 등) 백업을 수행할 수 있다. 어드밴스드 백업은 백업과 복구 시간을 엄청나게 단순화하고 가속화하며, 데이터베이스와 메시징 시스템을 백업할 때 트랜잭션 무결성을 보장함으로써 투자 대비 이윤을 극대화한다.
기업 환경 고려한 백업 절차 강화 효과적인 백업과 복구를 위한 비용은 데이터의 손실이나 시스템 중단 시간과 비교하면 아무 것도 아니다. 따라서 백업 솔루션의 투자 대비 이윤을 극대화하기 위해서 기업에게 가장 광범위하고 진보된 그리고 효과적인 솔루션을 사용해야한다. 그래야만 데이터 보호의 범위가 확장되고 기업의 데이터는 여러 위협의 측면에서 보호될 수 있다. 통합된 제로임팩트 백업/온라인 디스크 저널링과 함께 스토리지 통합·속도 증가를 합한 고속 백업과 즉각적인 복구를 위한 전혀 새로운 패러다임이 일어나고 있고, 기존의 백업 절차를 강화하고 있는 현실이다. 이를 통해 실수로 인한 삭제, 해커의 침입, 바이러스나 어떤 것이든 잘못된 것이 발생한 후에 단계적이며 즉각적인 온라인 복구로 원상태로 돌아갈 수 있다. 또한 애플리케이션 서버에는 영향을 주지 않고 아주 빠른 속도로 백업을 할 수 있어, 전체 증가분 또는 차등분 백업을 선택할 수 있는 자유를 갖게 된다. @