"현재 기업이 가장 두려워하는 건 클라우드 시스템이 갑자기 멈추는 순간입니다. 클라우드 장애 한 번이 매출 손실로 바로 이어지기 때문입니다. 우리는 고객 맞춤형 재해복구(DR) 기술로 신속한 장애 대응과 기업 운영 연속성을 보장할 수 있습니다."
삼성SDS 최정진 그룹장은 11일 호텔신라 다이너스티홀에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 DR로 서비스 중단 위험 줄이는 방안을 이같이 제시했다.
최 그룹장은 DR의 핵심 요소로 비즈니스 영향 분석과 복구 절차 마련, 자동화, 정기 테스트, 위험 점검을 꼽았다. 그는 "이 기준이 모두 갖춰져야 클라우드에 장애가 발생해도 빠르고 정확한 대응이 가능하다"고 강조했다.
최 그룹장은 이런 요소가 삼성SDS의 DR 서비스에 모두 접목됐다고 주장했다. 그는 "우리는 기업별 상황에 맞춘 복구 전략을 제공할 수 있다"며 "빠른 복구가 필요한 서비스부터 비용 효율성을 중시하는 환경까지 폭넓은 선택지가 마련됐다"고 자신했다.
그는 DR 대표 활용 방식으로 '파일럿 라이트'와 '콜드'를 제시했다. 두 방식은 대규모 장비를 상시 운영하기 어려운 제조업이나 해외 법인의 IT 환경에서 유용한 대안으로 꼽히고 있다. 기업은 비용과 복구 속도 사이에서 균형을 맞춰 적절한 DR 전략을 선택할 수 있다.
파일럿 라이트 방식은 서비스 운영에 꼭 필요한 최소 시스템만 평상시에 켜 두고, 장애가 발생하면 나머지 서버를 빠르게 확장해 서비스를 복구하는 구조다. 최 그룹장은 "핵심 기능은 바로 복구할 수 있도록 유지하면서도 전체 인프라를 상시 운영하지 않아 비용을 크게 줄일 수 있다"고 강조했다.
콜드 방식은 재해복구를 위한 자원을 평소에 꺼두고, 데이터만 다른 센터에 백업해 두는 방식이다. 최 그룹장은 "클라우드 장애가 발생하면 백업 데이터 기반으로 서버를 새로 띄우고 서비스를 복원한다"며 "비용 부담이 적은 대신 복구 시간이 더 소요되는 구조"라고 말했다.
최 그룹장은 기업이 자체 데이터센터뿐 아니라 외부 클라우드를 사용하더라도 삼성SDS의 DR센터와 연결해 복구 체계를 구축할 수 있다고 강조했다. 고객은 클라우드 광역통신망(WAN)을 비롯한 가상사설망(VPN), 전용회선 가운데 보안 수준, 비용 부담, 속도 요구에 따라 적합한 네트워크 방식을 선택하면 된다.
삼성SDS는 DR 운영 복잡성을 줄이기 위해 자동화 기능도 강화했다. 최 그룹장은 "복구 절차를 코드로 표준화해 인적 오류를 줄였다"며 "시나리오 기반 자동 복구를 통해 보안 대응 속도를 높였다"고 강조했다.
특히 대시보드 기반 점검 기능은 복구 진행 상태를 직관적으로 보여줄 수 있어 운영 인력 부담을 낮춘다. 서버 기동과 데이터 불러오기, 점검 절차도 자동으로 처리돼 실제 장애 상황에서 복구 효율을 높인다는 설명이다.
최 그룹장은 "우리는 시스템 통합(SI)에 주력할 때부터 DR에 굉장히 강했다"며 "클라우드 기업으로 전환하면서 클라우드형 DR까지 제일 잘 할 수 있는 기업으로 성장할 것"이라고 자신했다.