"현재 기업이 가장 두려워하는 건 클라우드 시스템이 갑자기 멈추는 순간입니다. 클라우드 장애 한 번이 매출 손실로 바로 이어지기 때문입니다. 우리는 고객 맞춤형 재해복구(DR) 기술로 신속한 장애 대응과 기업 운영 연속성을 보장할 수 있습니다."

삼성SDS 최정진 그룹장은 11일 호텔신라 다이너스티홀에서 열린 'AI & 클라우드 컨퍼런스 2025(ACC 2025)'에서 DR로 서비스 중단 위험 줄이는 방안을 이같이 제시했다.

최 그룹장은 DR의 핵심 요소로 비즈니스 영향 분석과 복구 절차 마련, 자동화, 정기 테스트, 위험 점검을 꼽았다. 그는 "이 기준이 모두 갖춰져야 클라우드에 장애가 발생해도 빠르고 정확한 대응이 가능하다"고 강조했다.

삼성SDS 최정진 그룹장이 재해복구(DR) 시스템 필수 요소에 대해 설명하고 있다.

최 그룹장은 이런 요소가 삼성SDS의 DR 서비스에 모두 접목됐다고 주장했다. 그는 "우리는 기업별 상황에 맞춘 복구 전략을 제공할 수 있다"며 "빠른 복구가 필요한 서비스부터 비용 효율성을 중시하는 환경까지 폭넓은 선택지가 마련됐다"고 자신했다.

그는 DR 대표 활용 방식으로 '파일럿 라이트'와 '콜드'를 제시했다. 두 방식은 대규모 장비를 상시 운영하기 어려운 제조업이나 해외 법인의 IT 환경에서 유용한 대안으로 꼽히고 있다. 기업은 비용과 복구 속도 사이에서 균형을 맞춰 적절한 DR 전략을 선택할 수 있다.

파일럿 라이트 방식은 서비스 운영에 꼭 필요한 최소 시스템만 평상시에 켜 두고, 장애가 발생하면 나머지 서버를 빠르게 확장해 서비스를 복구하는 구조다. 최 그룹장은 "핵심 기능은 바로 복구할 수 있도록 유지하면서도 전체 인프라를 상시 운영하지 않아 비용을 크게 줄일 수 있다"고 강조했다.

콜드 방식은 재해복구를 위한 자원을 평소에 꺼두고, 데이터만 다른 센터에 백업해 두는 방식이다. 최 그룹장은 "클라우드 장애가 발생하면 백업 데이터 기반으로 서버를 새로 띄우고 서비스를 복원한다"며 "비용 부담이 적은 대신 복구 시간이 더 소요되는 구조"라고 말했다.

최 그룹장은 기업이 자체 데이터센터뿐 아니라 외부 클라우드를 사용하더라도 삼성SDS의 DR센터와 연결해 복구 체계를 구축할 수 있다고 강조했다. 고객은 클라우드 광역통신망(WAN)을 비롯한 가상사설망(VPN), 전용회선 가운데 보안 수준, 비용 부담, 속도 요구에 따라 적합한 네트워크 방식을 선택하면 된다.

삼성SDS는 DR 운영 복잡성을 줄이기 위해 자동화 기능도 강화했다. 최 그룹장은 "복구 절차를 코드로 표준화해 인적 오류를 줄였다"며 "시나리오 기반 자동 복구를 통해 보안 대응 속도를 높였다"고 강조했다.

특히 대시보드 기반 점검 기능은 복구 진행 상태를 직관적으로 보여줄 수 있어 운영 인력 부담을 낮춘다. 서버 기동과 데이터 불러오기, 점검 절차도 자동으로 처리돼 실제 장애 상황에서 복구 효율을 높인다는 설명이다.

최 그룹장은 "우리는 시스템 통합(SI)에 주력할 때부터 DR에 굉장히 강했다"며 "클라우드 기업으로 전환하면서 클라우드형 DR까지 제일 잘 할 수 있는 기업으로 성장할 것"이라고 자신했다.