지난 9월 26일 발생한 국가정보자원관리원(국정자원) 대전센터 화재는 단순한 사고를 넘어 정부 디지털 인프라의 구조적 취약성을 드러낸 사건으로 평가된다. 주요 핵심 서비스가 멈춰 서면서 행정 전반이 장기간 혼란에 빠졌고 화재 발생 두 달이 돼가는 현재까지 최종 복구 작업이 이어지고 있다.
업계에서는 이번 사태를 계기로 공공 정보시스템의 복원력 강화와 재난 대응 체계 전면 재설계가 필요하다는 지적이 커지고 있다.
22일 행정안전부에 따르면 국정자원 대전센터 정보시스템 709개 중 697개 시스템이 복구돼 총복구율은 98.3%로 나타났다. 정부는 대구센터 민관협력형 클라우드(PPP) 이전 대상 시스템 복구에 박차를 가하고 있다.
이번 사태가 던진 질문은 "왜 정부 디지털서비스는 멈추면 다시 돌아오는 데 몇 주·몇 달이 걸리는가"라는 점이다. 같은 기간 글로벌 클라우드 사업자 아마존웹서비스(AWS), 마이크로소프트(MS), 클라우드플레어 등도 잇따라 장애를 겪었지만 대부분 수 시간 내 복구를 완료했다.
AWS 미국 동부 리전에서 발생한 도메인 시스템 장애는 약 15시간 만에 정상화됐고 MS 애저 클라우드의 전역 네트워크 장애 역시 수 시간 내 복구됐다. 클라우드플레어는 내부 데이터베이스(DB) 권한 변경 과정에서 발생한 오류로 전 세계 네트워크 서비스가 피해를 입었지만 약 3시간 만에 문제를 해결했다. 글로벌 사업자들 역시 장애 자체는 피하지 못했지만 복구 속도는 국정자원과 비교하기 어려울 만큼 빨랐다.
속도 차이는 기술 인프라와 운영 체계의 구조적 차이에서 비롯된다. 민간 클라우드 기업들은 장애 발생 즉시 자동화된 재해복구(DR) 체계가 작동하도록 설계돼 있고 리전·가용영역(AZ)을 다중화해 단일 장애 지점(SPOF)을 최소화했다.
반면 국정자원은 물리적으로 세 곳의 센터를 운영해 왔지만, 전력·네트워크·장비 구성 요소가 한 센터 내부에 집중돼 있어 대전센터 화재처럼 물리적 재난이 발생했을 때 대체 시스템으로의 전환이 원활히 작동하지 않았다.
운영 구조도 여전히 전통적 방식에 머물러 있다. 서버·스토리지·네트워크 등 장비 제조사 다양화를 위한 정책은 운영 복잡성을 높였고 구성의 표준화가 부족해 신속한 대응이 어려운 환경이다. 특히 각 부처의 정책·사업·보안 규정이 분절돼 있어 새로운 기술을 도입하고 운영 방식을 개선하는 데도 한계가 있다.
전문가들은 정부 디지털 인프라가 '중앙집중형=안전'이라는 오래된 인식에서 벗어나야 한다고 지적한다. 민간 클라우드는 지리적으로 분산된 여러 리전 기반 위에서 운영되기 때문에 특정 데이터센터에서 문제가 발생해도 서비스 전체가 중단되지 않는 구조를 갖췄다.
국정자원은 특정 센터에 문제가 생기면 주요 행정서비스가 한꺼번에 멈추는 위험을 드러냈다. 정부는 센터 간 이중화 시범 사업을 신속히 완료하고 DR 전용 공주 백업센터를 운영한다는 방침이다.
미국은 이미 민간 클라우드 기반의 공공 전용 존을 확대하며 멀티클라우드 전략을 기반으로 공공 인프라를 운영 중이다. 연방조달청(GSA)이 AWS·구글·MS·오라클 등과 대규모 계약을 체결해 클라우드 자원을 정책적으로 통합 조달하고 페드램프 인증으로 보안 기준을 표준화한 것이 대표적 사례다. 한국 공공 클라우드 환경과의 구조적 차이가 나타나는 지점이다.
국내에서도 민간 클라우드 활용 확대 움직임은 이미 시작됐다. 국정자원 대구센터에 PPP 모델이 구축되며 삼성SDS·KT클라우드·NHN클라우드 등 민간 클라우드 서비스 기업(CSP)들이 국가 중요 시스템 대상 서비스를 개시한 상태다. 하지만 실제 공공 전반을 놓고 보면 클라우드 전환 속도는 여전히 더딘 수준이다. 예산·보안 규제·조달 절차 등 제도적 장벽 역시 장애 요인으로 지적되고 있다.
이번 사태 이후 업계에서는 국정자원을 민간 클라우드 수준의 가용성과 복원력을 갖춘 '정부형 CSP'로 전환해야 한다는 목소리가 커지고 있다. 다중 리전 기반 멀티클라우드 전략을 도입해 단일 장애 지점을 제거하고 자동화 기반 DR 시스템을 갖춘 구조로 재편해야 한다는 데 의견이 모아진다.
관련기사
- 정부, 국정자원 화재 복구에 예비비 261억원 추가 투입2025.11.11
- 국민생활 밀접 1등급 시스템 전면 복구…주요 민원서비스 정상화2025.10.31
- 공공데이터포털 서비스 재개…정부 정보시스템 64.3% 복구2025.10.23
- 국정자원 화재 피해 시스템 절반 복구…대체 서비스 총력 대응2025.10.20
장애는 어떤 인프라에서도 발생할 수 있다. 문제는 복구 속도와 그 과정에서 국가 기능이 어디까지 유지될 수 있는가다. 공공의 디지털 복원력을 민간 수준으로 끌어올리지 못한다면 정부 디지털서비스는 앞으로도 위기 때마다 장기간 멈춰 설 수밖에 없다는 경고가 나온다.
클라우드 업계 관계자는 "전 세계 어디에서도 장애는 피할 수 없지만 복구를 몇 시간 내 끝낼 수 있는 구조를 갖추는 것이 공공의 필수 과제"라며 "국정자원도 단일 센터 중심 구조에서 벗어나 멀티클라우드 기반 복원력 체계로 전환해야 한다"고 강조했다.











