MS 클라우드 서비스, 임시 중단 원인은 ‘코드 결함’

코드 결함으로 디도스 공격 막지 못해 서비스 중단

컴퓨팅입력 :2021/04/07 09:55

마이크로소프트(MS) 클라우드 서비스 임시 중단 사태는 코드 결함 때문이었던 것으로 드러났다. 

마이크로소프트는 애저 DNS 서버의 코드 결함으로 인해 디도스 공격을 제대로 막아내지 못한 것이라고 근본원인분석(RCA) 페이지를 통해 최근 밝혔다.

지난 주 오피스365, 애저 등 마이크로소프트 주요 클라우드 서비스가 두 시간 가량 중단되는 사고가 발생했다. 당시 마이크로소프트는 "DNS에 문제가 있었다"고만 밝힌 채 구체적인 내용은 공개하지 않았다. 

마이크로소프트에 따르면 애저 같은 대형 클라우드 서비스는 일반적인 디도스 공격만으로는 중단시킬 수 없다. 다중 계층 보호, 실시간 모니터링 등 공격 방지하고, 급증하는 트래픽을 완화하기 위한 시스템을 갖추고 있기 때문이다.

마이크로소프트 데이터센터

하지만 이번엔 디도스 공격 방어 중 DNS 서비스에 발생한 코드 결함 때문에 서비스 중단 사태로 이어졌다고 마이크로소프트가 밝혔다. 특정 이벤트 시퀀스로 인해 코드 결함이 노출되면서 DNS 엣지 캐시 효율성을 떨어뜨렸다는 것이다. 

떨어진 효율로 인해 DNS 서비스가 과부화되자 DNS 클라이언트는 재시도 요청을 반복해서 워크로드로 추가했다. 제한이 설정돼 있지 않은 클라이언트의 요청은 그대로 축적돼 트래픽을 증가시키고 DNS 서비스의 가용성을 감소시켜 결국 클라우드 서비스를 일시 중단시켜버렸다. 

이로 인해 마이크로소프트 오피스, X박스라이브, 다이나믹스 365, 팀즈, 스카이프, 원드라이브 파워앱스 등 마이크로소프트의 주요 서비스에 약 2시간 동안 접근하거나 로그인할 수 없었다.

관련기사

마이크로소프트 측은 “현재 코드 결함은 수정했으며, 이제 DNS캐시가 트래픽 급증을 더욱 잘 처리할 수 있다”며 “비정상적인 트래픽 감지 및 모니터링 기능을 더욱 개선할 계획”이라고 밝혔다.

이어서 “서비스 중단으로 영향을 받은 모든 고객에게 사과 드린다”며 “향후 이러한 사고가 발생하지 않도록 애저 플랫폼과 프로세스를 개선하기 위한 조치를 지속적으로 취할 것”이라고 전했다.