‘페이스북 패밀리’가 사상 초유의 서비스 장애로 홍역을 겪었다. 단순히 서비스만 중단된 게 아니었다. 보안 시스템, 내부 일정표, 일정 관리 도구 등 페이스북 내부 시스템도 먹통이 됐다.
페이스북이 겪은 시련은 그 뿐만이 아니었다.
미국 IT 전문매체 프로토콜에 따르면 페이스북닷컴(facebook.com) 도메인도 매물로 나왔다는 허위 공지까지 올라왔다. 잭 도시 트위터 최고경영자(CEO)가 공개적으로 가격을 문의하는 트윗을 올리기도 했다.
사무실 출근·이메일 접속까지 불가…도메인 매물로 나오기도
처음 서비스 장애가 시작된 것은 4일 오전 11시40분(이하 미국 동부시간 기준) 경이었다. 그 때 이후 6시간 가량 페이스북은 사실상 인터넷 세상에서 사라진 존재가 됐다.
사태 초기 페이스북의 첫 논평은 평범했다.
“일부 이용자들이 우리 앱과 제품들에 접속하는 데 문제를 겪고 있다는 사실을 알고 있다. 최대한 빨리 정상화하기 위해 노력하고 있다. 불편을 끼쳐 죄송하다.”
하지만 내부 상황은 더 심각했다. 프로토콜에 따르면 페이스북 직원들은 사무실에 들어가는 것도, 이메일에 접속하는 것도 불가능했다. 결국 페이스북 직원들은 줌 같은 다른 플랫폼을 활용해 회의를 해야만 했다.
페이스북의 시련은 트위터 같은 경쟁 서비스에겐 축복이나 다름 없었다. 이날 서비스 장애 기간 동안 트위터의 트래픽은 폭발적으로 늘어났다. 페이스북, 인스타그램, 왓츠앱 옆에 트위터가 우뚝 서 있는 모습을 담은 ‘오징어 게임’ 패러디 사진이 인기를 끈 것은 이 때문이었다.
사태가 생각보다 심각하게 진행되자 페이스북에선 좀 더 고위층이 사과 메시지를 올렸다.
마이크 슈뢰퍼 최고기술책임자(CTO)는 이날 오후 “페이스북 서비스 장애로 타격을 받은 모든 분들에게 진심으로 사죄드린다”는 글을 트위터에 올렸다. 페이스북이 서비스 장애 사과 메시지를 트위터에 올리는 ‘굴욕'을 겪은 셈이다.
그는 또 “우리는 지금 네트워크 장애를 경험하고 있다. 최대한 빨리 복구하기 위해 여러 팀들이 작업하고 있다"고 설명했다.
외부 공격 가능성 낮아…BGP 피어링 장애 유력
워낙 대형 장애였던 만큼 사고 원인에 대한 궁금증도 커지고 있다. 이에 대해 프로토콜은 이번 서비스 장애는 외부 공격 때문은 아니라고 전했다. 단일 공격만으론 페이스북 뿐 아니라 인스타그램, 왓츠앱을 동시에 먹통으로 만들 수는 없다는 것이다.
따라서 이번 사고는 서비스 유지 보수 과정에서 생긴 결함일 가능성이 많은 것으로 관측되고 있다.
레딧에는 한 때 “이번 사고는 BGP 피어링 때문에 발생했다”는 글이 올라오기도 했다. BGP란 네트워크 도메인인 AS(자치 시스템) 간 라우팅 정보를 전달하는 데 사용되는 대규모 라우팅 프로토콜이다.
하지만 이 글은 현재는 삭제됐다고 프로토콜이 전했다.
매튜 프린스 클라우드페어 최고경영자(CEO)도 BGP 쪽 장애 가능성에 무게를 실었다.
그는 “정비 작업 도중 발생한 실수로 페이스북의 인터넷 라우터(BGP)가 거부됐을 가능성이 많다”는 글을 트위터에 올렸다.
클라우드플레어는 이날 페이스북 먹통 사고 직전 BGP 업데이트가 있었던 정황이 포착됐다는 내용의 글을 블로그에 올리기도 했다.
페이스북 먹통 사고는 이날 오후 5시 경부터 조금씩 정상화되기 시작했다. 6시 무렵에는 앱도 정상 작동했다.
관련기사
- 페이스북·인스타그램·왓츠앱 모두 멈췄다2021.10.05
- 페이스북 먹통 사태…'오징어 게임' 패러디 빛났다2021.10.05
- 페이스북 먹통…'도메인 매각' 해프닝도 있었다2021.10.05
- 페북·인스타·왓츠앱 6시간 만에 복구2021.10.05
마크 저커버그 CEO는 서비스 정상화 직후 페이스북 페이지에 공지문을 올렸다.
그는 “페이스북, 인스타드램, 왓츠앱과 메신저가 방금 정상화됐다”면서 “여러분들이 좋아하는 사람들과 연결하기 위해 우리 서비스에 얼마나 많이 의존하는지 알게 됐다”는 글을 올렸다.