카카오 "먹통 사태원인 이중화 미흡…다중화·인프라 투자" 약속

'이프카카오'서 가용 인력 등 원인 지적..."시스템 삼중화·데이터센터 방재 시설 강화"

인터넷입력 :2022/12/07 18:17    수정: 2022/12/07 18:20

“끝까지 완성되지 않은 다리는 건널 수 없다. 우리의 이중화도 완성되지 않은 다리와 같았다. 부족한 이중화는 이중화 역할을 다하지 못했고, 결국 장애를 막지 못했다.” (남궁훈 카카오 비상대책위원회 재발방지대책 공동 소위원장)

카카오는 7일 온라인으로 열린 연례콘퍼런스 ‘이프 카카오’에서 지난 10월15일 먹통 사태 핵심 원인으로 이중화 조치 미흡, 인력 등 가용 자원 부족을 꼽으며 향후 삼중화 이상 조치와 함께 5년 내 3배 이상 인프라 투자 구축을 약속했다. 남궁 소위원장은 “인프라적으로 부족했던 모든 부분을 개선하기 위해 과거 원인을 분석하며 재발방지 대책을 세울 것”이라며 “미래에 대해 아낌없이 투자할 것”이라고 말했다.

이확영 원인조사 소위원장은 “센터 전체에 문제가 발생하더라도, 다른 곳에 모두 이중화됐다면 빠른 복구가 가능했을 것”이라며 일부 시스템이 SK C&C 센터 내에서만 이중화돼 정상화가 늦어졌다고 설명했다. 또 그는 이 위원장은 “가용 인력이 부족해, 센터 전원이 들어왔음에도 시스템을 정상화하기까지 시간이 걸렸다”고도 했다.

(사진=지디넷코리아)

"시스템 이중화 넘어선 삼중화 이상 개선...인프라 투자 비용은 3배 늘린다"

지난 10월 19일 카카오톡 먹통사태 대국민 사과 기자간담회에서 발언 중인 홍은택 카카오 각자대표

카카오는 이번 먹통 사태를 교훈삼아 시스템 다중화, 인력, 자원 등 인프라 확충, 방재 시설 강화에 힘줄 방침이다.

이채영 재발방지대책 소위원회 부위원장은 “데이터센터 등 전체 시스템을 다중화해 재발 방지는 물론 비슷한 장애 발생 시 기존보다 더 빠른 모니터링과 복구가 가능하도록 박차를 가하겠다”며 “앞으로 데이터센터 전체에 장애가 발생하더라도 모니터링과 장애 탐지가 원활하도록 시스템을 이중화에서 다중화 시스템으로 바꾸겠다”고 약속했다.

고우찬 비상대책위원회 재발방지대책 공동 소위원장은 엔지니어링 인력 확보를 공언하며 “ IT 엔지니어링 전담 조직을 확대 편성하는 방안을 검토 중이다. 국내 최고 IT 엔지니어링 전문가들을 추가로 적극 영입하겠다”고 말했다. 대규모 장애에 대비한 ‘재해복구위원회’와 '서비스 연속성 확보 전담 조직' 등 새로운 조직도 신설할 예정이다.

고 위원장은 이어 “삼중화 플러스 알파 구조로 개선하고자 한다. 데이터센터 삼중화는 구조상 3개 데이터센터 중 하나가 무력화되는 상황에서도 이중화가 담보되는 안정성이 있다”며 “주요 서비스는 멀티 클라우드를 활용해 서비스 연속성을 더욱 강화하도록 하겠다”고 밝혔다.

카카오 안산 카카오데이터센터 투시도

또 인프라 확충 비용 관련해서는 향후 5년간 지난 5년간 투자 금액의 3배 이상 규모로 투자를 확대하겠다고 덧붙였다.

관련기사

카카오가 4천600억원을 들여 내후년 완공 예정인 안산 데이터센터는 이중화 인프라 구축이 전력, 냉방, 통신에 각각 적용되며, 무정전전원장치(UPS), 배터리실이 격벽으로 분리시공돼 화재 시에도 서로 영향을 미치지 않도록 했다. 

또 밀폐된 공간에 소화 가스가 들어가지 못하도록 밀폐된 전기 판넬별로 개별 소화장치를 설치했다. 아울러 소화 가스 비치, 다른 층 소화가스를 끌어 쓸 수 있는 예비 시스템 구축, 냉각수 채워 방염, 방열 등 삼중 방식을 단계별로 적용할 방침이다.