[유미's 픽] 배터리 화재로 '카톡 먹통' 또 될라…데이터센터, '열폭주' 방지 안간힘

화재 위험성 높은 리튬이온 배터리, 데이터센터 적용 多…SK·네이버·카카오 등 대응 분주

컴퓨팅입력 :2024/09/20 14:52    수정: 2024/09/20 15:52

SK C&C 데이터센터 화재로 인한 '카카오톡 먹통' 사태가 발생한 지 어느덧 2년여가 된 가운데 원인이 된 리튬이온배터리를 활용하고 있는 업체들의 대응 방안에 관심이 쏟아지고 있다. 최근 리튬배터리로 인한 화재가 빈번하게 발생하면서 데이터센터의 안전성에 대한 우려도 높아지는 분위기다. 

20일 업계에 따르면 지난 2022년 10월 15일 발생 SK C&C 데이터센터 화재 원인은 비상 전원장치용 리튬이온 배터리 때문인 것으로 드러났다. 양극, 음극, 분리막, 전해액 등으로 구성되는 리튬이온 배터리는 분리막이 손상되면 양극과 음극이 접촉해 과열되면서 화재와 폭발이 일어난다. 또 불이 나면 다량의 불산가스를 발생시키기 때문에 진화 인력의 화재 현장, 특히 건물 내부 진입을 어렵게 만든다.

판교 데이터센터 역시 배터리에서 시작된 불이 주변 배터리 온도를 올려 '열폭주 현상'을 일으킨 탓에 화재를 진압하는 데만 8시간이 걸렸다. 이 일로 카카오는 최소 275억원의 피해를 입었다. 또 카카오톡뿐 아니라 데이터센터 화재로 서비스 이용에 제한을 받았던 카카오 T, 카카오게임즈 및 카카오엔터테인먼트의 콘텐츠 사용자 등에 대한 피해 보상도 지난해 6월 30일 완료했다.

SK C&C 데이터센터 화재현장 (사진=지디넷코리아 DB)

이 일은 카카오의 이중화 조치가 미흡한 상태에서 카카오 주요 서버들이 모여 있는 SK C&C 데이터센터 내 화재가 발생했다는 점에서 파급이 컸다. 배터리 온도 등을 모니터링하는 시스템(BMS)이 제대로 작동하지 않은 데다 전원 공급이 끊어지고 무정전전원장치(UPS)도 작동되지 않았던 것이 피해를 키운 것으로 파악됐다. SK C&C는 리튬이온 배터리를 일부 UPS와 물리적으로 완벽히 분리하지 않았다는 점에서 질타를 받았다.

이에 과기정통부 등 정부 부처는 SK C&C에 시정조치를 내렸다. 이후 SK C&C는 ▲리튬이온 배터리 중 일부 납축전지로 교체 ▲화재 감지 솔루션 확충 ▲방화벽 강화 ▲전력 케이블 재배치 등 화재 예방 조치에 나섰다. 또 화재확산 방지포, 할로겐 가스 등 자동 소화 설비도 구비했다.

SK C&C 관계자는 "납축전지는 리튬이온 배터리에 비해 효율은 떨어지지만 화재 위험성은 낮다"며 "화재가 발생한 판교 데이터센터 내부는 복구 작업 시 납축전지로 모두 교체했다"고 말했다.

이어 "대전 대덕 데이터센터도 리튬이온 배터리를 쓰고 있는데 화재 위험성이 상대적으로 낮은 리튬인산철 배터리로 교체하는 작업을 진행하고 있다"며 "효율은 조금 떨어지지만 화재 안전성을 높이기 위해 최선을 다하고 있다"고 덧붙였다.

화재 사고로 큰 피해를 입었던 카카오도 서비스 '안정성'을 강화하기 위해 지난해 9월 완공된 첫 자체 데이터센터에 24시간 무중단 운영이 가능하도록 전 시스템을 '이중화'시켰다. 또 사고에 따른 먹통 방지를 위해 대규모 서버를 차질 없이 운영할 수 있는 '무정전 전력망'도 갖췄다. 

더불어 화재 조기 진화를 위한 대응 시스템 마련에도 신경을 썼다. 특히 UPS실, 배터리실에는 방화 격벽으로 분리 시공하고 모든 전기 판넬에 온도 감지 센서를 설치해 이상 온도 상승 시 즉각 대응하게 설계했다. 

카카오 관계자는 "화재 진압이 매우 어려운 리튬 이온 배터리 화재에 대비해 화재대응시스템을 자체 개발 및 적용했다"며 "해당 시스템은 현재 특허 출원했다"고 말했다.

정신아 카카오 대표는 "왜 우리가 안전한 데이터센터를 지어야 했는지에 대해선 내부에서 '1015 사태'라고 부르는 SK 판교 데이터센터의 화재 사건이 뼈 아픈 이유가 됐다"며 "다시는 이러한 장애가 반복되지 않기 위해 철저하게 원인을 분석하고 이를 설계에 반영해 만든 결과물이 카카오 데이터센터 안산"이라고 강조했다.

카카오 데이터센터 안산 전산동 2층 배터리실 (사진=카카오)

SK C&C, 카카오 외에도 자체 데이터센터를 운영하는 기업들도 리튬이온 배터리 화재에 대비하고자 앞다퉈 다양한 방안 마련에 나섰다. 

삼성SDS는 서울 상암을 포함해 경기 수원, 동탄, 경북 구미, 강원 춘천 등 5곳에서 자체 데이터센터를 운영 중으로, 서버 이중화와 스토리지 백업 체계 구성을 기본 원칙으로 세워 화재 발생을 대비하고 있다. 이곳 역시 지난 2014년 경기 과천 데이터센터에 화재가 발생해 삼성 금융 계열사 등에게 엄청난 피해를 입힌 바 있다. 

삼성SDS 관계자는 "국내 데이터센터는 물론 해외 11개 데이터센터 간에도 전 센터와 예비 시스템 자원을 보유한 DR(재해복구) 센터를 글로벌 백업 체계로 운영 중"이라며 "데이터센터 내 배터리실을 격실 구조로 하고 전기실과 분리 운영 중이며 배터리 온도를 주기적으로 모니터링해 화재 예방에 만전을 기하고 있다"고 밝혔다.

서울 상암, 가산과 부산 등에서 데이터센터를 운영 중인 LG CNS는 인공지능(AI) CCTV와 배터리 모니터링, 공기흡입형 화재감지기 등 다중 감시방식을 갖춰 화재 대응에 나섰다. 또 화재뿐 아니라 홍수, 정전, 지진 등 종합 재해 대응 매뉴얼도 갖추고 있으며 관할 소방서와 정기 합동 훈련도 실시하고 있다.

토종 클라우드 업체들도 화재 대응에 만전을 기하고 있다. 네이버클라우드는 재해 발생 시 컨트롤타워 역할을 하는 BCP(Business Continuity Plan, 업무연속성계획) 전담조직을 구성한다는 방침을 세워 주목 받고 있다. 또 1년에 2회 진행하는 BCP 모의훈련을 비롯해 연 1회 민관합동훈련, 월 1~2회 진행하는 운영안정성 점검 훈련 등 지난 10년간 약 200회 이상의 모의 훈련도 진행했다.

더불어 네이버웍스의 AI 업무 비서인 '웍스봇(WORKS Bot)'을 통해 임직원 간 커뮤니케이션, 가용 자원 파악 및 신속한 복구 등이 가능하도록 체계를 갖췄다. 웍스봇은 인프라 설비운영 전체직원을 대상으로 온·습도, 열 감지, 서비스 장애 등에 대한 정보를 실시간으로 전달한다.

NHN클라우드 데이터센터 종합운영실 전경 (사진=NHN클라우드)

NHN클라우드는 광주, 판교 등에서 자체 데이터센터를 운영 중으로, 집적정보통신시설 보호 조치 이행에 준하는 화재진압설비를 갖추고 있다. 화재감지, 전산실 온습도, 냉동기 입출구 온도, 펌프 속도, 수배전실 전압·전력 등 데이터센터 내 모든 설비를 실시간 모니터링하며 화재 대비에 나선 상태다. 

구체적으로는 배터리 분리격실 운영, 주 1회 이상 비상대응훈련 실시 등을 실행 중이다. 또 장비나 전력선 등이 과부하, 접촉 불량으로 절연 물질이 녹거나 열화 될 때 발생하는 미세한 연기를 실화재 발생 전 단계에서 강제 포집하는 '베스다 감지기' 등도 설치해 관리 안전성을 높이고 있다. 

관련기사

최근 배터리 화재 사고가 빈번해지자 정부도 데이터센터 관리에 적극 나서고 있다. 과기정통부는 지난 2022년 SK C&C 판교 데이터센터 화재 사고 이후 이듬해인 7월부터 방송통신발전기본법, 정보통신망법 개정안을 시행하고 한 달 전인 6월에 집적정보통신시설 보호지침을 마련했다. 특히 배터리 온도를 10초 간격으로 확인하고 배터리실엔 급속배기장치와 CCTV 설치를 의무화했다. 또 리튬배터리를 활용하는 민간 데이터센터 89개 시설을 대상으로 안전 점검도 진행 중이다. 

업계 관계자는 "통상 리튬이온 배터리 화재는 '열 폭주' 현상에 의해 발생한다"며 "데이터센터 외에도 전기차, 전기자전거 등 사회 곳곳에 리튬이 사용되는 경우가 많아지고 있어 각별한 주의를 갖고 대응전략을 세워야 한다"고 조언했다.