[칼럼]지금 기업은 'IT 관리 인프라'가 절실하다

백승주입력 :2011/08/24 11:29

백승주
백승주

얼마 전 5년여 동안 개인적으로 각종 발표 시 데모용으로 사용하던 서버의 하드디스크에 문제가 발생해 교체를 한 적이 있다. IT 엔지니어라면 느끼겠지만 업무용 서버의 하드웨어에 문제가 발생했을 경우, 이를 통해 업무를 지속하는 조직내 구성원들에게 얼마나 큰 영향을 줄지 생각만 해도 끔찍하다.

해당 부품을 교체한 후 운영체제(OS)를 다시 가동해 오류 원인을 확인하던 중 재미있는 사실을 발견했다. 바로 해당 하드웨어의 오류가 발생하기 전, OS에서 관련 사항에 대해 계속적인 경고나 오류 메시지를 보내주고 있었다는 것이다. 해당 메시지가 5-6일정도 지속된 이후에 실제 하드웨어의 오류로 이어졌으니, 미리 파악만 했더라면 데이터 손실을 사전에 막을 수 있지 않았을까라는 아쉬움도 남았다. 또한 내가 계속 현업 엔지니어를 하고 있었다면 이를 적시에 파악했을까 라는 생각도 해보았다.

IT 엔지니어의 삶을 살아왔던 혹은 살고 계신 분이라면, 언제나 장애와의 싸움을 하고 있다고 해도 과언이 아닐 정도로 대한민국 IT 엔지니어는 장애 복구에 상당한 시간을 쏟고 있다. 이러한 장애는 생각지도 못한 순간에 다가온다. 주말이나 연휴, 아니면 휴가와 같이 장시간 그리고 가까운 거리에서 지원을 할 수 없는 경우에 발생하는 경우가 많다. 이럴 때마다 ‘내가 IT 엔지니어를 하고 있는 것이 과연 잘하는 것일까?’라고 되물었던 경험이 한번쯤은 있지 않나?

하드웨어 장애라는 최악의 순간뿐만 아니라 우리가 일상적으로 경험하고 있는 다양한 장애들은, 체계적으로 관리되고 있는 형태가 아니라면, 대부분 조직 내 구성원이나 서비스를 이용하고 있는 고객이 먼저 인지한다. 장애 인지 이후 이에 대해 고객센터나 IT팀에 연락을 취해 어떠한 문제가 생겼으니 이에 대해 조치를 취해달라고 요청한다. 이후 IT팀은 문제확인 및 분석작업에 들어간다. 이렇게 소모된 시간은 고스란히 장애 시간의 누적으로 이어지게 되고 고객 및 구성원의 불만, 비즈니스 지속 불가라는 결과로 바뀌어 IT팀으로 돌아온다.

IT 관리에 관련된 서적이나 레퍼런스를 살펴보면, 늘 첫째로 언급되는 것이 바로 인프라에 대한 ‘관리 인프라’이다. 우리는 이를 모니터링 인프라라고 부르는데 현재 운영 중인 인프라가 정상적으로 동작하고 있으며, 문제가 발생할 소지가 있는지, 만약 문제가 발생했다면 어디서 발생했는지, 그리고 어떻게 해결해야 하는지에 대한 부분까지 확인할 수 있는 시스템을 말한다. 물론 보고서 형태로 주기적인 이용 트렌드나 형태를 확인해 차후 시스템에 대한 업그레이드 검토 혹은 과부하 예측 등에 활용할 수 있는 부분까지도 제공한다.

■‘관리 인프라’는 모두의 이익을 위한 것

규모가 아주 큰 조직이나 고객에게 비즈니스에 밀접한 서비스를 제공하는 IT팀이 아니라면, 별도의 관리 인프라에 대한 투자를 많이 하지 않는 것이 대한민국의 IT 인프라의 실정이라고 본다. IT팀 엔지니어가 장애를 처리하러 다니는 것이 그들을 위한 월급 지불의 이유라고 생각하는 조직내 수장의 이야기를 들은 적도 있고, 관리 인프라를 도입하면 IT팀의 존재 이유가 무엇이냐고 되묻는 경우도 있었다. IT팀 역시 관리 인프라가 본인의 회사 생활에 영향을 줄지 모른다고 걱정하는 사람도 있다.

관리 인프라는 단순히 IT 팀의 업무를 편리하게 하는 역할이 아니다. IT팀에서 책임지고 있는 인프라에 장애가 발생했을 때를 다시 한번 생각해보면, 이미 비즈니스의 영속성은 깨진 상태이고 조직내 다수의 구성원이 언제 복구되냐고 IT 엔지니어를 닥달하는 시국일 것이다. 이럴 때 과연 가장 손해를 보는 팀이 IT팀일까? 아니다. IT의 장애로 인해 비즈니스 전체가 마비됐고 이 손해는 조직 전체에게 미치게 된다.

인프라의 규모가 커져갈수록 IT 엔지니어 1인이 관리할 수 있는 인프라내 숫자도 늘어가게 된다. 이렇게 커지고 있는 인프라를 일일이 확인하는 것은 거의 불가능에 가깝다. 그리고 규모가 커질 수록 실수로 빠뜨리거나 파악하지 못한 문제가 잔존할 확률도 높아진다. 약간의 비용 투자를 통한 중앙 관리 인프라를 구축, 그리고 이 관리 인프라에 이용하여 모니터링을 주기적으로 이끌어간다면 장애 발생전 징후 혹은 장애 발생과 동시에 이에 대한 원인을 파악하고 처리할 수 있는 지름길을 만들어 놓는 것과 동일하다.

■조직의 모든 인프라를 통찰하라

또한 관리 인프라를 결정할 때는 단순히 한 분야의 인프라를 확인할 수 있는 형태가 아니라 조직내 인프라를 전체적으로 바라볼 수 있는 형태가 필요하다. 가상화 인프라의 경우, 관리 인프라를 고민할 때 단순히 가상화만을 바라보고 접근하는 경우가 많다. 그러나 조직내 인프라는 아무리 가상화 기술, 나아가 클라우드 기술이 발전하더라도 적정 숫자의 물리적인 서버가 남아있을 것이다. 이런 형태에서 가상화 환경만 관리하는 관리 인프라와 전체적인 환경을 관리할 수 있는 관리 인프라 중 어느 곳에 투자를 할 것인지 물어본다면, 어느 쪽을 답하겠는가?

IT팀은 단순하게 업무를 지원하는 팀이 아니다. 점차적으로 비즈니스와 매우 밀접한 관계를 가져가고 있으며 하루라도 IT 환경 없이 업무를 지속할 수 없는 조직이 거의 대부분이다. 이러한 형태라면 조직내 IT의 레벨이 전체적인 비즈니스 레벨을 좌우한다고 봐도 무방하다.

관련기사

IT팀에게 반복적으로 발생하는, 그리고 시간이 오래 걸리는 형태의 장애 처리 업무의 부담을 줄여주고, 이들이 조직내에 IT 기술을 통해 더욱더 생산적인 비즈니스를 이어갈 수 있는, 그리고 요새 많이 회자가 되고 있는 보안과 같은 추가적인 가치에 지식 습득 및 기술 구현을 투자할 수 있게 한다면, 조직은 IT 가치와 함께 생산성 및 비용 절감, 나아가 더 나은 비즈니스 결과를 얻을 수 있다.

매번 강조하는 이야기지만, IT의 유지 보수 및 지속적인 모니터링은 선택 사항이 아니라 필수 사항이다. 하드웨어나 소프트웨어나 주기적인 유지 보수 및 체계적인 관리 없이 문제가 발생하지 않길 바라는 것은 어불성설이다. 마치 자동차를 30년동안 탈 결심을 하고서도 한번도 정기 점검을 받지 않는 것과 똑같지 않는가? 비즈니스의 핵심이 된 IT 인프라, 이 IT 인프라에 대한 체계적인 중앙 관리 인프라 그리고 프로세스가 절실한 시점이다.

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.

백승주 IT컬럼니스트

IT 칼럼니스트, Microsoft 기술 전도사(Evangelist), IT 트렌드 및 주요 키워드를 다루는 꼬알라의 하얀집(http://www.koalra.com)을 운영하고 있습니다.