지난 8월 8일 월요일, 미국 델타항공의 컴퓨터 시스템이 다운되었다. 컴퓨터 다운의 여파로 2,100대가 넘는 비행기의 운항이 전면적으로 중단되었고, 비행기를 타지 못한 수만 명의 여행객이 공항에서 발을 굴렀다. 소식을 접한 사람들은 델타항공의 홈페이지에 접속해서 스케줄을 확인했다. 모든 것이 정상이라는 정보를 확인한 사람들은 안심하고 공항에 도착했지만 홈페이지 자체가 먹통이었다는 사실을 깨닫고 분통을 터뜨렸다.
컴퓨터 시스템은 몇 시간 뒤에 복구가 되었지만 엉망이 되어버린 비행기 스케줄이 정상으로 돌아오는데는 1주일이 넘게 걸렸다. 이 사태로 델타항공이 입은 금전적 손해는 1억 달러, 우리 돈으로 1,200억원에 달했다. 수만 명의 여행객들이 중요한 약속을 지키지 못해서 입은 개인적인 손해는 물론 포함되지 않았다.
사태의 원인은 8일 새벽에 발생한 정전사태로 알려졌다. 아틀란타에 있는 델타항공 본사에 있는 전기공급 시스템에 작은 화재가 발생했고, 이로 인해서 델타항공의 예약을 처리하는 중앙 컴퓨터 시스템이 동작을 멈췄다. 중앙 시스템이 동작을 멈추자 일반 여행객들이 공항에서 사용하는 체크인 시스템, 공항 TV 스크린에 스케줄을 보여주는 시스템, 회사 홈페이지, 스마트폰 앱을 포함한 모든 서비스가 일제히 동작을 멈췄다. 메인 전력시스템에 문제가 생기면 즉각적으로 동작을 개시하기로 되어있는 백업시스템마저 오동작을 일으켜서 문제가 걷잡을 수없이 확대되었다.
■ 델타항공, 1960년대 설계한 메인프레임 사용
델타항공의 사태를 지켜본 컴퓨터 전문가들은 의문을 제기했다. 본사의 컴퓨터에 문제가 생겼다고 해서 글로벌 기업의 컴퓨터 시스템 전체가 동작을 멈추는 일이 어떻게 가능한가? 클라우드, 머신러닝, 마이크로서비스 아키텍처 등이 논의되는 21세기에 어떻게 이런 1960년대 같은 일이 일어날 수 있는가? 분산컴퓨팅, 중복(redundant), 장애허용(fault tolerant), 고가용성(high availability)과 같은 개념은 요즘 기본 중에서도 기본이 아닌가?
이유는 간단하다. 대부분의 항공사가 사용하고 있는 시스템이 실제로 1960년대 설계된 메인프레임이기 때문이다. 미국 대형 항공사가 사용하는 예약시스템은 IBM이 1960년대에 제작한 트랜잭션 처리 장치(Transaction Processing Facility)라고 알려져 있다. 델타항공에서 사용하는 현대적 소프트웨어 시스템은 궁극적으로 TPF 시스템에 접속해서 정보를 얻을 때 한해서 동작을 수행할 수 있다. TPF 시스템이 동작을 멈추면 웹사이트, 앱, 체크인 시스템과 같은 현대적 시스템이 모두 동작을 멈춘다. 그들은 중앙집중적인 메인프레임 시스템에 붙어있는 잔가지에 불과하기 때문이다.
아마존을 비롯한 현대적 기업이 일부 시스템이 고장나도 쇼핑카트와 같은 핵심 기능이 계속 동작을 수행할 수 있도록 가용성을 극대화한 데이터베이스를 이용하는 것과 대조적이다. AWS와 같은 클라우드 시스템은 미국 동부 전체의 전력이 끊어져도 서부를 비롯한 수많은 다른 지역에 중복되어 있는 시스템을 통해서 중단없는 서비스를 제공할 수 있다. 하지만 메인프레임은 기본적으로 중복이라는 개념을 고려하지 않는다.
미국의 한 항공사에서 근무하는 게리 레프(Gray Leff) 같은 사람은 델타항공과 같은 사태가 더 자주 일어나지 않는게 기적이라고 말한다. 항공사 사이에서 일어난 수많은 합병을 통해서 레거시 시스템 위에 다른 레거시 시스템이 올라가고, 정상적인 투자가 일어나지 않아서 수십년 동안 개선되지 않은 낡은 코드가 동작을 하고 있기 때문이다. 시스템 전체의 모습을 처음부터 끝까지 온전히 파악하고 있는 사람이 없고, 문제가 생겼을 때 어떤 결과가 초래될지 이해하고 있는 사람도 없다.
미국의 항공사들이 이렇게 위험천만한 상황을 감내하는 이유는 두 가지다. 하나는 단기 이익에 대한 압박이다. 항공사의 경영진은 주주의 이익을 극대화하기 위해서 모든 부분에서 비용을 절감하려고 노력한다. 그들은 어떤 사태가 터졌을 때 수천만 달러의 비용을 감수하는 것이, 컴퓨터 인프라 업그레이드를 위해서 지금 1억 달러의 투자를 감행하는 것보다 낫다고 판단한다.
그들이 지독하게 낡은 컴퓨터 시스템을 업그레이드하지 않는 또 하나의 이유는 IT를 투자가 아니라 비용으로 인식하기 때문이다. 미국의 상업은행들은 평균적으로 매출의 8%를 IT에 투자한다고 한다. 이에 비해서 항공사들은 3%만 IT에 투자한다. 이런 차이에 대해 항공사의 경영진은 은행업무에서는 IT가 비즈니스의 핵심에 다가서는 측면이 있지만 항공산업에서는 IT가 비즈니스의 핵심과 거리가 멀기 때문이라고 변명한다. 정말 그럴까?
■ IT가 비용이란 인식이 혁신의 걸림돌
택시 비즈니스를 생각해보자. 택시업무에서 IT는 비즈니스의 핵심과 얼마나 거리가 있을까? 택시와 항공은 둘 다 교통수단이라는 공통점을 갖는다. 따라서 택시와 IT의 거리는 항공과 IT의 거리와 크게 다르지 않을 것이다. 이제 우버를 생각해보자. 우버에서 IT는 비즈니스의 핵심인가 곁가지인가? 무인자동차마저 등장하고 있는 시점에서 항공사들은 여전히 1960년대를 살고있다. 혁신하지 않는 것은 그들의 자유지만, 그로 인해서 고객들의 안전과 편의가 담보로 잡힌다면 그건 차원이 다른 문제다. 항공사의 혁신은 권리가 아니라 사회적 의무다.
미국 대형 항공사의 낡은 컴퓨터 시스템은 이미 수명이 다했다. 그럼에도 불구하고 대대적인 업그레이드가 일어날 조짐은 보이지 않는다. 델타항공 사태와 같은 일이 몇 차례 더 반복되어 그럴 때마다 지불해야 하는 비용이 감당할 수 없는 수준에 이를 때 그들은 비로소 IT 시스템 업그레이드를 위한 투자를 감행할 것이다. 자본주의 시스템이 작동하는 방식에 대한 불편한 진실이다.
관련기사
- 실리콘앨리의 반격2016.09.05
- 개발자, 이직의 자격2016.09.05
- 개발자의 의사소통 능력2016.09.05
- 대기업 개발자와 파우스트 박사2016.09.05
미국 델타항공의 이야기를 했지만, 하고 싶은 이야기는 우리나라의 기업들이다. 일부를 제외한 대부분의 회사들이 IT에 돈을 쓰는 것을 투자가 아니라 비용이라고 생각한다. IT 자체가 비즈니스의 핵심동력이라고 생각하지 않고 비즈니스를 돕는 곁가지나 도우미라고 여긴다. 싼값에 부려먹을수록 많이 남는다고 착각한다. 굴뚝 산업 시대의 사고방식이다. 뉴로맨서의 저자 윌리엄 깁슨은 이렇게 말했다. "The future is already here. It's just not very evenly distributed." 미래는 이미 여기에 와 있다. 다만 균등하게 분포되어 있지 않을 뿐이다.
모든 IT는 비용이 아니라 투자다. IT가 비용이라는 인식은 혁신을 가로막고, 투자라는 인식은 혁신을 촉진한다. 이와 같은 인식의 전환은 미래가 지금 여기에 있도록 만들기 위한 노력의 첫걸음이다. 지금 세상에서 일어나고 있는 모든 혁신의 뿌리를 더듬어보라. IT와 연관되지 않은 것이 있는가? 그대의 마음속에 있는 메인프레임의 전원을 당장 내리고, 오늘 혁신을 시작해야 하는 이유다.
*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.