아마존 'EC2' 불통…클라우드 신뢰성 타격

일반입력 :2011/04/22 14:56    수정: 2011/04/23 08:24

퍼블릭 클라우드 서비스의 상징인 아마존 'EC2'가 장애를 일으키며 신뢰성에 심각한 타격을 입었다. 퍼블릭 클라우드의 생명이 고객 신뢰성이란 점에 비춰볼 때 IT업계에 미칠 파장이 적지 않을 전망이다.

21일(현지시간) 주요외신에 따르면, 이날 새벽 아마존웹서비스(AWS)를 운영하는 미국 버지니아주 북부 데이터센터가 장애를 일으켜 징가, 포스퀘어, 쿼라 등 해외 인터넷 서비스가 중단됐다.

아마존 웹 서비스 헬스 대시보드에 따르면 현재까지 EC2, 아마존 클라우드와치, 아마존 엘라스틱 맵리듀스(AEM), 아마존 관계형 데이터베이스(DB), 아마존 클라우드포메이션, 엘라스틱 빈스토크 등의 운영이 원활하지 않다.

사고 원인에 대해 아마존측은 데이터 복제를 위한 미러링 과정에서 용량 부족으로 장애를 일으켰다고 발표했다. 대규모 데이터가 동시에 복제되면서 네트워크 회선용량을 초과한 것으로 풀이된다.

이번 사태로 아마존웹서비스는 신뢰성에 상당한 타격을 받게 됐다. 기업들이 IT자원 관리를 다른 회사에게 맡기는 것을 심각하게 고민하게 만들기 때문이다. 더구나 아마존은 퍼블릭 클라우드의 상징이다. 자칫 클라우드에 대한 전반적인 인식을 부정적으로 만들 수 있다.

국내 퍼블릭 클라우드 사업자들도 우려의 뜻을 나타냈다. 이제 막 시작단계인 한국 퍼블릭 클라우드가 주춤할 수도 있다는 고민이다.

윤동식 KT 클라우드추진본부 상무는 “클라우드 서비스의 SLA에 심각한 타격을 준 사건”이라며 “클라우드에 대한 경각심을 불러일으키고 악영향을 줄 수 가능성이 크다”고 전망했다.

김지윤 한국호스트웨이IDC 연구소장 역시 “결과가 매우 심각하다”라며 “업계에 부정적인 영향을 줄까 우려된다”고 말했다.

아마존 사태처럼 클라우드 사업자의 데이터센터가 장애를 일으키면 고객들은 어떤 대안도 마련할 수 없는 상황이다. 아마존이 해결할 때까지 마냥 손놓고 기다려야 할 뿐이다.

■국내 사업자들, 아마존 사태 '전화위복' 계기될 것

국내 사업자들은 아마존 사태를 계기로 퍼블릭 클라우드에서 발생할 수 있는 미비점을 보완할 수 있다고 강조했다.

윤동식 KT 상무는 2년전 벌어졌던 마이크로소프트(MS) 사이드킥의 데이터 유실 사태를 들었다. MS는 사이드킥을 통해 주소록과 일정표,사진 등의 데이터를 단말기 대신 자사 서버에 저장하도록 했는데, 동기화 과정에서 데이터가 유실됐던 사건이다. 클라우드 컴퓨팅 개념의 서비스였던 만큼 업계에 미친 악영향이 컸다.

윤 상무는 “당시엔 문제가 컸지만 MS가 윈도 애저 기반으로 클라우드 시스템을 이동한 후 유사한 사고가 없다”라며 “이번 사태를 계기로 클라우드의 신뢰도가 더 올라갈 수 있다”고 강조했다.

10G급 회선을 다량 보유한 KT는 네트워크를 다중화하고, 우회로를 강화해 네트워크와 관련된 장애에 대비할 계획이다. 윤동식 KT 상무는 “아마존 사건을 접하고 네트워크 쪽에 더 많은 신경을 쓰라고 지시했다”라며 “휴먼에러의 경우는 코넷망처럼 감수부서를 통한 커맨드 인증을 거치게 해 방지할 것”이라고 말했다.

호스트웨이IDC는 긴급복구와 고객사 리소스 백업을 강화할 계획이다. 김지윤 한국호스트웨이IDC 연구소장은 “플렉스클라우드는 HA기능을 기본적으로 제공한다”라며 “특정 서버에 장애가 발생할 경우 신속한 복구를 보장하고 고객사 백업을 더 강화할 필요가 있다”이라고 말했다.

아마존 클라우드의 장애가 처음은 아니다. 디렉토리 문제로 작은 문제가 빈번히 발생했던 것. 그러나 실제 장애가 길어지지 않았고, 피해업체들도 유명하지 않은 곳이었기 때문에 주목받지 못했던 것뿐이다.

이날 사태가 크게 부각된 것은 피해고객의 이름값이 컸던 영향도 있다. 징가와 포스퀘어는 국내에도 상당수 사용자를 보유한 서비스다. 전세계적인 서비스다보니 파급력이 컸던 것이다.

무엇보다 중견·중소기업들이 자체적으로 IT자원을 관리하는 것에서 발생할 수 있는 비전문성 역시 퍼블릭 클라우드의 강점을 흐리지 않는다.

관련기사

MS는 윈도 애저 클라우드를 발표할 당시 내놓은 백서를 통해 “클라우드 컴퓨팅은 전문가들이 총동원돼 관리되기 때문에 장애시 복구능력이 훨씬 뛰어나다”라며 “비IT기업들이 자체적인 인프라 관리에 집중하는 것보다 비용이나 전문성을 확보할 수 있다”고 밝힌 바 있다.

윤동식 상무도 “농협사태처럼 전산시스템을 기업이 직접 운영해도 장애시간은 더욱 장기화 된다”며 “직접 관리하는 위험부담에 대한 고민과 퍼블릭 클라우드의 가치를 잘 비교해 따져보길 바란다”고 말했다.