MS, 왜 윈도서버용 하둡 포기했나

윈도애저용 서비스로 방향 틀어

일반입력 :2013/10/31 16:54    수정: 2013/11/01 08:35

마이크로소프트(MS)가 윈도 서버용 하둡 패키지를 상용화하지 않기로 했다고 최근 발표했다. 지난해 베타판을 내놓은 뒤 1년 만에 입장을 바꾼 것이다. 대신 MS는 퍼블릭 클라우드 서비스인 윈도 애저용 하둡 서비스로 방향을 틀었다.

지난 28일 MS는 윈도 애저 기반 하둡 배포판인 '윈도애저 HD인사이트' 서비스를 시작했다. 동시에 윈도서버용 HD인사이트 개발은 보류한다고 발표했다. 협력사인 호튼웍스도 윈도애저 HD인사이트와 함께 윈도용 호튼웍스데이터플랫폼(HDP)을 제공한다고 설명했다.

MS와 호튼웍스는 지난해 10월 윈도용 하둡인 윈도서버 HD인사이트 베타판을 공개했다. 직접 구축하든 퍼블릭 클라우드를 사용하든 MS 이름으로 개발된 하둡 배포판이 나왔던 것이다.

MS가 윈도서버용 하둡을 내놓지 않기로 한건 기술과 사업적 요인이 모두 작용한 것으로 보인다.

기술적 측면에서 보면 윈도서버용 HD인사이트를 개발하기가 어려워서일 수 있다. 국내의 한 하둡 전문가는 “윈도서버용 하둡의 경우 특수한 코드를 사용하므로, 지속적인 기술지원이 MS나 호튼웍스에게 부담이 된다”고 말했다. 반면 애저용 하둡은 자바로 돼 있어 기술지원이 수월하다고 판단했을 것 같다는 설명이다.

일반적으로 사용되는 아파치 하둡의 경우 자바나 C++ 언어에 기반한다. 운영체제(OS)는 리눅스가 널리 사용된다. 반면, 윈도서버는 MS NT코어라는 커널을 사용하기 때문에 별도 개발환경이 필요하다.

지난해 윈도서버용 HD인사이트 베타판이 공개됐을 때 개발주체는 MS로 알려졌다. 호튼웍스는 MS가 개발한 결과물을 기반으로 윈도용 HDP를 제공하는 형태였다. 지난 2월 윈도용 HDP를 공개하던 당시 헤레인 오베로이 MS 제품마케팅 이사는 양사가 협력을 알릴 땐 호튼웍스가 HDP를 내놓기 전이었다며 윈도용 HDP가 MS에서 만든 윈도서버용 HD인사이트와 다른 점은 통합수준과 사용자 지원주체라고 설명했다.

호튼웍스에 따르면 윈도용 HDP는 MS HD인사이트 기술의 기반을 이룬다. MS HD인사이트 플랫폼은 여러 MS 제품 및 서비스와 긴밀한 통합을 전제한다. 그런만큼, MS가 플랫폼을 책임진다. MS로선 윈도서버용 HD인사이트 개발에 지속적인 역량을 투입해야 하는 입장이다.

MS가 클라우드 기반 하둡에 집중하기로 한 것은 기술보다는 사업적 요인이 보다 큰 영향을 미쳤을 것이란 해석도 있다. 윈도서버 환경에서 대규모 하둡 클러스터를 운영할 만한 고객층이 아직 많지 않기 때문이다.

전세계적으로 하둡은 빅데이터 분석을 위한 표준 플랫폼으로 사용된다. 하지만 하둡의 주요 사용자는 인터넷 서비스회사나 IT조직에 속한 개발자다. 대기업군이나 데이터 분석가 조직의 경우 여전히 하둡보다 종전의 관계형데이터베이스(RDB)에 기반한 데이터웨어하우스(DW)와 비즈니스인텔리전스(BI) 및 통계분석도구를 선호한다.

하둡 시장이 제한된 영역에 갇혀 있고, 대규모 매출을 일으켜줄 일반 기업체의 지갑은 열리지 않은 것이다.

그렇다면, 많은 역량을 투입해야 하는 윈도서버용 HD인사이트가 갖는 사업적 매력은 떨어진다. 차라리 호튼웍스가 주도적인 역할을 하도록 윈도용 HDP만 유지하는 게 합리적 판단이다.

그에 비해 윈도애저용 HD인사이트는 현재 하둡 시장과 겹친다. 퍼블릭 클라우드는 중소기업이나 인터넷서비스 스타트업이 주요 고객층을 이룬다. 이들은 단기간에 인프라를 구축하는 것과 별개로, 인프라 관리인력을 줄이기 위해 퍼블릭 클라우드를 사용한다.

비용 측면에서도 애저용 HD인사이트가 합리적이다. 윈도서버를 사용하는 하둡 인프라라면, 서버 OS 라이선스를 고려해야 한다. 하둡 사용자들은 대부분 빅데이터 분석 투자대비효율(ROI)을 높이기 위해 리눅스 플랫폼도 레드햇엔터프라이즈(RHEL)보다 센트OS나 수세리눅스를 주로 사용한다. 윈도서버를 대량으로 이용하면 저렴한 비용으로 많은 데이터를 빠르게 분석한다는 하둡의 장점이 사라진다.

서비스수준협약(SLA)를 높은 수준으로 높이게 될 경우 필요한 연간 SW 라이선스와 서브스크립션 비용, 하드웨어 비용을 합산해보자. 통상적으로 최소 규모인 10노드 기준으로 SW비용 6만~7만달러(7천만~8천만원), x86서버 1억원, 네트워크 장비와 하드디스크, 운영을 위한 아웃소싱업체와 계약비용까지 더하면 구축 비용이 약 3억~4억원이 든다. 애초부터 MS 윈도서버 기반의 하둡 클러스터는 ROI 측면에서 검토될 가능성이 낮을 수 있다는 얘기다.

애저용 HD인사이트의 경우 네임노드 인스턴스에 월 28만5천600원이며, 데이터노드당 월 12만2천800원이다. 10노드로 구성한다고 볼 때 151만원 가량을 지불해야 한다. 스토리지와 네트워크 비용은 별도로 청구된다. 단기간 데이터 분석을 해야할 경우나, 소규모로 분석하려 할 경우 윈도서버용 HD인사이트보다 저렴하다.

관련기사

그러나 윈도애저용 HD인사이트는 나름 강점을 갖는다. HD인사이트는 MS 자체 비즈니스인텔리전스(BI)과 아파치 하둡의 모든 구성 요소 간 호환을 보장한다. 여기에 MS 엑셀, SQL서버, 파워BI 등을 HD인사이트로 연결할 수 있다.

또 다른 업계 전문가는 일반인에게 익숙한 엑셀이 하둡용 분석도구로 탈바꿈하는 것이다라며 인프라를 넘어 실제 데이터 과학자의 분석 단계로 프로젝트가 이행될 때 강점을 발휘할 수 있다고 설명했다.