오픈소스 기반 빅데이터 처리기술로 알려진 하둡이 첫번째 정식 버전으로 나왔다. 기업들에게 값싸고 질좋은 오픈소스 클라우드 기술이 일련의 기능을 한층 성숙되고 안정화된 상태로 제공할 것으로 평가된다.
지난 4일 이를 보도한 미국 지디넷은 아파치소프트웨어재단(ASF)에서 진행되고 있는 하둡이 최근 10여년새 가장 업계 파급이 있는 오픈소스 프로젝트라고 묘사했다. 정식 릴리즈는 아파치 라이선스 2.0 기반이다.
구글이 제공한 아이디어로 야후가 구현해 오픈소스화한 하둡은 현재 주요 기업들의 클라우드 인프라에 적용됐고 상용화된 서비스에서 지원되는 기술로 자리잡았다. 아마존, 애플, 페이스북, 트위터, 마이크로소프트(MS), 넷플릭스, 링크드인이 관련 기술을 개발하고 자사 시스템에 적용해왔다. 국내 포털 네이버를 서비스하는 NHN도 하둡 기술을 응용해 사용중이다.
ASF는 하둡 1.0 버전에 케르베로스를 통해 강화된 인증, 웹HDFS, H베이스(HBase) 트랜잭션 로깅과 로컬 파일 접근시 성능 향상 등 빅데이터를 다루기 위한 클라우드 컴퓨팅 기술을 모두 담았다고 밝혔다.
관련기사
- 야후, 빅데이터 고수 CEO로 역전극 쓸까2012.01.06
- 구글, 연구용 하둡 클러스터 서비스 중단2012.01.06
- EMC, 통합 빅데이터 분석 플랫폼 출시2012.01.06
- MS 빅데이터, 하둡 '올인' 드라이어드 중단2012.01.06
재단측에 따르면 하둡 플랫폼은 연결지점 수천개와 엑사바이트 단위 데이터를 다루는 '데이터 집약적 분산형 애플리케이션'을 구현할 수 있다. 이를 적용시 조직이 매일 만들어내고 수집하는 막대한 데이터를 더 효율적으로 관리, 저장, 분석, 처리할 수 있다. 동시에 수천대 서버를 연결해 분석, 처리할 데이터를 슈퍼컴퓨터급 속도로 다룰 수 있다는 설명이다.
미국 컨설팅업체 레드몽크의 공동설립자 제임스 가버너 애널리스트는 웹에서 태어난 하둡이 새해 정식 공개되면서 엔터프라이즈 기술로 변신했다며 데이터 제공자와 기술 사용자들에게 비용 효율적인 오픈소스 클라우드 컴퓨팅 플랫폼을 조직내 인프라에 적용시킬 수 있게 해줄 것이라고 평했다.