VM웨어, 자바 생태계에 '하둡' 투입

일반입력 :2012/03/02 09:52

VM웨어가 분산처리기술 하둡과 자바 프레임워크 스프링을 통합하는 '스프링하둡' 프로젝트를 선보였다. 자바 개발자들이 다루기 편한 프레임워크로 하둡기반 애플리케이션을 만들수 있도록 한다는 취지다. 가상화 사업자가 빅데이터 시장에 성장동력을 얻으려는 움직임으로 주목된다.

VM웨어는 최근 미국 산타클라라서 열린 IT행사 '오라일리 스트라타 컨퍼런스'를 통해 이같이 밝혔다. 이를 보도한 일부 영미권 외신들은 VM웨어가 자바 개발자들에게 빅데이터 애플리케이션용 스프링하둡이라는 무기를 쥐어줬다고 보도했다.

즉 스프링하둡을 쓰는 개발자들은 스프링 애플리케이션 개발 프레임워크를 분산 데이터 처리기술 '하둡 맵리듀스'같은 현대적 애플리케이션에 활용할 수 있다는 얘기다.

빅데이터 환경에 대응하는 분석 애플리케이션을 원하는 담당 부서들의 바람을 간단히 말하면 하둡 분산 파일시스템(HDFS)에 고급 데이터 분석언어 피그(Pig)와 데이터웨어하우스(DW) '하이브(Hive)'와 SQL 비슷한 쿼리언어를 쉽게 얹어 쓰는 것이다.

스프링하둡에 포함된 '스프링 데이터' 프로젝트가 이런 요구에 알맞은 기술을 지원하는 사례다. 프로젝트 설명에 따르면 스프링 데이터는 기존 관계형데이터베이스 기술뿐아니라 비관계형데이터베이스, 맵리듀스프레임워크, 클라우드기반 데이터서비스 등 새로운 데이터 접근 기술을 다루는 스프링 기반 애플리케이션을 만들기 쉽게 돕는다. 지원하거나 예정된 기술을 보면 JPA와 JDBC 등 관계형데이터베이스(RDBMS), 젬파이어같은 데이터그리드, 레디스(Redis)와 리아크(Riak)같은 키값저장방식, 몽고DB나 카우치DB같은 NoSQL기반 문서저장기술, 하둡같은 맵리듀스 툴을 아우른다.

클라우드 강자 VM웨어가 빅데이터 대응 기술로 이름을 알린 하둡을 품으려는 속내는 추가적인 성장 동력을 갖추려는 시도로 읽힌다. 서버 가상화 기술을 통해 퍼블릭, 프라이빗 클라우드 업계 선두주자로 나서고 있지만 지속 성장을 위해 빅데이터 대응 기술이라는 신규 시장에 눈을 돌린 것이다.

관련기사

VM웨어는 스트라타 컨퍼런스에서 이를 소개한 뒤 공식 블로그를 통해 스프링하둡 1.0.0.M1 버전을 내려받을 수 있게 공개했다. 아파치 하둡, 스프링 프레임워크와 마찬가지로 아파치 2.0 라이선스에 기반한다. 이를 사용하려면 시스템에 스프링 프레임워크 3.1 버전에 권장 환경인 자바개발키트(JDK) 6.0 버전이 구축돼 있어야 한다. 아파치 하둡 0.20.2 버전도 쓸 수 있지만 VM웨어 레퍼런스 매뉴얼에 따르면 1.0.0 릴리즈를 쓰라고 돼 있다.

VM웨어 스프링소스 사업부 소속 엔지니어 코스틴 리우는 스프링하둡은 스프링 프레임워크의 철학을 이어받아 단순화된 프로그래밍 모델을 제공하며 인프라에 의해 뜻하지않게 생기는 복잡성을 다룰 수 있게 해준다며 HDFS, 피그, 하이브 등을 오가는 복잡한 워크플로우를 조율하거나 기업내 여러 데이터 저장공간을 넘나드는 평범한 맵리듀스 애플리케이션도 대응된다고 설명했다.