윈도 애저와 서버 운영체제(OS)가 오픈소스 분산처리기술 '하둡'을 지원하게 된다. 이를 위해 마이크로소프트(MS)가 야후 하둡 개발자 그룹에서 갈라져 독립한 '호튼웍스'와 손을 잡았다. 자사 기술을 갖고 있으면서 오픈소스 커뮤니티에게 손을 내민 모양새라 눈길을 끈다.
이를 보도한 미국 지디넷 등 외신들은 지난주 MS가 빅데이터와 비정형데이터 환경에 더 잘 대응키 위한 행보라고 풀이했다. MS가 이만큼 오픈소스 기술에 적극적인 사례가 있었나 싶게 비칠만큼, 하둡이 분산처리기술 영역에서 대세로 자리잡았음을 방증한다는 평가도 나왔다.
MS와 호튼웍스는 연내 선보일 윈도 애저용 하둡 기반 서비스를 '커뮤니티 테크놀로지 프리뷰(CTP)' 테스트 버전으로 내놓기 위해 준비중이다. 윈도 서버용 하둡 기반 배포판 역시 내년께 CTP로 선보일 것이라 예고했다.
이 제품들은 엑셀, 파워피봇, 파워뷰 등 MS의 비즈니스 인텔리전스(BI) 도구와 함께 돌아갈 것으로 예상된다. 이 BI 도구들은 코드명 크레센트(Crescent)라는 이름으로 SQL 서버 2012 버전에 들어갈 데이터 분석 기술의 일부다.
■윈도 서버-애저-DB, 하둡 지원 가속
MS는 지난 12일(현지시간) 열린 기술 세미나 'SQL 패스 서밋'에서 이같이 밝히고 더불어 코드명 데날리(Denali)로 불려온 'SQL 서버 2012' 버전이 내년 출시를 앞둔 첫번째 신제품이라고 언급했다.
이는 올초 사티아 나델라 MS 서버 툴 비즈니스(STB) 총괄 사장이 데날리는 내년 출시될 제품군의 초기 파트라 예고한 대로다. 데날리는 현재 CTP 3버전 단계로 곧 정식판(RTM)이나 최종 안정화(GA) 버전이 된다. 베타판 일정은 없다.
MS 전문 블로거 마리 조 폴리는 스스로 하둡 구현체를 만들고 있는 MS가 공식적으로 '사용자들에게 빅데이터와 비정형 데이터 스토리지 액세스를 위한 선택권을 제공하려 한다'고 밝혔다고 지적했다.
이어 MS는 코어 하둡 플랫폼에 영향을 미칠 수 있는 오픈소스 커뮤니티에 기여함으로써 아파치와의 코드 호환성을 갖추려 할 것이라며 아직 MS는 하둡 기술을 지원하는 윈도 서버와 애저 최종판이 언제 나올 것인지 확실히 밝히지 않고 있다고 덧붙였다.
회사는 올초 MS SQL서버와 패러랠 데이터 웨어하우스(PDW) 제품을 위한 하둡 커넥터도 만드는 것으로 알려졌다. 지난주 최종 버전이 공개돼 사용자들이 내려받아 쓸 수 있게 됐다. 이는 MS 데이터베이스 플랫폼과 하둡을 통합해 줄 수 있는 기술이다.
■하둡 향한 MS의 '전폭적' 지원
더그 르랜드 MS 비즈니스 플랫폼 마케팅 그룹의 제품관리 총괄 매니저는 MS는 자바 기반 하둡과 맵리듀스에 대해 여러 대안을 찾아왔으며 이런 노력에도 '조용히 전념'하고 있다고 말했다.
MS가 닷넷 개발자들을 겨냥해 내놓은 하둡 경쟁 기술 '드라이어드(Dryad)'가 그 예다.
드라이어드는 MS 연구소에서 '링크투HPC'라는 공식명칭으로 불리는 상태다. 지난해말 CTP 상태로 첫선을 보인 뒤 지난 7월 베타2 버전으로 나왔다. 향후 윈도HPC서버 2008 R2 서비스팩(SP)2에 탑재될 예정이다. 윈도HPC서버는 슈퍼컴퓨터 환경을 구축하는 운영체제(OS)다.
또 윈도 애저에서 맵리듀스 런타임을 돌릴 수 있게 해주는 클라우드 분석 소프트웨어(SW) '데이토나(Daytona)'도 있다. 데이토나는 분산 환경을 이용한 분석 컴퓨팅 작업과 이 규모를 확장하는 학습 알고리즘을 제공한다. 윈도 애저용 컴퓨팅, 스토리지 서비스 구축에 쓰일 수 있다.
한편 회사는 행사를 통해 코드명 '데이터 익스플로러'라는 신기술도 선보였다.
데이터 익스플로러는 윈도 애저 마켓플레이스에 투입돼 개발자들이 더 많은 데이터세트를 생성하고 이를 유료나 무료로 유통시킬 수 있도록 쓰일 전망이다. 데이터 익스플로러 CTP 버전은 연말 SQL애저랩 공식사이트를 통해 공개될 예정이다.
관련기사
- 오라클 DB, 빅데이터 승부수 띄운다2011.10.17
- EMC, RDB+하둡 빅데이터 분석 플랫폼2011.10.17
- 윈도 애저 클라우드 분석SW '데이토나' 등장2011.10.17
- MS, 클라우드 역전 시나리오 대공개2011.10.17
또 사용자들이 하둡파일시스템(HDFS), 하이브(Hive), 피그(Pig) 등 하둡 관련 기술을 간단히 내려받아 설치하고 설정해 쓸 수 있도록 지원할 방침이다. 이는 기업 부문에서 하둡 기술이 확산되도록 도울 것으로 보인다.
MS는 공식 블로그를 통해 빅데이터를 다루기 위한 1순위 클래스 언어로 자바스크립트를 활용할 것이라고 밝혔다. 고성능 맵리듀스 작업을 돌릴 수 있는 명령어를 자바스크립트로 작성할 수 있게 만든다는 얘기다.