하둡 생태계에서 많이 활용되는 데이터베이스(DB)인 HBASE 창시자인 마이클 스택이 한국을 찾았다. 아파치 HBASE 프로젝트 의장(PMC)으로 있는 마이클 스택은 2014년 HBASE 1.0 버전 공개를 약속했다.
14일 서울 삼성동 코엑스 인터콘티넨탈호텔에서 열린 SK플래닛 주최 ‘테크플래닛2013’ 기조연설에 나선 마이클 스택 의장은 “HBASE는 성능과 안정성을 높이고, 멀티테넌시를 강화하면서 실시간과 스트리밍 데이터 영역으로 진화하는 하둡과 발전방향을 같이 할 것”이라고 밝혔다.
HBASE는 2007년 처음 만들어진 NoSQL DB다. 하둡의 핵심인 하둡분산파일시스템(HDFS), 맵리듀스와 함께 대부분의 하둡 배포판에서 필수도구로 포함돼 있다. HDFS에 저장된 데이터를 DB로 만들었다고 볼 수 있다.
NoSQL의 대표격인 몽고DB가 쉬운 시작방식과 빠른 속도를 장점으로 한다면, HBASE는 규모를 확장하면 속도와 성능이 함께 개선되는 강력한 확장성과 실시간성이 주특기다.
마이클 스택 의장이 이끌고 있는 아파치 HBASE 프로젝트는 2007년 시작됐다. 2006년 구글에서 공개한 빅테이블 논문에서 아이디어를 얻어 만들어졌다. 현재 페이스북이 메시징 서비스와 관리시스템에 HBASE를 적용해 사용중인 것으로 유명하다. 핀터레스트, 카시니, 세일즈포스닷컴 등 다수 기업들도 HBASE를 도입했다.
스택 의장은 “HBASE는 OLTP, OLAP, 스토리지 덤핑 등 다양한 곳에서 여러 용도로 사용되고 있다”라며 “엔지니어들은 확장을 걱정할 필요가 없어 좋아한다”라고 말했다.
스택 의장은 “HBASE는 빠르게 버전을 업데이트하고 있는데, 지난달 나온 HBASE 0.96버전이 최신판이다”며 “0.94에서 성능을 높이고 안정성을 강화했고, 18개월의 개발을 거쳐 나온 0.96버전은 2천건 이상을 수정해 안정성과 운영성을 높여 관리자가 통찰력을 갖추도록 했다”고 치켜세웠다.
그는 “마이SQL처럼 테이블을 그루핑하게 했고, 멀티테넌시 환경에서 배포될 수 있게, SLA를 보장하면서, 사용자들을 고립, 차단시키도록 개선했다”라며 “멀티테넌시는 앞으로 더 나아질 것”이라고 덧붙였다.
그에 따르면 HBASE 0.98 버전이 올 연말께 나올 예정이다. 0.98 버전은 롤링업데이트와 보다 세밀한 보안을 지원한다. ACL을 셀수준까지 가져가는 것도 가능해진다. 그는 “0.98 버전이 1.0버전이 될 것으로 보인다”고 말했다.
그는 오픈소스로서 HBASE 생태계가 어떤 방식으로 움직이는지도 소개했다.
수많은 HBASE 노드를 모니터하는 시스템인 오픈TSDB와 국내 벤처기업인 VCNC가 개발해 오픈소스로 공개한 HBASE 트랜잭션엔진 ‘해인사(HAEINSA)’, 클러스터 운영을 자동화하는데 노력하고 있는 실시간 애플리케이션 데이터 분석도구 ‘KIJI’ 등이 거론됐다.
그는 또한 세일즈포스닷컴에서 주도해 개발하는 ‘피닉스 프로젝트’도 소개했다. HBASE 윗단에 SQL 레이어를 올려, HBASE를 SQL언어로 조회하도록 하는 프로젝트다.
관련기사
- 클라우드 빅데이터 서비스가 몰려온다2013.11.14
- 글로벌 IT서비스 업계, 하둡 지원 확대일로2013.11.14
- 페이스북, SQL온하둡 '프레스토' 공개2013.11.14
- 하둡 2.0, 엔터프라이즈 시장 뒤흔드나2013.11.14
그는 “하둡 생태계는 배치 프로세스로 유명하지만, 변곡점인 하둡2 발표로 실시간, 스트리밍 데이터 분석으로 진화하고 있다”라며 “HBASE도 리얼타임 클러스터로서 같은 방향으로 진화할 것”이라고 강조했다.
하둡 관련 최신 이슈는 19일 지디넷코리아가 개최하는 ACC 컨퍼런스에서 보다 자세한 내용을 엿볼 수 있다. 이번 컨퍼런스에선 글로벌 하둡 '빅3'인 클라우데라, 호튼웍스, 맵알 본사에서 직접 전문가를 투입해, 최신 하둡 트렌드를 소개한다.