오라클도 드디어 SQL온하둡 세계에 뛰어들었다.
15일(현지시간) 미국 지디넷에 따르면, 오라클은 하둡파일시스템(HDFS)이나 NoSQL 데이터베이스에 저장된 데이터를 오라클SQL로 조회, 분석하게 해주는 '오라클 빅데이터SQL' 제품을 공개했다.
오라클 빅데이터SQL은 기존 오라클DB에서 사용돼 온 SQL쿼리 언어로 하둡이나 오라클NoSQL, 몽고DB 등에 저장된 데이터를 조회하게 해준다.
하둡이나 NoSQL에 있는 데이터를 오라클DB로 끌어와 분석하게 했던 기존의 커넥터 접근법과 다르다. 현재 오픈소스 하둡 진영을 중심으로 경쟁적으로 개발되고 있는 SQL온하둡의 상용벤더 버전이다.
SQL온하둡은 DW 분석가들이 익숙한 SQL언어 대신 별도의 맵리듀스 프로그래밍을 습득해야 하는 난맥상을 없애면서, 하이브의 느린 성능을 MPP기반 DW 수준에 근접하도록 하려는 시도다.
오픈소스 SQL온하둡 기술로 그루터 주도로 개발되는 타조와, 클라우데라에서 개발한 임팔라, 호튼웍스가 주도하는 '스팅거(테즈)' 등이 있다. 이밖에 EMC 피보탈의 호크, IBM의 빅SQL온하둡 등이 상용제품으로 판매되고 있다.
오라클 빅데이터SQL은 이 회사에서 제공하는 어플라이언스에서 작동된다. 오라클 빅데이터 어플라이언스를 구매해야 사용할 수 있다는 얘기다. 오라클DB 12c 버전을 탑재한 엑사데이터만 빅데이터SQL 기능을 이용할 수 있다. 오라클은 향후 여러 엔지니어드시스템으로 확대하겠다고 밝혔다.
현재 아파치 하이브와 HDFS를 지원하고, 몽고DB, HBASE 등의 지원은 추후에 이뤄진다.
오라클은 빅데이터SQL의 강점으로 엑사데이터에서 하둡 로컬데이터에 쿼리를 날리게 해주는 '하둡스마트스캔' 기술을 꼽았다.
이는 데이터 로컬 스캐닝을 제공해 데이터 읽기와 프로세싱이 스토리지에서 이뤄진다. 서술부 측정과 예측으로 적절한 데이터만 하둡에서 전송받는다. 콤플렉스 파싱으로 JSON과 XML 같은 데이터를 소스에서 처리한다.
닐 멘델슨 오라클 빅데이터&어드밴드스애널리틱스 부사장은 엔터프라이즈 고객들은 여전히 3가지 장애물에 직면했다며 관리통합과 데이터 사일로, 신기술세트를 보유한 적합한 인력을 만나거나 내부 재능에 의존하거나, 그리고 보안이다라고 설명했다.
관련기사
- 유명 하둡 전문가의 스마트폰 예찬론2014.07.16
- 진화하는 빅데이터 실시간 분석 기술의 세계2014.07.16
- 하둡, 제대로 쓰고 싶으면 링크드인 보라2014.07.16
- 페이스북, SQL온하둡 '프레스토' 공개2014.07.16
그는 빅데이터SQL은 단일 쿼리로 하둡과 NoSQL에서 데이터를 운영할 수 있는 능력을 제공한다고 덧붙였다.
오라클은 빅데이터SQL 탑재 제품을 8월~9월 사이 생산에 돌입할 계획이다. 가격은 빅데이터SQL 정식버전(GA) 출시 시점에 맞춰 함께 공개된다.