빅데이터-BI 융합 가속...SAP도 가세

컴퓨팅입력 :2015/09/02 08:32

황치규 기자

데이터 분석에 초점을 맞춘 전통적인 비즈니스 인텔리전스(BI)와 비정형 데이터를 분석하는 빅데이터 기술의 융합에 가속도가 붙었다.

최근에는 오픈소스 기반 빅데이터 처리 기술인 스파크가 빅데이터와 BI의 벽을 허무는 기폭제 역할을 하는 모습이다. IBM과 마이크로소프트(MS)에 이어 세계 최대 비즈니스 애플리케이션 업체인 SAP도 스파크 끌어안기에 본격 나섰다.

SAP는 1일(현지시간) 하둡과 스파크에서 자사 HANA 인메모리 DB 플랫폼에 연결할 수 있는 도구인 HANA 보라(Vora)를 발표했다. 스파크와 하둡과 같은 빅데이터 기술이 SAP HANA 및 BI 솔루션과 버무려진 개념이다. 지디넷은 SAP 보라에 대해 BI 스타일의 분석을 빅데이터 세계에 융합시켰다고 평가했다.

SAP

스파크는 2009년 UC버클리 연구 프로젝트로 출발한 빅데이터 분석 기술로 오픈소스 프로젝트로 제공된다. 지난해를 기점으로 빅데이터 분야에서 큰 주목을 끌기 시작했다. 가장 큰 장점은 빠르고, 쓰기도 쉽다는 것이다. 빅데이터 분석에 쓰이는 기존 하둡 맵리듀스의 경우 나온지 꽤 됐음에도 여전히 까다로운 기술로 꼽힌다. 하이브 역시 데뷔 10년 가까이 됐지만 성능 이슈에서 자유롭지 않다는 지적이다. 스파크가 하둡 생태계의 맵리듀스나 하이브를 대체할 잠재력을 갖췄다는 전망이 나오는 이유다.[☞관련기사]

관련기사

HANA 보라는 전용 하드웨어 인프라를 필요로 하지 않는다. 보라를 HANA와 통합하는 경우라면 하드웨어 인프라가 투입될 수 있지만 하드웨어 추가없이 별도로 사용하는 것도 가능하다고 지디넷은 전했다. 또 'HANA 보라'는 하둡과 스파크를 도입하는 SAP 고객들에게는 합리적인 방법이 될 수 있을 것이라고 덧붙였다.

SAP에 앞서 IBM은 6월 스파크를 자사 분석과 커머스 솔루션에 집중 투입하고 블루믹스 서비스형 플랫폼(PaaS)를 통해 스파크를 클라우드 서비스로도 제공한다는 전략을 발표했고 MS도 최근 스파크 온 애저 HD인사이트 퍼블릭 프리뷰를 공개했다. HD인사이트는 MS가 제공하는 클라우드 기반 하둡 서비스다.