기업들의 빅데이터 대응 시나리오에 분산 환경 데이터베이스(DB) 기술 '카산드라'가 떠올랐다. 이는 구글의 '빅테이블' 컬럼 모델과 페이스북 '다이나모' 분산모델을 기반으로 만든 아파치의 NoSQL DB 기술로 지난 2008년 오픈소스가 됐다. 카산드라가 분석프레임워크 하둡과 짝을 이룬 빅데이터 기술요소로 자리잡을 것인지 주목되는 가운데 글로벌 생태계를 이끌겠다고 나선 플랫폼 업체가 등장해 눈길을 끈다.
빅데이터 분석처리 기술을 제공하는 데이터스택스는 15일 서울 삼성동 코엑스서 열린 제7회 ACC 행사장에서 하둡과 함께 카산드라 기술에 대한 수요가 고공행진하는 추세임을 지적하며 빅데이터 대응을 준비하는 기업들에게 앞서 글로벌 업체들이 적용중인 사례를 소개하고 자사 솔루션을 선보였다.
이날 매튜 데니스 데이터스택스 수석 기술 아키텍트는 빅데이터가 강조되면서 하둡이 분산처리기술로 기업들에게 각광을 받고 있는 가운데 이를 보완하기 위한 카산드라 역량이 떠오르고 있다며 데이터스택스가 제공하는 플랫폼이 하둡과 카산드라를 묶어 일괄처리 분석 성능에 실시간성을 더해 준다고 설명했다.
그에 따르면 카산드라는 구글과 페이스북이 사용중인 DB기술의 장점만 모아 만들었다. 선형적인 규모가변성까지 갖춰 실시간 대응이 중시되는 엔터프라이즈 빅데이터 대응 시나리오에 알맞다. 실시간 활용을 위한 빅데이터 종류로 금융 트랜잭션 데이터, 광고 포스팅, 메일, 블로그 등 사용자 요구가 직접 담긴 자료들이 예시된다. 또 증권시장 동향과 핫토픽 메시지, 자동차 센서 온도와 연비정보 등 에너지 소비 데이터도 해당된다.
데니스 아키텍트는 서비스 운영 단계에서 수집되는 빅데이터를 분석 시스템으로 전해주면 그 의미를 파악해 활용하는 애널리틱스 단계가 반드시 연결된다며 카산드라가 전체 빅데이터 활용 시나리오를 잇는 중간과정이고 데이터스택스 엔터프라이즈는 하둡과의 공백을 채워주는 플랫폼이라고 설명했다.
회사는 '데이터스택스 엔터프라이즈'라는 플랫폼을 서브스크립션 기반 라이선스 모델로 제공한다. 기업들이 빅데이터 플랫폼을 구축시 이를 도입해 분산환경의 데이터 분석처리를 실시간화할 수 있도록 돕는 것이다. 주력 비즈니스 모델은 아니지만 이를 보조할 목적으로 최근 컨설팅 서비스도 시작했다고 데니스 아키텍트는 덧붙였다.
IBM, 오라클, 마이크로소프트(MS) 등 대형 SW업체들이 자사 솔루션을 기반으로 하둡을 공식 지원하겠다고 나서면서 그 가치는 검증된 듯하다. 그런데 NoSQL 분야에서 특정 기술이 다른 것을 압도하는 방향으로 결론이 나진 않은 상태다. 데이터스택스가 카산드라에 유독 역점을 둔 배경에 의문이 든다.
데니스 아키텍트는 이에 대해 카산드라는 현존하는 NoSQL 가운데 대규모 분산환경에서 '실패단일점'이 없는 유일한 기술이라며 이외 기술들은 설계구조 단계를 들여다보면 한두가지 문제점을 보이지만 카산드라에는 그런 빈틈이 보이지 않을 정도로 기초가 탄탄하고 설계상의 구조에 흠이 없다고 평했다.
관련기사
- [제7회 ACC]“오라클DB, 빅데이터에서 더 강하다”2012.02.15
- [제7회 ACC]인메모리, 빅데이터의 동반자2012.02.15
- [제7회 ACC]팁코 "빅데이터, 쌓이기 전에 움직여라"2012.02.15
- [제7회 ACC]"SNS 분석, 도입 전 필요한 것은…"2012.02.15
이미 국내서도 이름을 한 번쯤 들어봤을만한 유명 인터넷 서비스 업체들이 카산드라를 사용중이다. 우선 트위터, 레딧 등 단순 웹서비스 업체뿐 아니라 웹비디오 서비스업체 넷플릭스가 실시간 콘텐츠 서비스의 히스토리 관리, 사용자 접속단말 기록과 다시보기 시점 저장 등을 구현하며 활용중이다. 월마트의 자회사 월마트랩은 SNS에서 고객들이 내놓는 제품가격 의견청취 시스템에 도입했고 시스코는 웹컨퍼런싱 솔루션 웹엑스에 이를 활용한다. IBM과 HP 카산드라를 쓴다고 한다.
데니스 아키텍트는 이가운데 넷플릭스, 월마트랩, HP 등이 데이터스택스 고객사라며 트위터는 고객사가 아니지만 대신 우리 회사와 함께 카산드라에 대한 애플리케이션 개발 부문에서 상호 밀접하게 협력해온 파트너라고 밝혔다. 이어 지난 2010년 4월 데이터스택스 설립 당시에 비해 최근 카산드라 관련 구인공고가 100배 증가한 추세를 보이고 있다며 이는 향후 광범위한 분야에 활용을 예고하는 방증이고 카산드라가 활성화될 경우 데이터스택스의 비즈니스 역시 성장할 것이다고 덧붙였다.











