EMC, RDB+하둡 빅데이터 분석 플랫폼

일반입력 :2011/09/22 14:51    수정: 2011/09/22 15:10

단일 인프라로 관계형 데이터베이스(DB)와 아파치 하둡을 통합해 사용하는 분석 어플라이언스가 처음으로 공개됐다.

EMC는 단일 인프라스트럭처 내에서 정형·비정형 데이터 및 애플리케이션이 통합된 빅데이터 분석 플랫폼, ‘EMC 그린플럼 모듈식 데이터 컴퓨팅 어플라이언스(이하 그린플럼 DCA)’를 출시했다고 22일 밝혔다.

그린플럼 DCA는 모듈식 아키텍처로, 기업이 무공유(Shared-nothing) MPP 기반 관계형 DB와 엔터프라이즈급 아파치 하둡(Apache Hadoop)을 결합시킬 수 있도록 했다. 이를 통해 정형 데이터와 비정형 데이터의 상호 연계 처리(co-processing)가 가능해졌으며 정형비정형 데이터를 단일의 통합 플랫폼에서 필요에 따라 확장할 수 있게 됐다.

DCA 모듈은 작은 규모로 시작해, 보다 유연하고 비용 효율적인 방법으로 쿼터랙 단위로 증가시키는 스케일링 방식을 사용한다. 처리 성능 및 스토리지 요구량에 따라 어플라이언스를 늘리는 것이 가능하다. 그린플럼 DB와 그린플럼 HD(하둡) 모듈을 필요에 따라 상호 연계 처리 해 사용할 수 있으며, 그린플럼 데이터 통합 가속기(DIA) 모듈을 통해 모든 BI 애플리케이션과 ELT 툴을 같은 DCA 내에 있는 클러스터로 바로 이동시킬 수 있다.

기본 랙은 2개의 마스터 서버로 이뤄진다. 마스터 서버는 인증, 쿼리 최적화, 각기 다른 세그먼트 서버간 업무량 분산, 데이터의 내장애성 메커니즘 관리를 담당한다. 단일 표준 혹은 고용량 그린플럼 데이터베이스 쿼터랙 모듈, 기타 3가지 모듈을 위한 공간이 포함된다. 기업은 그린플럼 DB, 그린플럼 HD 혹은 그린플럼 DIA 모듈을 사용해 쿼터랙을 증가시킬 수 있다.

그린플럼 DCA는 기존보다 가용성이 훨씬 높아졌으며 EMC 데이터 보호 및 재해 복구 솔루션, 데이터도메인 중복제거 및 백업 기술과 간단히 통합가능하다.

관련기사

김희배 한국EMC 데이터 컴퓨팅 사업부 이사는 “단일 어플라이언스 내에 관계형DB 모듈과 하둡 모듈 간, 정형비정형 데이터를 상호 연계 처리 하고 빠르게 공유할 수 있는 기능을 제공하는 업계 유일의 솔루션”이라며 “DCA의 새로운 모듈 방식인 데이터 상호 연계 처리는 각 시스템들이 최고의 성능을 낼 수 있도록 하기 때문에 매우 중요하고 강력한 기술이다” 라고 설명했다.

김경진 한국EMC 대표는 “빅데이터 분석에 대한 그린플럼의 독특한 접근 방식은 데이터 인프라스트럭처의 근본적인 변화를 꾀하고 있는 대기업 사이에서 큰 반향을 일으키고 있다”라며 “EMC는 빅데이터 시장에서 괄목할 성공을 거둬왔으며 새롭게 출시된 그린플럼 DCA는 EMC가 분석 플랫폼 구축에 역점을 두고 있음을 반영한다”라고 밝혔다.