관계형 데이터베이스(DB)의 위기라는 빅데이터 시대, 오라클이 오픈소스를 통합한 RDBMS를 들고 나왔다. 하둡, 하이브, NoSQL, R 등을 RDBMS와 쉽고 빠르게 혼용가능한 솔루션이다.
임상배 한국오라클 부장은 15일 ‘제7회 ACC' 행사에서 빅데이터 처리와 분석을 위한 각종 오픈소스 기술의 오라클DB 통합 내용을 소개했다.
그는 우선 빅데이터 처리 솔루션들의 다양성을 밝혔다. 하둡 분산파일시스템과 맵리듀스 프레임워크, 분석 엔진 R 등 여러 스펙트럼을 오라클DB와 함께 사용할 수 있다는 게 그의 설명이었다.
그는 “현재 시장에 나와 있는 NoSQL이 122개에 이른다”라며 “오라클도 여기에 하나를 추가해 오라클 NoSQL 데이터베이스를 만들어냈다”라고 말했다.
오라클 NoSQL은 키벨류 구조로 내부적으로 로드밸러싱을 제공해 속도를 높인다. 특정 목적에만 특화된 기존 NoSQL의 단점을 해결하기 위해 리드 연산과, 라이트 듀러빌리티 등을 프로그램 단계에서 4가지 종류로 설정할 수 있게 했다.
임 부장은 “키벨류기 때문에 특정 파티션에 따라 사전에 판단해 이를 기반으로 실제 데이터 위치까지 직접 접근할 수 있다”라며 “멀티오퍼레이션 연산도 가능하다”라고 설명했다.
이어선 오라클이 최근 하둡 채택을 위해 선택한 클라우데라를 소개했다.
임 부장은 “클라우데라 하둡판은 가장 진화한 하둡이고, 검증된 스케일을 갖고 있다”라며 “이를 통해 안정적이고 책임있는 하둡지원을 받을 수 있다”라고 강조했다 .
그는 “성능이 빠르고, 가장 오라클 기존에 빠르게 넣을 수 있도록 만들었다”라며 “오라클 다이렉트 커넥터 포 HDFS(ODCH)는 마운트 하지 않고, 하둡에 있는 파일을 RDBMS 익스터널 테이블로 읽을 수 있다”라고 설명했다.
분석엔진 R은 아예 오라클 데이터베이스에 집어넣었다.
임 부장은 “일반적 R의 한계는 데이터를 빼어내 분석하지만, DBMS에 비해 이용 하드웨어의 리소스 수준이 떨어진다는 점”이라며 “오라클R 엔터프라이즈는 아예 DB에 R을 넣어서 곧바로 DB객체에 접근해 사용가능하며, DB를 바로 통계분석에 활용하게 했다”라고 밝혔다.
관련기사
- [제7회 ACC]인메모리, 빅데이터의 동반자2012.02.15
- [제7회 ACC]팁코 "빅데이터, 쌓이기 전에 움직여라"2012.02.15
- [제7회 ACC]티베로, 국산 클라우드 빅데이터 전략 공개2012.02.15
- [제7회 ACC]"SNS 분석, 도입 전 필요한 것은…"2012.02.15
그는 “데이터 추출과 삽입 과정이 없으므로 보안이슈도 해결할 수 있다”며 “무엇보다 기존 R사용자나 오라클DB 사용자는 새로 배우지 않아도 기존 언어를 사용하면 된다”라고 덧붙였다.
이같은 각종 빅데이터 솔루션은 오라클 엑사데이터, 엑사리틱스, 빅데이터 어플라이언스 등을 종합적으로 이용할 때 효과를 발휘할 수 있다.