오라클 "DW 현대화로 가는 가장 빠른 지름길 ADW”

컴퓨팅입력 :2020/11/10 13:01

“많은 기업이 수년간 데이터를 비즈니스 가치로 환산하는 방법에 집중하고 있지만, 수년간 노력을 기울인 결과 일부 외에 여러 문제와 마주치고 있다. 데이터가 사방에 있다는 게 가장 큰 문제다. 데이터는 흩어져 있는데 거버넌스는 열악하고, 조각조각 나뉜 데이터 때문에 분석은 물론 보안도 취약해진다. 이런 문제를 해결하기 위해 현대화된 데이터웨어하우스가 필요한데, 가장 쉽고 빠른 방법은 오라클 자율운영데이터웨어하우스(ADW)를 이용하는 것이다.”

앤드류 멘델슨 오라클 데이터베이스서버테크놀로지 총괄부사장은 최근 온라인 개최된 ‘오라클 클라우드 플랫폼 버추얼서밋’에서 이같이 밝혔다.

앤드류 멘델슨 부사장은 “고객들은 서로 다른 영업부문과 중앙 IT, 클라우드, 객체저장소 등에서 데이터를 수집하는데, 데이터 분석가는 당면 비즈니스 과제와 관련된 데이터를 찾아내기 힘들어한다”며 “복잡한 ETL 메커니즘으로 여러 위치의 데이터를 통합해야 하지만 이런 작업은 분석가에게 많은 도움을 받게 만든다”고 설명했다.

오라클 클라우드 플랫폼 버추얼서밋

또 “머신러닝에 대한 기대도 고객이 매우 컸지만, 대다수 기업과 조직은 데이터에서 많은 가치를 얻기 위해 머신러닝을 알고리즘을 배초하는데 성공하지 못해 매우 실망하고 있다”고 덧붙였다.

그는 ‘모던 DW’ 구축에 필요한 요건을 4가지로 제시했다. 완전히 통합된 솔루션, 쉬운 시작, 쉬운 운영과 보안, 쉬운 분석 등이다. 그리고 이런 요건을 빠르게 충족하고 본래의 데이터 분석 목적을 달성하는 가장 빠른 방법이 오라클에 있다고 밝혔다.

멘델슨 부사장은 “오라클은 고객의 DW를 클라우드로 쉽게 현대화하도록 지원하고, 요구사항을 빠르게 충족하고 훨씬 효과적인 DW로 전환할 수 있게 수년간 협력해왔다”며 “모던 데이터웨어하우스를 위한 완전한 통합 솔루션을 제공하고 있다”고 강조했다.

그가 제시한 모던 DW 아키텍처의 모습은 데이터 소스, 패키지 앱, 데이터베이스, 온프레미스 및 클라우드, ETL, 스트리밍 데이터 수집을 위한 카프카, 데이터 캡처를 위한 오라클 골든게이트 같은 도구, 객체 스토리지 등으로 이뤄진다. 데이터를 쉽게 분석 가능한 형식으로 변환하는 데이터 정제도 필요하다.

멘델슨 부사장은 “오라클은 강력한 데이터 통합기술과 카프카 서비스 등을 보유했으며, 플랫폼의 중심에 자율운영 데이터웨어하우스(ADW)를 갖고 있다”며 “ADW는 고성능의 병렬 쿼리를 수행할 뿐 아니라, 데이터 레이크를 구성하는 객체 저장소의 데이터에도 투명하게 접근할 수 있다”고 설명했다.

또 “분석의 경우 오라클 애널리틱스 클라우드(AOC) 같은 분석도구 외에 태블로나 클릭 등 타사 도구도 사용가능하다”며 “예측분석 수행을 위한 머신러닝 플랫폼도 제공한다”고 덧붙였다.

모던 데이터웨어하우스 아키텍처 요소

그는 ADW를 ‘유니크하다’고 강조했다. ADW는 이름 그대로 자동화를 극대화한 데이터 플랫폼이다. DBA의 수작업없이 DB 설정, 튜닝, 보안, 관리 등을 자동으로 진행한다.

그는 “ADW의 가장 큰 특징은 구조화된 데이터뿐 아니라 그래프, JSON, XML, 공간정보, 다차원 등의 모든 최신 데이터 유형도 볼 수 있는 컨버지드 데이터베이스란 것”이라며 “한곳에서 모든 유형의 데이터에 쿼리를 수행할 수 있는 강력한 SQL 엔진을 가졌고, 이 컨버지드 엔진은 모든 DW 관련 데이터 관리 활동을 수행할 수 있으면서 머신러닝 알고리즘도 제공한다”고 말했다.

이어 “고성능 분석을 위한 인메모리 컬럼형 기술과 함께 DB 자체에서 사물인터넷, 스트리밍, 블록체인 등을 수행할 수 있어 또 다른 전문 DB 엔진으로 이동할 필요가 없다”며 “퍼블릭 클라우드와 프라이빗 클라우드에서 오라클의 모던 DW를 동일하게 배포할 수도 있다”고 덧붙였다. .

ADW 이용의 시작은 매우 쉽다. 프로비저닝은 클릭 몇차례로 끝난다. 필요한 컴퓨팅과 스토리지 용량에 최선의 추정치를 제공하고, 이를 선택해 비밀번호만 입력하면 몇분 안에 DB 기술을 쓸 수 있다. 온라인 도구로 매우 간단하게 데이터를 로드하거나, 더 복잡한 솔루션을 통합하는 작업도 간단하다.

멘델슨 부사장은 “기존 오라클 DW 온프레미스 고객이 더 현대적인 클라우드 아키텍처로 이동하려는 경우 오라클 솔루션을 쓰는 것이 가장 쉬운 방법”이라며 “기존 ETL 스크립트를 변경할 필요가 없고, BI 도구와 보안 정책도 동일하게 작동한다”고 강조했다.

프로비저닝 이후 분석가는 DBA의 도움을 최소한으로 받으면서 DB 튜닝을 할 수 있다. ADW 자체적으로 튜닝을 수행하며, 모든 보안 업데이트는 무중단으로 온라인 배포된다. 또한 기본 용량보다 더 많은 분석을 수행해야 하는 경우 자동으로 프로비저닝을 확장하는 오토스케일링 기능을 제공해, 비용 효율적으로 늘어난 업무를 쉽게 처리하도록 돕는다.

그는 “AWS 레드시프트나 스노우플레이크 같은 DW 플랫폼은 전통적 형태기반 프로비저닝 기술만제공하지만, 오라클은 업무량 급증시 CPU만 추가하면 모든 증설이 끝나고, 미리 조건을 설정해 자동으로 확장되게 설정할 수 있다”며 “뿐만 아니라 사용자에게 요약 인덱스 생성 등의 최적화 작업을 자동으로 수행한다”고 밝혔다.

ADW에 저장되는 모든 데이터는 기본적으로 암호화되며, 데이터세이프란 도구로 사용자 권한 부여를 자동으로 할 수 있다. 권한 부여 리스크 평가를 ADW에서 수행하며, 사용자의 DW 접근과 활동을 모니터해준다.

분석의 영역도 쉽고 간단하다. 오라클 애널리틱스 클라우드는 엑셀 파일 같은 데이터 로드만 하면 바로 대시보드를 구성해 시각화 화면을 제시한다. ADW 자체도 무료 시각화 도구로 애플리케이션익스프레스(APEX)를 제공한다.

오라클 퓨전 앱 이용자는 ADW를 간단하게 통합해 이용할 수 있다.

데이터 분석가를 넘어 데이터 과학자의 고급 분석을 위한 도구도 제공하고 있다. 머신러닝 알고리즘을 구축할 수 있는 ‘머신러닝 룸’을 원하는 곳에 배포할 수 있다. 오라클 데이터사이언스 플랫폼은 오토ML을 지원해 분석가를 과학자 수준으로 끌어올리도록 지원한다.

그는 “연구실의 데이터세트 예제를 제시하고 예측분석 수행에 사용할 데이터와 기능을 보여주며, 각 행이 결과에 대해 기본 테이블에서 원하는 예측이 뭔지 보여주면 오라클의 머신러닝이 어떤 알고리즘이 적합한지 알아낸다”며 “몇거지 선택지를 보고 사용하고 싶은 머신러닝 모델을 선택하면 된다”고 설명했다.

관련기사

한국의 경우 한솔PNS가 한솔제지에 ADW를 활용하는 빅데이터 분석 플랫폼을 구축했다. 한솔제지는 분석 플랫폼을 통해 종이 생산성과 공정 연속성을 확보할 수 있게 됐다. 판매 분석으로 명확한 타깃을 설정함으로써 매출 향상 효과도 기대할 수 있게 됐다. 또 국내 반도체 파운드리 전문기업은 ADW와 AOC로 보안로그 분석 시스템을 구축했다. 비정형 데이터인 보안로그를 엑셀로 관리하고 있었는데, 이를 AOC와 ADW에 올리고 실시간 분석을 할 수 있게 됐다.

한국오라클은 ADW 도입을 원하는 조직에게 사용법을 교육하는 반나절 정도의 ‘ADW 핸즈온 워크샵’을 운영한다. 코로나19에 따라 최근은 2일 과정의 온라인 교육을 제공하고 있다.