오라클, 클라우드 데이터 사이언스 플랫폼 출시

컴퓨팅입력 :2020/02/14 11:10

오라클은 기업의 데이터 사이언스 활용을 지원하는 클라우드 플랫폼을 출시한다고 14일 밝혔다.

새롭게 출시된 ‘오라클 클라우드 데이터 사이언스 플랫폼’은 기업 내 협력 기반의 머신러닝 모델 개발과 교육, 관리 및 구축을 통해 데이터 사이언스의 성공적 수행을 돕는다.

개별 데이터 과학자에 중점을 두지 않고, 기업 내 공유 프로젝트와 모델 카탈로그, 팀 보안정책, 재현성 및 감사성(auditability) 등 데이터 사이언스 조직에서 다루는 주요 기능에 집중한다. 자동 머신러닝(AutoML) 알고리즘 선택과 튜닝, 모델 평가 및 모델 설명기능을 통해 최적의 데이터세트틀 자동으로 선택해준다.

오라클 CI

오늘날 기업은 비즈니스 혁신을 도모할 수 있는 거대한 양의 잠재적 데이터를 보유하고 있음에도 극히 그 일부만 이를 파악하거나 활용하고 있다. 기업 내 데이터 사이언스 조직이 올바른 데이터에 접근해 머신러닝 모델을 효과적으로 개발하고 구축할 수 있는 도구가 없기 때문이다. 모델 개발이 오래 걸리고, 정확도와 안정성 요건을 충족하지 못해 실제 업무 환경에 적용하지 못하는 경우가 대다수였다.

오라클 클라우드 인프라스트럭처 데이터 사이언스는 AutoML 자동화 알고리즘 선택 및 튜닝, 자동화된 예측형 특징(predictive feature) 선택, 모델 평가, 모델 설명 등의 기능을 제공한다.

효과적인 머신러닝 모델을 실제 생산환경에 성공적으로 도입하려면 단순히 전담 요원들의 배치보다 함께 협업할 수 있는 팀 단위의 데이터 과학자가 필요하다. 이러한 팀 역량을 지원하기 위한 오라클 클라우드 인프라스트럭처 데이터 사이언스는 프로젝트 공유 기능, 모델 카탈로그, 팀 기반 보안 정책, 재생산성과 감사성 등의 기능을 제공한다.

오라클 클라우드 데이터 사이언스 플랫폼은 파이썬, 텐서플로, 케라스, 주피터 등 오픈소스 도구를 활용해 오라클 클라우드 상에서 새로운 머신러닝 모델을 설계, 훈련 및 관리하도록 돕는다.

사용자는 파이썬과 자동화된 머신러닝 기능에 대한 새로운 지원과 함께 오라클 자율운영 데이터베이스와 통합된 머신러닝 알고리즘을 활용할 수 있다.

오라클 클라우드 인프라스트럭처 데이터 카탈로그로 오라클 클라우드 상에서 데이터를 발견하고 구성하며, 활용하고 추적할 수 있다. 비즈니스 용어집도 내장해 활용목적에 맞는 신뢰 가능한 데이터를 발견하고 그룹화 및 조직화하며 이를 공유하도록 지원하는 데이터 큐레이션 과정을 지원한다.

오라클 빅데이터 서비스는 다른 하둡 기능들보다 훨씬 간소화된 방법으로 관리할 수 있는 클라우데라 하둡 기능을 제공한다. 한 번의 클릭만으로도 하둡 클러스터가 지속적으로 운영될 수 있도록 함은 물론, 보안 기능도 실행할 수 있다. 스파크 머신러닝 기능도 포함 한다.

오라클 클라우드 SQL은 HDFS, 하이브, 카프카, NoSQL, 오브젝트스토리지 상에서 SQL 쿼리를 제공한다. 오라클 클라우드 SQL은 사용자와 애플리케이션, 분석 도구가 오라클 데이터베이스와 다른 데이터 스토어에 있는 데이터간의 업무를 손쉽게 처리할 수 있도록 한다. 기존의 데이터를 밀어내고 새로운 데이터를 유입해 확장하는 ‘푸시 다운, 스케일 아웃 방식’ 프로세스를 통해 데이터 이동을 최소화하는 혜택 또한 누릴 수 있다.

오라클 클라우드 인프라스트럭처 데이터 플로우는 완전 관리형 빅데이터 서비스로, 사용자가 특정 인프라스트럭처를 구축하거나 관리하지 않고도 아파치 스파크를 실행할 수 있다.

관련기사

데이터 사이언스를 위한 오라클 클라우드 인프라스트럭처 가상머신은 하루에 30달러 금액만으로 IDEs, 노트북 및 프레임워크가 15분 내 가동될 수 있는 사전 구성된 GPU 기반의 환경을 제공한다.

그렉 파블릭 오라클 데이터 및 AI서비스 제품 개발 부문 수석부사장은 “성공적인 데이터 사이언스 프로젝트 수행을 위해 효과적인 머신러닝 모델이 그 기반임에도, 다양하고 방대한 양의 데이터가 그 동안 기업들의 발목을 잡아왔다”며 “오라클 클라우드 인프라스트럭처 데이터 사이언스 출시를 통해 개별 데이터 과학자의 전체 업무를 자동화해 개인 생산성을 증대할 뿐만 아니라 관련 팀 간의 강력한 협력을 지원함으로써 데이터 사이언스 프로젝트가 실질적인 기업의 비즈니스 가치로 직결될 수 있도록 지원할 수 있게 됐다”고 밝혔다.