데이터스트림즈(대표 이영상)가 클라우드 사업 확대를 목표로 '테라원 V4.0(TeraONE V4.0) 플랫폼' 개발을 완료, 기업 대상으로 ‘클라우드 데이터 플랫폼(CDP)’ 사업에 나섰다.
'테라원 V4.0'은 기존 온프레미스(On-premise) 버전과 이질성을 최소화했다. AWS, 애저 등 다양한 클라우드(Cloud) 환경의 동적 할당이 가능하다. 특정 클라우드 환경에 설치하지 않아도 되고, 컨테이너 기반 데이터 플랫폼으로 개발했다. 이번달 AWS 마켓에 올릴 예정이다.
이번 개발을 지휘한 천승태 데이터스트림즈 연구소장과 김현철 제품사업본부장(전무)을 최근 만나 자세한 이야기를 들어봤다. 천 소장은 "클라우드 시장 선점을 위해 기존 온프레미스의 '테라원 V4.0'을 클라우드 제품으로 전환했다"면서 "컨테이너와 데이터 기반 PaaS 플랫폼은 테라원 V.40이 국내서 처음인 듯 하다"고 강조했다.
천 소장은2006년 데이터스트림즈에 엔지니어로 입사해 이 회사 초기 제품인 '테라스트림' 개발부터 참여했다. 이후 데이터스트림즈가 출시한 데이터 관련 제품과 데이터 통합 관련 제품 개발에 참여했고, 2012년 데이터 통합 총괄 팀장을 거쳐 2016년부터 연구소장을 맡고 있다. 배석한 김현철 본부장은 데이터스트림즈 창립멤버로 기술지원팀장 등을 거쳐 현재 제품사업 총괄을 하고 있다.
-데이터스트림즈를 소개해달라
"지난 20여년 간 기존의 DB중심 전략을 깨트릴 수 있는 다양한 데이터 통합 제품들을 출시했다. 데이터 통합 솔루션 ‘테라스트림(TeraStream)’을 시작으로 ‘델타스트림(DeltaStream)’, ‘메타스트림(MetaStream)’ 등을 잇달아 내놓으며 국내 데이터 시장의 인식과 저변을 확대했다. 특히 2016년에는 우리가 보유한 14개 핵심 솔루션을 결합해 데이터 관리를 위한 전 과정을 통합 지원하는 ‘테라원(TeraOne) V2’을 출시했다. 이어 지난해 ‘테라원 이데아(TeraONE IDEA)’를 출시, 비즈니스 영역을 한 단계 확장했다."
-CDP사업에 진출했다는데, CDP란 무엇인가?
"CDP는 클라우드 데이터 플랫폼(Cloud Data Platform)의 약어다. 업계 용어가 아니고 우리가 만든 말이다. 이 분야에서 클라우데라라는 미국계 글로벌기업이 유명하다. 그러다보니 CDP를 클라우데라 데이터 플랫폼이 아니냐고 하는 사람들도 있다(웃음). ‘C’는 클라우데라가 아닌 클라우드로 CDP는 클라우드 데이터 플랫폼이란 뜻이다. 데이터를 클라우드에 올려 플랫폼화했다는 의미로 지었다."
-CDP가 무엇인지 설명해달라
"기존에 구축형으로 공급하던 빅데이터 플랫폼인 '테라원'을 클라우드 형태로 제공하는 것이다. 기존의 데이터 플랫폼은 고객에게 직접 설치하는 형태가 많았다. 이럴 경우 직접 설치부터 서버 도입 등 복잡한 작업들이 있다. 또한 데이터가 많아짐에 따라 추가로 비용이 들어가는 부분도 있었다.
클라우드 형태로 플랫폼을 옮길 경우, 데이터 플랫폼이 데이터 양에 따라 자동으로 커지고(오토스케일링) 합쳐진다. 이에 따른 복잡한 데이터 처리 및 설치 과정이 생략된다. 데이터스트림즈는 클라우드의 장점을 최대한 살린 CDP, '테라원 V4.0’ 플랫폼을 개발해 출시했다.”
-클라우드형인 '테라원 V4.0'의 특징을 말해준다면
"기술적으로 클라우드 네이티브라는 트렌드를 반영했다. 기반 기술 자체가 컨테이너다. 그래서 일반적으로 서버를 늘려 스케일 아웃하는 형태가 아니라 컨테이너를 늘려 쉽게 스케일 아웃하는 방식의 기술을 적용했다. 이를 오토스케일링이라 한다. 데이터 플랫폼에서 속도를 유지하면서 컨테이너 기반으로 오토스케일링을 하는 것은 기술적으로 의미가 크다."
-CDP를 사용하면 좋은점은? 어떤 고객들이 '테라원 V4.0'을 사용하면 좋나
"데이터스트림즈의 CDP는 특정 클라우드에 종속되지 않는다. 고객이 어떤 클라우드 환경을 선택하더라도 설치 및 운영이 가능하다. 특히, 고객이 이미 온프레미스를 구축한 상태에서 특정 업무를 클라우드로 사용하는 하이브리드 클라우드를 구축 하려고 할 때 ‘테라원 v4.0’을 도입하면 클라우드 업체에 종속되지 않기 때문에 고객 주도형의 시스템 사용이 가능하다.
또한, ‘테라원 V4.0’을 사용하는 클라우드에서 다른 클라우드로 이전이 필요 할 경우 자유롭게 클라우드 이동이 가능해 비용 측면 및 자율성에서 장점이 있다. 클라우드 업체를 통한 서비스를 받기 힘든 중소기업의 경우 데이터스트림즈가 자체적으로 구축한 CDP를 사용하면 저비용으로 시스템을 사용할 수 있다."
-데이터스트림즈는 빅데이터 플랫폼 '테라원(TeraONE)'이 유명하다. '테라원'은 버전별 어떤 특징이 있나
"테라원은 현재 버전4(V4)까지 나와있다. 첫 버전(V1)은 2014년 8월 출시했고 하둡(Hadoop) 기반의 국내 첫 데이터 플랫폼이라는 특징이 있다. ETL(Extract, Transform, Load)과 강력히 통합된 고성능의 데이터 수집이 장점이다. 버전2(V2)는 2016년 8월 선보였다. 데이터 거버넌스 융합 통합 데이터 플랫폼으로 빅데이터 데이터 관리 정책과 표준화, 품질관리 면에서 돋보인다.
버전3(V3)은 2018년 8월 출시했다. 통합관리 및 모니터링 자동화를 구현했고, 처음으로 데이터 패브릭 아키텍처를 지원함과 동시에 데이터 가상화도 구현했다. 최신 제품인 버전4(V4)는 올 8월 내놨다. 클라우드에 최적화한 PaaS 데이터 플랫폼으로 퍼블릭 클라우드와 프라이빗 클라우드 모두를 지원한다."
-테라원 버전4는 AWS나 마이크로소프트 애저, 또 국내 CSP들이 모두 사용할 수 있는 벤더 독립적인 제품인가?
"그렇다. 우선 AWS 마켓에 올리기 위해 위해 준비하고 있다. 이번달 이 작업이 완성될 듯 하다. AWS 탑재를 마무리하면 국내 기업과 다른 글로벌 기업에도 순차적으로 탑재할 계획이다. 내년 말까지는 국내외 CSP 마켓에서 사용할 수 있게 할 계획이다. 올해는 AWS 한 곳만을 목표로 하고 있다."
-테라원 버전4의 이런 기술은 국내 기업으론 처음인가?
"국내 기업으로 최초인지 모르겠지만 쉽지 않은 기술이다. 컨테이너 기반으로 준비한 게 4~5년은 되는 것 같다. 기존에 우리가 갖고 있던 분석 플랫폼인 '이데아'의 기술 기반을 바탕으로 '테라원'을 데이터 플랫폼까지 확장했다. 데이터 입장에서 분석을 할 수 있는 데이터도 컨테이너 기반의 PaaS로 가야한다고 생각해 개발을 추진했고 출시하게 됐다."
-PaaS 플랫폼을 표방한 제품이 꽤 된다. 다른 제품과 어떻게 다른가?
"현재까지 국내에 나와 있는 PaaS 플랫폼 중 데이터 기반 PaaS 제품은 우리 외에 없는 것으로 알고 있다. 컨테이너 기반의 PaaS는 우리가 처음이라고 생각한다. 기존의 PaaS는 대부분 응용 서비스를 만드는데 치중했다. 즉, 애플리케이션 개발을 위해 PaaS를 많이 사용했다. 당국에서 만든 '파스타(Paas-TA)'도 마찬가지다. 기존 PaaS는 대부분 애플리케이션을 개발하는 도구들을 지원하는 PaaS다. 반면 우리 '테라원'은 데이터를 관리하고 데이터를 쉽게 다루고 응용할 수 있도록 지원해주는, 그야말로 플랫폼 기반이다. 응용 프로그램을 개발하기 위한 PaaS는 우리가 후발주자이기에 지금부터 따라가도 기존 후발주자를 넘기 힘들다. 그래서 23년간 해온 우리의 데이터 관리 기술을 기반으로 한 데이터 활용 사업에 새롭게 나섰다. PaaS 중 클라우드 컨테이너 기반은 우리 제품이 처음이다.”
-외산 제품은 어떤가? 컨네이터 기반 PaaS가 있나?
"외산은 컨테이너 기반의 오토스케일링이 되기는 한다. 하지만 데이터 기반이라기보다 DBMS 기반이다. 또 외산은 우리 제품처럼 컨테이너 기반이고 데이터 증가에 따른 자동 스케일링이 가능한데 우리와 다른 점도 있다. 예를 들어 스노우플레이크는 클라우드형 DW에 포커스가 맞춰진 데이터 웨어하우스다. 데이터 웨어하우스를 구축하는 데 특화한 데이터 플랫폼이라고 생각하면 된다. 이는 DW 기반 데이터베이스 구축과 데이터 분석은 잘하지만 비정형 데이터가 포함된 빅데이터를 분석하기 위한 분석 애플리케이션에는 약하다는 단점이 있다. 성능이 비슷해 보이지만, 우리는 데이터 기반이기에 데이터 웨어하우스의 단점을 극복하고 더 넓은 활용성을 가지고 있다.
클라우데라도 비슷하다. 기존에 있는 빅데이터 여러 기술을 PaaS 형태로 활용할 수 있게 해주는 데이터 플랫폼이 클라우데라인데 이 컨셉은 우리와 비슷하다. 클라우데라와 컨셉은 비슷하면서도 국내 시장에서는 국내 CSP와 협업이 더 잘되는 등 우리가 여러모로 유리한 면이 있다. 빠른 기술 지원 등 글로벌 테크기업에 비해 로컬 기업이 갖는 장점을 우리는 갖고 있다."
-클라우드로 넘어오면서 기존 로컬기업이 갖고 있던 장점인 빠른 기술 지원이 점점 퇴색하는거 아닌가?
"아직까지 그렇지 않다. 빠른 기술지원은 로컬기업이 갖는 여전히 큰 장점이다. 국내 기업 중 외산제품에서 우리 제품으로 바꾼 고객들은 항상 빠른 기술지원을 언급한다. 물론, 계속해서 빠른 기술 지원을 장점으로 내세우는 것은 한계가 있다. 이에 따른 추후 준비도 진행하고 있다. 글로벌에서 보면 국내 시장 규모가 크지 않다. 글로벌 전체 시장의 1% 안팎이다. 국내는 물론 글로벌 고객을 사로잡기 위해 기능적인 장점을 가지고 글로벌 기업과 경쟁할 것이다.”
-국내 CSP들과 협업중이라던데...
"국내에서 처음으로 CDP라고 하는 클라우드 개념의 데이터 플랫폼을 만들었다. 기존 CSP기업은 응용 프로그램 쪽에 특화돼 있는 경우가 많다. 우리 제품은 이 단점을 극복했다. 국내나 해외 CSP들이 우리 회사에 관심을 보내는 이유다. 기존엔 데이터를 어떻게 가지고 오는지가 중요했지만, 지금은 데이터들을 가지고 어떻게 활용할지, 또 어떤 프로그램을 만들지가 더 중요해졌다. 고객은 데이터만 있으면 뭐든 만들어낼 수 있을 거라 생각하기 때문이다. 데이터스트림즈는 지금까지 데이터 관리 기술 기반으로 한 데이터 활용에 집중했고 이 방향으로 성장했다. 우리가 갖고 있는 컨셉은 데이터 기반 플랫폼이다. 그렇기에 이 부분을 중심으로 함께 협업해 나가면 CSP들이 절대 손해보지 않고 경쟁력을 높일 수 있을 거라 생각한다."
-클라우드 산업에 대한 전반적인 조망을 한다면
"데이터 기반 서비스도 클라우드 기반으로 시장이 변할 것으로 예상했고, 이에 발맞춰 데이터스트림즈는 클라우드 네이티브 기술기반을 오래전부터 준비해왔다. 그 시작이 지난해 선보인 '테라원 이데아'였고 이번 ‘테라원 V4.0’ 출시도 이 계획의 일부다. 앞으로 2년내 주력 제품을 모두 클라우드로 전환할 예정이고, 이를 통해 클라우드 환경의 데이터 기반 비즈니스를 선도하겠다."