"데이터사이언스, 애플리케이션에 녹여라"

컴퓨팅입력 :2015/08/27 16:28

하둡플랫폼 업체 피보탈이 데이터사이언스 관점에서 산업별 애플리케이션 구현 사례와 방안을 제시했다. 피보탈은 데이터랩 조직에서 데이터사이언스 역량을 내재화하고 싶어하는 기업들에게 필요한 자원과 노하우를 보조할 수 있다는 메시지를 곁들였다.

구태훈 피보탈코리아 상무는 지디넷코리아가 27일 서울 잠실 롯데호텔에서 개최한 제12회 어드밴스드컴퓨팅컨퍼런스(ACC)에서 '데이터사이언스 기반의 빅데이터 어플리케이션 구현 방안'이란 주제로 강연을 진행했다.

그는 기업의 고객 참여를 달성케 해주는 소프트웨어, 특히 인사이트와 애플리케이션 서비스를 실현하는 지능형 소프트웨어가 금융, 교통, 엔터테인먼트, 홈오토메이션, 농업, 여행 등 분야를 막론하고 핵심가치로 부각되고 있다고 지적했다.

구 상무는 "산업구조가 소프트웨어와 데이터에 대한 인사이트와 주도역량을 통해, 데이터 분석능력과 그걸 서비스할 애플리케이션을 만들 수 있는 능력에 따라 사업 성패가 갈리는 쪽으로 움직이고 있다"며 "과거에 어땠는지가 아니라 불확실한 미래를 어떻게 예측하고 대응할지 판단할 수 있느냐가 관건"이라고 강조했다.

구태훈 피보탈 상무

지능형 시스템이 미래 예측의 핵심으로 언급됐다. 사람의 신체구조처럼 감각기관과 판단할 두뇌와 운동신경 및 근육을 갖춘 게 지능형 시스템으로 묘사된다. 물리적으로는 센서(Sensors), 분석플랫폼(Brain), 구동장치(Actuators)로 대응된다.

스마트헬스케어 업체 얼라이브코어의 사례를 보면 이용자는 자신의 심박수와 같은 신체정보를 모두 온라인으로 전달한다. 예측이나 모니터링이 되는 징후가 있을 때 자신에게 메시지가 전달되는 서비스다. 관련 시술을 받아 생명의 안위를 걱정해야 하는 당사자에게는 매우 중요한 애플리케이션이다. 이런 서비스의 정확도가 사업의 성패에 대단히 중요할 것임을 부인할 수 없다.

구 상무는 "데이터를 모으고 쌓으면 가치가 만들어지는게 아니므로 모아서 어떤 애플리케이션을 만들 것이냐, 어떻게 소프트웨어화해서 데이터를 쓸 거냐는 물음을 갖고 답을 찾아야 한다"고 조언했다.

이어 디지털 은행, 커넥티드카, 스마트공장, 모의시장, 시장세분화 등 산업 영역별로 데이터사이언스 기반의 빅데이터 애플리케이션이 어떤 양상으로 구현되고 있는지에 대해 소개했다.

나라마다 차이는 있지만 1년에 은행에 방문하는 횟수는 3번, 세계 평균은 2번에 불과하다. 반면 디지털 은행에는 하루에도 수십번씩 들를 수 있게 된다. 이를 서비스할 금융 애플리케이션의 힘 역시 데이터에 있다. 구글, 링크드인같은 업체들이 채택한 '마이크로서비스' 형태의 빠른 기획, 개발, 서비스 역량을 갖춰야 한다. 5년주기로 도래하는 금융권 차세대 인프라 구축사업은 이런 요건에 맞지 않다.

시스템상 필요한 기능을 꼽자면 계약, 정산, 여신 등 개인금융에도 데이터기반 차별화 서비스가 필요하다. 고객평가, 신용평점 등 실시간 마케팅 참조시 위치기반 데이터도 동원될 수 있다. 자산관리, 가계부 등에 특화된 개인별 관리 기능을 제공할 수도 있다. 직불카드, 신용카드, 소액결제 등 지급결제 대행업무를 다채널로 구현해야 할 요건도 생긴다. 사기탐지 역시 실시간 대응이 필요해진다.

커넥티드카는 자동차산업의 승부처다. 포드의 커넥티드카 인프라가 예시로 나왔다. 빅데이터 플랫폼과 클라우드 인프라의 결합이 핵심이었다. 호튼웍스 하둡, 스파크, 젬파이어와 호크, SAS 분석 플랫폼과 래빗MQ로 구성된 데이터플랫폼 그리고 포드 자체 서비스와 노드JS, 자바, 루비 등 언어 기반 서드파티 서비스와 연계되는 클라우드 인프라가 받쳐주는 환경이다.

플랫폼은 과거 운행 기록을 기반으로 단시간내 학습을 수행하고 주행중인 차량의 목적지와 운행범위를 예측, 적절한 주유시점 및 장소를 포함한 경로 추천을 할 수 있어야 현실세계에서 쓸만한 애플리케이션으로 인식될 만하다. 피보탈은 이런 플랫폼을 만들 때 크게 분석서버에 데이터를 담는 데이터 팀, 분석하는 팀, 애플리케이션을 만드는 팀, 3가지 조직을 구성해 투입했다.

다음으로 스마트공장에 초점을 맞춘 생산시스템의 빅데이터 기반 혁신 사례로 GE의 플랫폼 얘기가 나왔다. GE는 우선 항공, 에너지관리, 헬스케어, 정유가스, 발전, 교통 등 GE 사업분야별 플랫폼을 '프레딕스'라는 이름으로 전사 통합해 기계, 네트워크, 서버, UX 공통 아키텍처 기반 플랫폼을 구축하고 업종별 자산과 운영을 최적화하는 솔루션을 갖추고자 했다.

프레딕스 아키텍처는 산업용 클라우드, 데이터패브릭서비스, 코어서비스, 분석서비스, 애플리케이션서비스 계층으로 구성됐다. 피보탈의 클라우드파운드리, 호크, 스프링, 젬파이어 스파크 등 솔루션 스택과 GE 소프트웨어COE 조직의 자체 역량을 녹인 시스템이 조합됐다. 이런 인프라가 돌아갈 수 있도록 데이터사이언스 역량 강화 차원의 대규모 소프트웨어 및 물리학자 인력 채용이 함께 진행됐다.

유통 분야에선 정성적, 정량적 예측 모형에 기반한 매출 시뮬레이션을 돌리는 방법이 큰 관심사다. 피보탈은 특정 제품 유통 시장에 조건을 입력해, 데이터 기반으로 시나리오의 결과를 예상해 보고 어떤 행동이 매출을 얼마나 올릴 것인지, 어떤 고객 반응을 이끌어낼 것인지 파악할 수 있게 했다.

피보탈 측은 기존 분석은 과거 데이터를 보고 의사결정을 하는 것인데, 앞으로는 미래를 예측해 의사결정을 해야 한다는 점을 강조했다. 이를테면 매출 시뮬레이션에선 상품에 대한 속성으로 점포이력이나 기후정보 등 과거에 다루지 않았던 요소까지 함께 고려해 대응하는 혼합모형을 개발해야 한다는 것이다.

이밖에 통신산업에서 모바일 기기나 웹, TV 등으로 수집한 데이터에 기반해 고객행동 세분화 항목을 기존 고객세분화 유형에 연계해 더 미세하게 세분화할 수 있는 방법이 제시됐다. 어떤 기기를 갖고 어떤 연령대의 가족 구성원들이 속한 가구인가 등 정적인 정보로 나뉘었던 고객군을, 어떤 콘텐츠 소비행태를 보이는지 알기 위해 고객 행동 이력을 분석하는 방법이다.

구 상무는 "이런 행동 기반 분석은 통신사뿐아니라 삼성전자같은 모바일 기기 및 TV 제조사도 하고 있는 방법"이라며 "기존 세분화 기준에 행위 기반 세분화 항목이 늘어날수록 고객들은 더 잘게 나뉘고, 이 조건에 맞춰 제공되는 애플리케이션 서비스가 구현되고 있다"고 설명했다.

관련기사

이어 구 상무는 피보탈이 제공할 수 있는 데이터사이언스 관련 서비스를 소개했다. 기업들은 애플리케이션에서 시작해 데이터를 생성, 이 데이터를 분석해 빠른 처리와 확장성을 확보하고 애플리케이션 기능을 제고하는 분석을 수행, 이후 새로운 기술과 솔루션을 기반으로 혁신적인 비즈니스 가치를 실현한다. 여기서 피보탈은 데이터를 분석하는 과정을 돕는 역할에 초점을 맞추고 있다.

피보탈의 데이터사이언스와 데이터엔지니어링 조직이 결합된 '피보탈데이터랩'에서 관련 업무를 수행 중이다. 어떻게 하면 기업 안에 데이터사이언스 역량을 확보할 수 있겠느냐는 물음에 초점을 맞춰 교육을 진행하고, 기업 내부 문제 해결을 시도하는 시범과제와 인사이트를 얻기 위한 분석과제를 함께 진행하고, 데이터 현황 진단과 아키텍처 설계를 돕는 플랫폼 자문 역할도 제공한다는 설명이다.