"모든 기업이 데이터 기반 비즈니스 의사결정을 내리길 원한다. 그런 데이터중심(data-driven) 문화를 가지려 한다. 말이 쉽지, 실행하긴 어렵다. 데이터 폭증, 데이터 품질, 데이터를 다루려는 이들의 스킬, 3가지가 얽힌 복잡한 문제를 해결해야 한다."
지오바니 카라로(Giovanni Carraro) IBM 하이브리드 클라우드 비즈니스 애널리틱스 디렉터는 최근 기업의 데이터 활용 전략 관련 문제와 해법을 주제로 한 미디어 그룹 인터뷰 자리에서 이같이 말했다. 그는 데이터의 중요성과 활용 가능성으로 운을 뗐다.
"데이터중심 문화를 통해 비즈니스 성과를 개선할 수 있다. 이런 문화가 있다면 제조업은 공급망을 최적화해 재고 비용을 낮추려 할 것이다. 통신사는 망 가입자 성향을 분석해 이탈 가능성이 높은 고객을 대상으로 그걸 방지하는 선제적인 캠페인을 벌일 것이다."
모두가 데이터 기반 의사결정으로 성과 개선 효과를 얻으려 하지만 아무나 성공하지는 못한다고 지적했다.
"데이터는 새로운 경쟁력의 원천이다. 모두 그걸 안다. 데이터중심적인 문화와 의사결정 체제를 원하는 이유다. 하지만 실제로 그에 성공하는 기업은 소수다. 셋중 하나 꼴이라는 통계가 있다. 말이 쉽지 실행하긴 어렵다. 복잡한 문제다. 3가지 문제가 있다."
데이터 기반 의사결정을 복잡하게 만드는 3가지 문제는 데이터 폭증, 데이터 품질 저하, 데이터를 취급하는 기업내 당사자의 스킬 부족으로 요약됐다.
"데이터 폭증은 다양한 출처와 형태로 데이터가 만들어지는 현상 차원 문제다. 사물인터넷 기기를 통해 많은 데이터가 발생하고 있는데 그 모든 데이터의 0.5%만이 분석되고 있는 실정이다.
그리고 기초 데이터 품질이 나빠서 데이터를 분석하려는 사전 준비에 생각보다 많은 시간을 써야 한다. 더불어 그런 데이터가 신뢰할만한 의사결정을 내리기 적절할만큼 보안이 갖춰졌는지도 봐야 한다.
또 데이터를 취급해 의사결정을 내리려는 현업 전문가 수는 점점 늘고 있는데, 그들이 모두 직접 데이터를 다룰 스킬을 충분히 갖춘 건 아니다. 과거엔 소수 '파워 유저'와 통계학자, 분석전문가들만 데이터를 관리했다면 이제는 조직내 마케팅부터 세일즈까지 어느부서든, 직원부터 경영진까지 어느 레벨이든 그걸 한다. 불충분한 스킬의 '일반 유저'들이 분석한 내용으로 신뢰할만한 의사결정을 할 수 있느냐도 관건이다."
3가지 문제를 해결하려면 의사결정 재료인 데이터를 단순화하고 스킬이 부족한 일반 유저들도 다룰 수 있는 접근성을 제공할 환경과 도구가 필요하다는 설명이 이어졌다.
"데이터를 단순화하고 접근 가능하게 만들어 의사결정을 쉽게 내릴 수 있도록 도와야 한다. 형태와 종류에 무관하게 모든 출처의 데이터를 수집하고 단일 버전의 진실(single version of the truth, SVOT)로 모은 다음 그걸 분석하고 활용할 수 있는 역량을 제공해야 한다. 여기에 머신러닝과 AI로 일반 유저도 신뢰할 수 있는 의사결정을 돕는 툴을 지원할 수 있다."
SVOT란 IT기반 비즈니스 환경에서 분석용 데이터 뭉치의 가장 이상적인 상태를 뜻하는 개념이다. 이 상태에선 분석 목적으로 수집한 모든 최신 데이터가 중복 없이 한 곳에 있어 그것만으로 필요한 분석 작업을 수행 가능하다.
IBM은 자신들의 솔루션으로 SVOT 상태의 데이터에 기반한 의사결정을 지원한다고 주장한다. 카라로 디렉터가 총괄하는 IBM 애널리틱스 사업부에서 지난 5월말 정식 출시한 IBM 클라우드 프라이빗 포 데이터(IBM Cloud Private for Data)라는 통합 데이터서비스 솔루션이 그 역할을 한다는 설명이다.
IBM 클라우드 프라이빗 포 데이터는 기업 IT인프라 안팎의 여러 데이터처리시스템과 외부 출처 데이터를 수집해 단일 저장소에서 보여주며 개별 담당자가 의사결정에 그 분석 결과를 활용할 수 있는 도구를 제공한다. 카라로 디렉터는 그 특징을 이렇게 표현했다.
"제품별로 제각각 존재했던 분석관련 기술을 매끄럽게 통합했다. IBM클라우드프라이빗(ICP) 플랫폼에 통합된 기술로 기업 의사결정에 필요한 데이터를 효과적으로 수집, 정제, 분석할 수 있다. 정형이든 비정형이든, 그 저장장소가 온프레미스든 프라이빗클라우드든 퍼블릭클라우드든 무관하다. 현업의 목표에 연계된 SVOT를 만들어내는 데이터 정제를 수행한다. 스킬이 부족한 비즈니스 사용자도 이를 활용해 분석을 수행할 수 있는 더 스마트한 기술을 제공한다."
ICP는 IBM 클라우드 프라이빗 포 데이터와 별개 솔루션이다. ICP는 IBM 퍼블릭클라우드와 유사한 IT환경을 기업 데이터센터에 제공하는 프라이빗클라우드 구축 솔루션이다. 서비스형인프라(IaaS)를 제공하는 여타 프라이빗클라우드 솔루션과 달리 서비스형플랫폼(PaaS) 역할을 한다는 게 주된 특징이다. 작년 11월 국내에 정식 출시됐다.
좀 더 엄밀하게 표현하자면 IBM 클라우드 프라이빗 포 데이터는 ICP 플랫폼을 기업용 '데이터서비스' 목적에 맞춰 사전 구성, 최적화, 테스트된 시스템 하드웨어 및 소프트웨어와 각종 데이터 처리 및 관리 도구 패키지를 통합한 형태다. 즉 ICP의 프라이빗 클라우드 PaaS를 활용해 여러 IBM 데이터 수집, 정제 프로세스와 분석 소프트웨어 기능을 묶어 제공하는 게 IBM 클라우드 프라이빗 포 데이터다.
IBM 측 설명에 따르면 IBM 클라우드 프라이빗 포 데이터가 제공하는 분석 기술 가운데 일부는 '데이터사이언스익스피리언스(Data Science eXprience, DSX)'와 유사하다. 완전히 동일하지는 않다. IBM 클라우드 프라이빗 포 데이터는 컨테이너 기반 서비스를 염두에 두고 구성된 ICP 플랫폼 기반 기능이고, DSX는 IBM 인티그레이티드 애널리틱스 시스템(IIAS)이라는 최신 DW어플라이언스에 내장된 SW패키지다.
관련기사
- [전문가 진단] 컨테이너 오케스트레이션2018.07.18
- IBM-레드햇, 컨테이너 손 잡았다2018.07.18
- 클라우드 전환기, IBM의 승부수 ‘컨테이너’2018.07.18
- 한국IBM "인간 대체하려고 AI 도입하지 마시라"2018.07.18
카라로 디렉터는 미국 화물운송업체 '플릿프라이드'가 IBM 클라우드 프라이빗 포 데이터를 도입한 첫 분기 매출을 크게 높였다고 소개한 뒤, 데이터를 비즈니스 의사결정에 활용하는 시나리오에는 밟아야 할 단계가 있다고 언급했다.
"기업의 (데이터중심 문화) 성숙도에 따라 고도화할 수 있다. 처음에는 잘 수집된 신뢰가능한 데이터를 기반으로 삼고 정제하는 단계라면, 그 다음이 분석 단계다. 더 발전시키면서 분석 과정에 머신러닝과 AI를 적용하는 단계로 나아갈 수 있다. 여기서 A는 인공(artificial)이 아니라 증강(augmented)의 줄임말이다. 부족한 사용자 스킬을 강화해 인간과 기계의 장점을 결합할 수 있게 해준다는 뜻이다."