구슬이 서말이라도 꿰어야 보배라 합니다. 물리적 데이터가 쌓여야만 빅데이터가 아니라 자산화할 수 있는 결과를 도출할 수 있어야죠. 그래서 용량, 속도, 다양성이란 3V에 가치(value)를 더한 4V가 제대로 된 빅데이터의 정의라 할 수 있습니다.
기업들이 빅데이터 시대에 대응하기 위한 고성능컴퓨팅(HPC) 분석플랫폼 전략이 제시됐다. 비즈니스 분석 솔루션 전문업체 SAS코리아가 다루기 까다로운 빅데이터를 가치화할 수 있도록 처리할 플랫폼과 그 과정을 지원할 프로세스의 필요성에 방점을 찍었다.
기존 데이터 처리 기술과 분석 모델로 빅데이터에 대응할 경우 처리, 결과, 적재 속도가 매우 느립니다. 전체 프로세스를 지원할 수도 없죠. 단순한 비즈니스 인텔리전스(BI) 플랫폼이 아닌 고도화된 분석과 통합된 프레임워크가 필요합니다. 비즈니스 분석을 위한 전문 조직도 갖춰야 합니다.
SAS코리아의 고준형 부장은 15일 제7회 ACC 행사장에서 이같이 밝히며 빅데이터 분석을 위한 기업 전략과 BI를 넘어선 '어드밴스드 애널리틱스' 대응 시나리오를 소개했다. 이는 의사결정을 위한 예측, 가시성을 위한 데이터마이닝, 의미 파악을 위한 텍스트분석, 기업목표 달성을 위한 최적화 등 정보를 관리해 그 가치를 가시화하는 통합 분석기술로 묘사된다.
고 부장은 성공적 분석은 전략 기획, 고객 타겟팅, 위험 관리, 영업, 운영 등 비즈니스를 수행하는 전사 업무단계 전반에 필수 요소라며 전략적 정보 관리를 유기적으로 지원해 정보 거버넌스로 아우르는 데이터 관리, 의사결정 관리, 분석 관리 역량을 갖춰야 한다고 설명했다.
그에 따르면 전통적인 분석프로세스는 데이터 탐색, 모델 개발, 모델 배포로 구성된다. 개별적으로 단계별 솔루션을 투입해야 하고 실시간성이 떨어져 잘해야 하루 전 데이터에 대한 분석 결과를 다음날 받아내는 정도를 '양호한 시스템'으로 쳐줬다.
SAS는 여기에 그리드컴퓨팅을 도입해 성능과 처리속도 문제를 해결하고 마케팅 등 경영의사 결정에 필요한 결과 도출 시간을 최소화할 수 있다고 강조한다. 이에 따라 HPC기반의 어드밴스드 애널리틱스 사례 5가지와 이를 달성하는데 적용한 SAS 기술 플랫폼 기능 5가지를 소개했다.
카탈리나 마케팅이 2.5페타바이트 고객데이터를 60초만에 분석한 '통계'사례, HSBC가 샘플링이 아닌 전체 데이터를 분석해 실시간 스코어링을 통한 사기범죄 예방을 한 '데이터마이닝' 사례, SAS 하이퍼포먼스 리스크컴퓨팅을 통해 몇분만에 리스크량을 산출하거나 석유가격정보 현황과 실시간 변동에 따른 추세를 파악해 보여주는 오피넷 등 '예측' 사례, 페이스북 트위터 등 웹페이지와 반구조화된 PDF와 워드 등 문서를 다루는 '텍스트애널리틱스' 사례, 유통브랜드 메이시가 수익을 극대화하기 위해 주력영역을 정의한 '최적화' 사례가 제시됐다.
SAS가 제시하는 빅데이터 분석을 위해 제안하는 수명주기 모델은 문제를 인식한 시점부터 데이터를 준비, 탐색, 선택과 변환, 모델 구축, 모델 검증, 모델 배포, 이를 평가하고 결과를 모니터링, 개선점 도출과 새로운 문제를 인식하는 단계로 순환한다. 업무 전문가나 의사결정권자가 프로세스, ROI를 평가하고 비즈니스 분석가가 데이터 탐색과 시각화를 진행한다. IT시스템 관리 담당자는 데이터 준비와 모델 배포, 검증, 감시를 수행하며 마이닝 전문가는 분석 탐색과 예측모델링을 맡는다.
SAS는 기업들에게 향후 고성능 분석기반이 반영된 전사 통하 아키텍처로 데이터소스부터 사용자도구에 걸친 전사적 분석 환경을 추진할 것을 제안한다. 이를 위해 소개된 SAS의 HPC 분석 모델은 SAS 인메모리컴퓨팅, 인DB컴퓨팅, 고가용성(HA) 인프라와 그리드컴퓨팅으로 요약된다.
관련기사
- [제7회 ACC]SK텔레콤, 소셜데이터로 기업활동 지원2012.02.15
- [제7회 ACC]빅데이터 분석 '무엇을-왜-어떻게'2012.02.15
- [제7회 ACC]맥주는 많이 팔렸지만 수익은↓2012.02.15
- [제7회 ACC]“빅데이터는 개인의 창의성에 달렸다”2012.02.15
SAS 인메모리 컴퓨팅은 테라데이타, EMC 그린플럼 등 기반의 확장가능한 서버, 스토리지, 스위치, 운영체제(OS), DB, 일체형 데이터웨어하우징(DW) 시스템 위에 SAS 통계, 마이닝 소프트웨어를 돌려 수행된다. 인DB컴퓨팅은 데이터 준비와 비즈니스분석, 모델 배포를 수행하는 SAS 메타데이터 서버 기반 전사DW와 리포팅, 모델 개발 환경 등으로 구성된다. SAS 그리드컴퓨팅은 관계형DB와 SAN 인프라의 데이터 계층부터 고가용성(HA) 그리드 서버 계층, SAS메타데이터 서버로 된 메타데이터 계층과 SAS 리포팅, 대시보드 등 웹 계층에서 클라이언트 계층까지로 이뤄졌다.
고 부장은 SAS HPC 환경에 대해 비즈니스 관점에서 신속한 의사결정을 지원해 경쟁 우위를 선점할 수 있는 정확하고 결단력있는 결과를 제시한다며 또 IT관점에서 뛰어난 성능, 확장성을 보장하며 자원 사용을 최적화하고 데이터 거버넌스를 효율화한다고 주장했다.