“다양한 데이터를 모을 수 있지만 정말로 필요한 데이터, 비즈니스 인사이트를 도출하는 데이터는 많지 않다. 이것을 찾는 게 핵심이고 데이터사이언티스트의 역할이다.”
데이터스트림즈 이상옥 본부장은5일 지디넷코리아가 개최한 제13회 어드밴스드컴퓨팅컨퍼런스(ACC)에서 이같이 밝혔다.
그는 “빅데이터는 엄청난 데이터를 갖고 분석에 들어갈 것 같지만, 현장에선 적당한 데이터, 꼭 필요한 데이터면 충분하다”며 “단, 처음엔 어떤 데이터가 원하는 목적 달성에 필요한지 잘 모르기 때문에 이런저런 데이터를 다 끄집어와서 분석하고, 범위를 좁혀서 핵심 데이터를 추려 인사이트를 도출하게 된다”고 설명했다.
그는 빅데이터 프로젝트 프로세스를 설명하면서, 중요 부분을 짚었다. 전략세우기, 지표 및 데이터평가, 데이터분석, 결과보고, 비즈니스 및 의사결정 변환 등이다.
그는 “빅데이터 프로젝트 프로세스르를 보면, 성과를 자신하지 못하고 책임추궁을 걱정해 주저한다”며 “삼성카드, 신한카드 모두 빅데이터팀을 만들어 놓고도 실제 사업을 하지 못하고 있는데, 잘못 투자하면 성과를 낼 수 없기 때문”이라고 말했다.
그는 “빅데이터 프로젝트 현장에 가면 고객의 현업 담당자는 빅데이터 전문가라며 과제를 발굴해달라고 요구하는데, 사실 과제란 게 업무와 비즈니스를 모르면 만들어낼 수 없다”며 “무조건 다 맡길 게 아니라 같이 협력해서 많은 업무를 줘야 좋은 과제와 모델, 알고리즘이 나오게 된다”고 덧붙였다.
관련기사
- 알서포트 "전문가 손길이 누구에게나 닿게 하라"2016.07.05
- 포시에스 "비대면 금융상품가입-원격창구 운영 현실로"2016.07.05
- "스트리밍 데이터 처리, 하나로"2016.07.05
- “데이터 시각화, 데이터와 대화하는 방법”2016.07.05
그는 얻고자 하는 것을 인식하고, 적더라도 높은 품질의 데이터를 확보해야 한다고 강조했다. 아무리 양이 많아도, 품질을 확보하지 못하면 잘못된 결과를 낳을 수 있다는 얘기다.
그는 “데이터사이언티스트는 메이븐, 중간 매개 역할자 라고도 하는데, 많은 데이터와 수많은 분석가 중에서 어떤 데이터로 어떻게 분석해 통찰력을 얻을 것이냐를 담당한다’며 “아무리 훌륭한 기술과 시스템, 데이터를 가져도 새로운 비즈니스를 도출해 내야 의미가 있다”고 강조했다.