빅데이터를 활용하려는 기업들의 고민이 깊어가고 있다. 모바일 기기, 소셜네트워크서비스(SNS) 확산으로 기업이 처리해야 할 데이터들이 폭증하고 있지만, 막상 빅데이터를 활용하려고 하면 무엇부터 시작해야 하는지 모르는 경우가 많다.
심지어 기업들의 IT 관련 예산은 점점 떨어지거나 유지되지만, 빅데이터의 관리, 분석에 대한 요구는 점점 높아만 지는 상황이다.
이런 가운데 빅데이터를 활용하려는 기업을 위한 실전 조언이 나왔다. 데이비드 A. 차파 퀀텀 부사장은 12일 메가뉴스 지디넷코리아가 주최한 제8회 ACC에서 기조연설을 통해 효율적인 빅데이터 관리를 위한 네 가지 기준을 제시했다.
그가 제시한 빅데이터 관리 기준은 총 네 가지다. 기업들이 빅데이터 환경에서 폭증하는 데이터를 효율적으로 관리하기 위해서는 일정한 기준이 필요하다는 설명이다. 구체적으로는 데이터 동등성, 데이터 분류, 데이터 보관, 데이터 아카이브 등이다.
차파 부사장은 “이미지나 동영상 등 비정형화된 데이터가 폭증하고 있다”며 “적합한 기술로 데이터 증가를 관리하는 것이 기업의 당면 과제가 됐다”고 말했다.
우선 데이터 동등성은 모든 데이터를 동일하게 다뤄서는 안 된다는 의미다. 핵심적인 데이터와 덜 중요한 데이터를 구분해야 된다는 설명이다. 차파 부사장은 “내 가족사진을 가장 비싸고, 가장 빠른 스토리지에 저장할 필요가 없는 것과 마찬가지”라는 예를 들었다.
데이터 분류는 가치에 따라 저장 장소를 결정하는 것이다. 사실 기업 입장에서는 이미 저장된 데이터가 많이 때문에 가장 힘든 작업이 될 수도 있지만, 최종 결과 측면에서 봤을 때는 훨씬 효율적인 관리가 가능하다.
차파 부사장은 “데이터 동등성과 분류 기준을 충족하기 위해서는 스토리지 티어링이 필요하다”며 “데이터 종류와 가치에 따라 다른 수준의 스토리지가 필요한 것”이라고 말했다.
데이터 보관은 단순 보유에 국한되는 것이 아닌 삭제까지 포함하는 개념이다. 일반적 기업은 데이터를 축적하려는 경향 때문에 삭제가 쉽지 않지만, 한정된 예산과 스토리지를 감안하면 삭제 시점에 대한 판단을 내리는 것이 중요하다는 얘기다.
마지막은 데이터 아카이브다. 시장조사업체 ESG은 지난 2010년 디지털 아카이브에 저장된 데이터는 33페타바이트에 달했으나, 오는 2015년에는 33만 페타바이트가 저장될 것으로 내다봤다.
그는 발표 초반 “빅데이터는 전혀 새로운 것이 아니다”는 점을 강조했다. 빅데이터라는 용어는 지난 2009년경부터 나오기 시작했으나, 실제 이에 대한 솔루션은 1999년, 2천년 초반부터 개발, 제공되기 시작했다는 설명이다. 관건은 접근법이다. 과거에 비해 빅데이터 자체가 아주 방대해졌기 때문에 이를 관리하기 위해서는 새로운 방법들이 필요하다는 지적이다.
마지막으로 그는 빅데이터의 미래에 대해 광범위한 스토리지, 인텔리전스 아카이브, 빅데이터 분석을 통한 비즈니스 가치 창출, 보안성으로 요약했다.
관련기사
- [제8회 ACC]"레볼루션R, 아마존-MS애저에도 OK"2012.09.12
- [제8회 ACC]EMC, "빅데이터가 비즈니스 바꿀 것"2012.09.12
- [제8회 ACC]"빅데이터, 클라우드로 처리해봐"2012.09.12
- [제8회 ACC]“ 빅쿼리, 6초면 위키피디아 분석 끝”2012.09.12
차파 부사장은 “이제 데이터 저장은 기존 데이터센터에서 클라우드로 옮겨갈 것”이라며 “메타데이터를 분석하고 의미 있는 가치를 빼냄으로써 훨씬 더 효율적으로 비즈니스를 할 수 있다”고 강조했다.
이어 “무엇보다 중요한 것은 데이터 보호”라며 “빅데이터뿐만 아니라 어떤 기술이 개발되던 간에 근본이 되는 중요한 요소가 보안, 데이터 보호”라고 덧붙였다.