“기존 시스템에서 처리할 수 있는 분석이라면 굳이 빅데이터를 활용하지 않아도 되지만 필요하다면 작은 정보라도 빅데이터에 대한 투자가 필요합니다.”
17일 서울 잠실 롯데호텔에서 지디넷코리아 주최로 ‘빅데이터&애널리틱스’를 주제로 열린 어드밴스트 컴퓨팅 컨퍼런스(ACC) 행사가 열렸다. 이 행사에서 김우승 줌인터넷 연구소장은 빅데이터를 구축할 때 고려해야 할 4가지 요소를 강조했다.
줌인터넷은 서비스 초기부터 하둡 엔진을 도입하며 빅데이터를 앞서 도입한 업체로 이미 널리 알려졌다.
이스트소프트 계열로 뒤늦게 검색포털 시장에 출사표를 내던진 줌인터넷은 대용량 데이터를 저렴한 비용으로 처리할 수 있는 솔루션이 필요했다. 대안으로 제시된 것이 하둡이었다. 대용량의 정보에서 빠르게 검색결과를 뽑아내기 위해서는 별도의 저장장치를 거치지 않는 하둡이 필요했다.
김 소장은 빅데이터 시장 초기 하둡을 이용해 플랫폼을 구성한 경험자로 이제 막 솔루션을 도입하려는 사용자들에게 조언했다.
김 소장이 빅데이터 도입 할 때 인지해야 할 사항으로 여러가지를 강조했다. 비용대비 효과 , 내재화, 정보 저장, 정보의 양 등이다.
김 소장은 먼저 “기존 시스템이 있다면 그냥 그걸 쓰는 것이 가장 좋다”고 설명했다. 운영에 들어가는 비용이 적지 않은 만큼 기존 분석 환경이 있고 이를 활용해 정보를 처리할 수 있다면 기존 투자를 먼저 활용하도록 하라는 설명이다.
다음으로 그는 “빅데이터를 도입하기로 했다면 내재화를 고려해야 한다”고 강조했다. 솔루션만으로는 절대로 해결할 수 없다는 의미다. 아웃소싱만으로 분석 환경을 가질 수 없고 내재화를 처음부터 고려해야 한다는 내용이다.
김 소장은 “빅데이터를 할 때 정보가 없으면 하지 말아야 한다”고도 강조했다. 없으면 먼저 정보를 수집하는 과정이 필요하다. 정보 분석에 대해서는 여러 가지 논란이 있지만 먼저 수집과정을 거쳐야 목적이 명확해질 수 있다.
마지막으로 김 소장은 “정보가 적고 회사가 적어도 빅데이터를 기술을 활용할 수 있다”는 조언도 덧붙었다. 그는 “효과에 따라 규모가 작은 중소기업, 신생업체도 빅데이터 기술이 필요하다”고 강조했다.
관련기사
- [제9회 ACC]테라데이타 "빅데이터 통합 아키텍처 필요"2013.04.17
- [제9회 ACC]“인터랙티브 하둡, 타조를 소개합니다”2013.04.17
- [제9회 ACC]스플렁크 "빅데이터 관건, 실패비용 줄이기"2013.04.17
- [제9회 ACC]코카콜라 성공비결...삼성·LG에 대입하니2013.04.17
우리나라에서는 대부분 빅데이터 기술을 가지고 작은 데이터를 다룬다. 언젠가 다가올 미래를 위해서 이같은 시도가 필요하다는 설명이다.
김 소장은 “하둡을 데이터 플랫폼에 불과하다고 얘기하는 사람도 있다”며 “하지만 리눅스가 하나의 운영체제로 안드로이드 등으로 확산되면서 IT 시장을 변화시킨 것처럼 하둡도 정보 처리에 상당한 영향을 주게 될 것”이라고 강조했다.