IBM, 분석에 '하둡' 투입…비정형처리 대세 되나

일반입력 :2011/05/23 09:37    수정: 2011/05/23 10:32

IBM은 자사 분석 소프트웨어(SW)전략에 '하둡'을 투입한다. 하둡은 텍스트, 음성, 영상, 소셜미디어 등 비정형 데이터를 분석하기 위해 쓰이는 오픈소스 기술이다.

지난 20일 IBM은 대용량데이터 및 애널리틱스 연구 프로젝트에 1억달러를 투자하고 그 성과를 통해 제품 포트폴리오를 확장해나갈 방침을 밝혔다. 이와 함께 하둡 기반 서비스도 선보였다.

IBM이 개발중인 분석SW '인포스피어 빅인사이트'와 '스트림스'는 기업 사용자들이 자사 주위를 오가는 정보에서 예측과 통찰을 얻게 해 준다고 회사측은 설명했다. IBM의 기술 특허 50개 이상이 포함돼 있다고 덧붙였다.

인포스피어 빅인사이트는 기업용 거버넌스 및 보안 기능과 더불어 개발자용 통합 툴을 포함한다. IBM은 무료로 쓸 수 있는 '베이직 에디션'을 제공할 방침이다. 스트림스는 트위터 메시지, 유튜브 동영상, 증권시장 정보 등을 분석하는 역할이다.

IBM은 이 SW와 관련해 하둡 기반으로 대용량 스트리밍 데이터를 분석하는 신규 서비스 20가지를 함께 내놓는다.

미국 지디넷은 이가운데 핵심 서비스로 '클라우드 워크로드 분석', '서버 및 스토리지 최적화', '데이터센터 수명주기 비용 분석', '치명적 위협 대응을 자동화하는 보안 분석', 4가지를 꼽았다.

IBM은 이미 지난 5년 동안 140억달러를 들여 24개 분석 SW 기술 관련 기업을 사들였고 연구 부문에만 10억달러 이상 투자한 상태다. 회사는 오는 2015년까지 애널리틱스 시장에서 160억달러 매출을 전망하는 것으로 알려졌다.

이번 IBM 분석SW 투자 사례는 분산 컴퓨팅에서 발전해 클라우드 환경에 알맞은 병렬 처리 기술로 알려진 하둡의 또다른 응용 분야로 떠오르고 있다. 하둡은 이전부터 구글과 야후 같은 검색 업체들이 자사 핵심 서비스에 활용해왔다.

월스트리트저널(WSJ)은 최근 몇년간 기업들이 애널리틱스 분야에 대한 투자를 늘려왔으며, 웹과 스마트폰 같은 단말기에서 만들어지는 수많은 데이터를 정리하고 분석하기 위해 더 강력한 기술을 도입하는 추세라고 진단했다. 이에 IBM 뿐만아니라 EMC나 휴렛팩커드(HP) 등이 최근 분석 분야에 주력하기 위한 기업 인수 행진을 벌여왔다는 지적이다.

실제로 EMC는 이달 중순 데이터 집약적인 분산처리 애플리케이션에 하둡을 활용하는 전략을 공개했다. 하둡을 '빅데이터' 활용 시나리오에 최적 기술이라고 판단했다는 풀이다.

관련기사

이에 따라 EMC는 하둡 기반 'EMC 그린플럼 HD 커뮤니티 에디션'과 'EMC 그린플럼 HD 엔터프라이즈 에디션' 소프트웨어를 출시하고 '그린플럼 HD 데이터 컴퓨팅 어플라이언스'를 내놨다. 이는 하둡을 EMC 그린플럼 DB와 연결해 단일 솔루션에서 정형, 비정형 데이터를 함께 처리토록 한 것이다.

빌 쿡 EMC 데이터 컴퓨팅 사업부 총괄 담당은 많은 기업들이 정형, 비정형 '빅데이터' 2가지를 활용할 수 있는 기술을 원한다며 기존 DB 솔루션과 연결되는 하둡이 비정형 데이터를 가치롭게 해 준다고 강조했다.