비즈니스 세계에서는 장소, 대상, 방법 등 3가지 요소가 빠르게 변화하고 있다.
컴퓨팅의 '장소'가 전통적인 IT시스템에서 클라우드 컴퓨팅으로 이동하면서 컴퓨팅 경제학을 변경시키고 데이터 분산화의 새로운 흐름을 창출하고 있다.
'대상'은 트랜잭션 프로세싱에서 인터랙션 프로세싱으로 이동하고 있다. 사람들은 소셜 미디어를 통해 소통하고 기기들은 인터넷을 통해 소통함으로써 인터랙션 데이터가 전례 없는 양으로 늘어나고 있다.
'방법'이 데스크톱에서 모바일 기기로 이동함에 따라, 사용자들은 상황인식, 장소기반의 서비스를 이용할 수 있고, 기기와 센서 인터랙션 데이터의 폭발적 증가를 창출하게 됐다.
이러한 근본적인 변화는 더 큰 규모로, 더 다양하게 그리고 더 빠르게 빅데이터를 성장시키고 있다.
이러한 가운데 인포매티카는 3가지 측면에서 빅데이터를 정의하고 있다. 바로 ▲트랜잭션 데이터 볼륨의 엄청난 성장을 뜻하는 '빅 트랜잭션 데이터' ▲소셜 미디어 및 기기 데이터와 같은 새로운 유형의 데이터가 급성장한다는 '빅 인터랙션 데이터' ▲마지막으로 하둡을 통한 매우 확장성이 높은 처리를 뜻하는 '빅 데이터 프로세싱'이 그것이다.
즉 빅데이터란 트랜잭션과 인터랙션(상호작용) 데이터를 모두 포함해서 적절한 비용과 시간 그리고 일반적으로 사용되는 기술을 사용해 파악, 관리 및 처리하기에는 너무 크고 복잡한 데이터를 의미한다는 것이다. 이러한 관점에서 빅데이터는 위 3가지 주요 기술 경향이 융합된 것이라 할 수 있다.
기업들은 빅데이터를 활용함으로써 운영 효율성을 개선하고, 데이터 관리 비용을 줄이고, 브랜드와 고객관계를 더욱 잘 관리할 수 있게 될 것이다. 하지만 오늘날 빅데이터의 사업 가치를 수익화할 준비가 돼있는 기업은 거의 없다. 빅데이터에 대한 대응을 소홀히 할수록 조직들은 예상치 못한 비용, 복잡성 그리고 리스크를 초래할 수 있다.
■빅데이터 활용 기술
빅데이터의 활용을 위해서는 무엇보다 빅데이터의 파일을 저장하고 분산 처리하는 기술이 중요한데, 이러한 대규모 분산 처리 프로그램을 지원하는 하둡은 빅데이터의 활용 가능성과 중요성을 널리 알린 대표적인 플랫폼이다.
하둡이 각광받는 몇가지 중요한 특징은 1)시스템 관리 및 자체 복원 기능 2)확장성 및 고성능 구현 3)제약없는 데이터의 분석 처리 기술 4)오픈 소스이면서 단순하고 쉽게 구현 가능한 모듈러 기반 등이 있다.
이러한 하둡 플랫폼은 크게 분산 파일을 공유하는 HDFS(Hadoop Distributed File System)와 빅데이터를 분산 처리하는 알고리즘인 맵리듀스의 핵심 구성요소로 이루어져 있으며, 이러한 하둡 플랫폼을 활용하여 기존 IT업계에서는 자체 솔루션과 결합하여 하둡을 지원하는 웹서비스 및 어플라이언스 등과 같이 다양한 솔루션을 출시하고 있다.
인포매티카는 현재 하둡 기술을 상용화하여 하둡 플랫폼을 서비스하고 있는 클라우데라와 파트너쉽을 통해 다양한 기술 교류 및 관련 제품을 개발하고 있다.
인포매티카는 이러한 빅데이터를 처리하는 하둡 플랫폼을 지원하는 다양한 기술 로드맵을 보유하고 있으며, 하둡 내 데이터를 처리하는 1)하둡내 데이터 수집 2)하둡 데이터 검색 및 프로파일링 3)하둡 데이터 파싱 4)하둡 데이터 변환 및 정제 5)하둡 데이터 비지니스 분석 처리 및 데이터 호출 6)워크플로우 처리 7)모니터링 등의 7단계의 데이터 처리 프로세스 각각 대응할 수 있는 '인포매티카 포 하둡(Informatica for Hadoop)' 솔루션을 출시해 조직의 하둡 내 빅 데이터 통합 및 빅 데이터의 활용을 처리할 수 있도록 지원하고 있다.
이 솔루션은 인포매티카의 대표적 데이터 통합솔루션인 '인포매티카 파워센터'를 필두로 '인포매티카 파워익스체인지 포 하둡', '인포매티카 HParser' 등과 같은 다양한 솔루션을 보유하고 있다. 올 2012년 하반기까지 관련 제품에 대한 모든 포트폴리오를 완성할 예정에 있다.
또한 기업 비즈니스를 위해 중요성이 점차 증대하고 있는 소셜 미디어 데이터의 분석을 위해 파워익스체인지 포 페이스북, 파워익스체인지 포 트위터, 파워익스체인지 포 링크드인 같은 제품을 통해 페이스북, 트위터, 링크드인 등에 대한 고성능 연결을 제공하고 있다.
이러한 인포매티카의 빅 데이터 통합을 위한 솔루션을 통해 기업은 하둡 플랫폼에 대한 데이터 분석 처리, 배포 및 하둡 관련 방법론을 보유할 수 있다. ID 식별, 데이터 파싱, 프로파일링, 매칭 및 정제를 포함하여 하둡에 별도 설정없이 데이터를 변환할 수 있어 신속하게 하둡 데이터를 분석, 활용할 수 있다.
또한 소셜 미디어 데이터로부터 고객 프로파일을 통합하고 이러한 소셜 프로파일을 기존의 고객 데이터와 통합해, 기업은 소셜 미디어에만 존재하는 고객의 선호와 행동에 대한 통찰력을 얻을 수 있다.
대용량 데이터가 조직의 최고 자산이 될 것인지 또는 가장 무거운 짐이 될 것인지 여부는 엄청나게 증대하고 있는 데이터 볼륨, 복잡성, 다양성 및 속도를 처리하기 위해 사용하게 되는 전략과 솔루션에 따라 결정된다.
관련기사
- '빅데이터 성공사례' 주인공 되려면2012.09.11
- 인포매티카 "구글 인프라로 빅데이터통합-분석"2012.09.11
- 인포매티카-맵알, 데이터통합과 하둡 연결2012.09.11
- 인포매티카, 연매출-분기영업익 21%↑2012.09.11
빅데이터는 거스를 수 없는 대세로, 조직들이 IT에 대한 획기적인 접근방식을 채택하고 기존 프로세스와 인프라를 새로운 현실에 맞추도록 강요하고 있다.
빅데이터의 비즈니스 가치를 활용하기 위해서는 종합적이고 통합된 그리고 개방성을 갖춘 데이터 통합 플랫폼이 필요하다. 인포매티카 측은 빅데이터 통합을 제공해 데이터에 대한 수익을 극대화할 수 있게 해준다고 강조한다. 빅데이터 통합은 모든 크기의 데이터를 모든 소스로부터 액세스, 통합 및 관리하고 그것들을 하나로 묶어 다른 방법으로는 얻을 수 없는 통찰력과 가치를 얻도록 도울 수 있다.