“전 세계 사회, 산업, 문화적 르네상스를 불러올 과학기술의 대전환.”
세계경제포럼(WEF)의 클라우스 슈밥 회장은 4차 산업혁명을 일컬어 이렇게 말했다. 그 어떤 분야에서도 4차 산업혁명을 빼고 미래를 얘기할 수 없을 만큼 4차 산업혁명은 현실이 되고 있고, 이 혁명의 시대를 이끌기 위해 세계 각 나라들은 정부 주도의 정책을 전개하고 있다.
4차 산업혁명이라는 용어는 학계에서 완전히 정의된 개념은 아니다. 각 나라마다 서로 다른 논쟁을 거치며 4차 산업혁명의 개념과 정의, 범위가 진화, 발전하고 있다. 독일에서 시작한 인더스트리(Industry) 4.0의 기본 요소인 사물인터넷과 빅데이터 외에 일본은 로봇, 중국은 신수종(新樹種), 미국은 산업인터넷에 방점을 찍고 4차 산업혁명을 준비하고 있다. 우리나라에서는 구글 딥마인드의 알파고 쇼크 이후, 인공지능과 ICBM(IoT, Cloud, Big Data, Mobile)을 4차 산업혁명의 핵심요소로 강조하고 있다.
4차 산업혁명은 3차 산업혁명에서 이룬 대량생산과 반자동화에 디지털 지능화를 결합시킨 산업으로, 정보기술 인프라가 핵심이다. 다행히 우리는 4차 산업혁명을 이끌 정보기술 인프라를 이미 사용하고 있으며, 받아들일 준비가 되어 있다. 컴퓨팅 파워의 발전과 인프라 가격 저하는 4차 산업혁명의 기반이 되는 IoT를 가능하게 하고, 이미 업무에서 활용하고 있는 데이터 마이닝의 다양한 분석 알고리즘은 머신 러닝의 기초가 된다.
정보기술 인프라의 진화와 함께 애널리틱스(analytics) 혁명도 이어지고 있다. 1970년대 3차 산업혁명 이후 다양한 분석 인프라와 분석 솔루션이 발전했고, 1990년대를 전후로 데이터 웨어하우스 어플라이언스가, 2005년을 전후로 빅데이터 분석 솔루션이 혁신적으로 발전했다. 현재는 클라우드 환경의 오픈소스 통합 솔루션으로 발전하고 있다. 이전의 온-프레미스(On-premise) 방식의 분석 환경이 클라우드 환경으로 전환되고 있는 것이다.
■ 4차 산업혁명은 애널리틱스 혁명
우리나라 4차 산업혁명을 주도하는 핵심 기술인 ICBM(IoT, Cloud, Big Data, Mobile)을 하나씩 살펴보면 ▲사물인터넷(IoT): 다양한 디바이스를 통해 실시간으로 빅데이터 수집 ▲클라우드(Cloud): 수집한 빅데이터를 안전하고 효율적으로 저장, 조회, 검색, 변경할 수 있는 환경 제공 ▲빅데이터(Big Data): 저장된 빅데이터는 분석 도구들에 의해 맞춤 정보로 가공 ▲모바일(Mobile): 빅데이터 분석으로 추출된 맞춤 정보는 다양한 모바일 기기를 통해 모바일 서비스로 제공되고 소비돼 빅데이터를 통한 인사이트를 확보할 수 있다.
⒤oT(빅데이터 수집)
"사물인터넷 기술은 다양한 디바이스를 통해 실시간 데이터를 수집하고, 이를 클라우드 형태의 데이터 저장소에 저장한다."
시장조사기관인 가트너에 따르면, 2020년까지 약 300억 개의 기기들이 서로 연결되고, 그로부터 수없이 많은 데이터가 생성된다. IoT 빅데이터를 보다 유용하게 활용하기 위해서는 다양한 디바이스에서 쏟아지는 빅데이터를 어떻게 수집, 저장하고 분석할 것인가 즉, AoT(Analytics of Things)를 고민해야 한다. 미국 뱁슨칼리지(Babson College)의 저명한 통계학 박사 교수인 토머스 데이븐포트는 “IoT를 유용하게 만들기 위해서는 AoT가 필요하며, 이는 새로운 데이터 관리 및 통합 접근법과 스트리밍 데이터를 지속적으로 분석하는 새로운 방법을 의미한다”고 언급한 바 있다.
SAS는 ‘SAS 이벤트 스트림 프로세싱(SAS Event Stream Processing)’으로 IoT 데이터의 실시간 분석을 지원하며 4차 산업혁명에 의미를 더한다. SAS 이벤트 스트림 프로세싱은 초당 수백만 개의 센서 데이터를 실시간으로 변환하고 분석하여, 데이터가 저장되기 전에 관심 있는 패턴을 감지하는 솔루션이다. 노이즈가 있는 데이터로부터 패턴 검출, 필터링, 요약 등을 통해 실시간 데이터 스트림을 처리한다. 아울러 쏟아져 나오는 방대한 데이터를 짧은 주기로 처리해 실시간 액션과 경고를 수행하고, 인사이트를 확보할 수 있다.
⒞loud(빅데이터 개방)
"클라우드 기술은 사물인터넷으로부터 수집된 다양한 빅데이터를 안전하고 효율적으로 저장, 조회, 검색, 변경할 수 있는 환경을 제공한다."
4차 산업혁명을 촉발시킨 인더스트리 4.0 이전부터 기업들은 클라우드 환경의 오픈소스 활용을 검토해왔으며, 이미 활용하는 기업도 증가하고 있다. 클라우드 환경에서 개방형 통합 플랫폼 아키텍처는 ▲Powerful ▲Open ▲Unified ▲Adaptive 등 4가지 핵심 기술을 지원해야 한다.
첫째, 오늘날 분석환경의 빅데이터를 처리해야 하는 빠른 분석 시스템은 엄청난 양의 빅데이터를 분석할 수 있는 강력한 인메모리(In-Memory) 아키텍처를 제공해야 한다. 둘째, RestFul API, Any Data Any Platform 지원, 파이썬(Python), 자바(Java), 루아(Lua) 등 오픈소스 통합 인터페이스 지원이 필요한 통합 아키텍처를 제공해야 한다. 셋째, 다양한 업무에서 도입해 사용하고 있는 최상의(Best of Breed) 솔루션 간의 통합 문제를 해결할 수 있는 통합된 플랫폼의 거버넌스 역할을 지원해야 한다. 넷째, 클라우드 환경으로 확장성은 물론 시스템 리소스를 탄력적으로 활용할 수 있는 마이크로서비스(Micro-Service) 아키텍처를 지원해야 한다.
SAS는 개방형 및 클라우드 기반의 분석 아키텍처 ‘SAS 바이야(Viya)’를 통해 빅데이터 분석을 지원한다. SAS 바이야는 비즈니스 전문가, 분석가, 통계학자, 데이터 사이언티스트, 경영진 등 광범위한 사용자를 지원, 협업을 촉진함으로써 분석을 전사적으로 활용할 수 있도록 지원한다. 공용 API와 다양한 프로그래밍 언어를 지원하는 SAS 바이야는 인터랙티브 탐색과 리포팅, 통계, 데이터 마이닝, 머신 러닝, 스트리밍 데이터 분석, 예측, 최적화 및 계량 경제학을 구현한다.
⒝ig Data(빅데이터 분석)
"클라우드 환경에 저장된 엄청난 양의 빅데이터는 빅데이터 분석 도구들에 의해 맞춤 정보로 가공하여 제공된다."
IDG 테크 리포트(Tech Report)에서는 머신 러닝을 ‘인공지능이 인간과 같은 사고를 하는 컴퓨팅, 즉 인간의 뇌를 수학적으로 모델링하는 것을 의미한다면, 머신 러닝은 인공지능 내부 시스템 가운데 학습 영역을 구체화한 기술’이라고 정의했다. 데이터를 분석하여 숨겨진 특성인 ‘패턴’을 발견해 학습 모델을 구축하고 추론하는 기술이자, 더 나아가 경험으로부터 습득한 지식을 기반으로 스스로 성능을 향상시키는 과학이라는 의미다.
데이터 규모와 복잡성이 증대하면서 이들 데이터를 다루고 인사이트를 확보하기 위해서는 머신 러닝이 필요하다. 컴퓨팅 기술의 발전도 머신 러닝의 다양한 활용을 가능하게 하며, 새로운 방법과 알고리즘 관점에서 머신 러닝 알고리즘을 필요로 한다.
SAS는 머신 러닝 알고리즘을 활용해 모든 프로세스를 표준화했다. SAS의 머신 러닝 플랫폼은 다양하고 검증된 머신 러닝 알고리즘을 적용했으며, 셀프러닝으로 모델을 지속적으로 고도화하고, SAS가 제공하는 여러 솔루션을 통해 쉽게 배치하여 업무에 적용할 수 있다. 참고로 SAS 셀프 머신 러닝(Self Machine Learning)은 ▶모델링을 위한 데이터 수집 ▶원변수와 파생변수 확보 ▶모델링, 패턴 발견, 알고리즘을 적용한 최적의 모델 선택 및 적용 ▶비즈니스 환경 변화에 따른 성능 모니터링 ▶트리거 기반으로 리트레이닝 및 리모델링 ▶성능 개선의 프로세스로 진행된다.
⒨obile(빅데이터 활용)
"빅데이터 분석으로 추출된 맞춤 정보는 다양한 모바일 기기를 통해 모바일 서비스로 제공되고 소비된다."
최신 트렌드는 직접 발로 뛰는 현장경영이다. 이때 필요한 기술이 모바일 분석이다. 정적인 데이터 분석 결과가 아닌 동적인 데이터를 직접 분석하면서 경영할 수 있는 환경이 필요하다. GE와 지멘스는 현장경영을 하기 위해 모바일 분석을 하고, 분석 결과를 기반으로 자재와 재고를 관리한다. 자동화 시스템 공정에 대해서도 모바일 분석을 수행하고 있다.
2015년 가트너에서는 ‘데이터 중심의 비즈니스를 실현하기 위해 누구나 분석가가 되는 시티즌 데이터 사이언티스트(Citizen Data Scientist)가 요구된다’며 ‘BI 벤더는 시티즌 사이언티스트가 가능한 셀프서비스 애널리틱스와 직관적인 파악을 가능하게 하는 시각화 기반의 데이터 디스커버리에 힘써야 한다’고 조언한 적이 있다. 일반 사용자도 데이터 사이언티스트 못지 않게 데이터를 다룰 수 있도록 솔루션이 지원을 해야 한다는 의미다.
SAS는 SAS 모바일 BI로 이 같은 환경을 지원한다. SAS 모바일 BI는 SAS 비주얼 스태티스틱스(SAS VS; SAS Visual Statistics)와 머신 러닝을 기반으로 데이터 사이언티스트뿐만 아니라 일반 사용자도 누구나 쉽고 빠르게 데이터를 분석하고 그 결과를 활용할 수 있도록 돕는다. 이를 위해 현황 데이터를 한눈에 볼 수 있는 일반적인 대시보드 기능 외에도, 고급분석 알고리즘인 시계열 분석, 디시전 트리(decision tree), 클러스터링 군집 분석 등을 제공한다. 머신 러닝 알고리즘으로는 그래디언트 부스팅, 서포트벡터 머신, 랜덤 포리스트, 뉴럴 네트워크 등을 포함하고 있다.
■ ICBM 통합 모델로 인사이트 확보해야
앞서 각각 소개한 ICBM은 통합하여 활용했을 때 비로소 큰 힘을 발휘한다. ▶IoT 데이터를 실시간으로 수집하고, ▶개방된 Cloud 환경에서 ▶Big Data를 저장 및 분석하고, ▶Mobile 기기로 언제 어디서나 활용할 수 있어야 한다.
관련기사
- SAS코리아, 금융분야 머신러닝 전략 세미나 개최2017.06.23
- SAS코리아, 제14회 SAS 분석 챔피언십 개최2017.06.23
- "공부부터 취미 생활까지"…설 명절 전자기기 선물 3선2025.01.25
- 중견 SW기업, 돌아온 회장들 관심…AI·글로벌 화두로2025.01.26
예를 들어, 금융 및 유통산업의 경우 전국 지점의 거래정보를 수집해 이를 통합적으로 분석함으로써 모바일 사용자에게 실적, 추천, 이탈 등의 서비스를 제공할 수 있다. 정부 기관에서는 전국적인 건강과 오염 관련 정보를 수집해 이를 통합 분석함으로써 모바일을 통해 전 국민에게 환경과 건강 관련 서비스를 제공할 수 있다.
이처럼 ICBM은 특정 산업과 도메인에만 한정되지 않고 모든 업무에 적용할 수 있는 시나리오이다. 4차 산업혁명 시대를 주도하기 위해서는 ICBM 통합 서비스 모델로 인사이트를 확보하는 것이 중요하다.
*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.