스마트팩토리 데이터 처리, 시계열DB가 대세된 이유

컴퓨팅입력 :2020/10/20 15:03    수정: 2020/10/20 15:04

스마트팩토리가 국내외 제조업계에 확산되는 가운데, 산업용 사물인터넷(IIoT)의 데이터 처리에서 시계열 데이터베이스(Timesreies DataBase)가 표준으로 자리잡고 있다. 초당 수백만건의 데이터를 처리할 수 있는 성능이 대세의 이유다.

시계열 DB는 시간을 바탕으로 값을 저장하는 DB다. 수많은 센서에서 생성되는 IoT 데이터를 빠르게 처리하고 활용할 수 있는 기술로 급속 성장중이다.

[사진=Pixabay]

스마트 팩토리는 각종 생산 설비에 설치된 센서를 IoT으로 연결해 수많은 센서 데이터를 연결·수집·분석하는 디지털 공장이다. 4차 산업혁명의 키워드인 사물인터넷(IoT), 인공지능(AI), 머신러닝(ML), 빅데이터, 5G 등 첨단 기술이 총망라되며, 제조 분야의 디지털 트랜스포메이션을 이끄는 핵심 기술이다.

IoT 기반의 스마트팩토리는 초당 수백만건의 데이터를 생성한다. 제조 현장이 가동되는 한 엄청난 양의 데이터가 쏟아진다.

이 데이터를 기존 DB 기술에 저장하는 게 불가능하진 않다. 관계형 데이터베이스(RDB)는 일찌감치 활용 불가능안 방안으로 여기졌고, NoSQL과 하둡, 인메모리 기술 등이 대안으로 떠오르기도 했다. 이런 기술은 데이터를 저장할 수 있지만, 관리운영의 어려움 때문에 IoT 환경에서 힘을 잃었다.

2020년 10월 기준 지난 2년 간 데이터베이스 기술 대중성 트렌드. 시계열DB가 최상단을 차지하고 있다.(자료: DB-Engine)

데이터베이스 트렌드 보고서를 제공하는 DB엔진에 따르면, 지난 2년간 시계열 DB는 가장 많은 관심을 받고 있는 데이터 기술이다.

시계열 DB는 실시간 입력과 조회, 고효율 압축 기술 등을 바탕으로 중단없는 IoT 데이터 처리를 가능하게 한다. 저장된 데이터를 손쉽게 분석하고, 활용할 수 있다는 장점도 있다. 저장된 데이터를 조회하거나 시각화해도 운영중인 DB의 성능에 영향을 주지 않는다. 이에 시계열 DB는 등장 초기부터 IoT 영역의 관심을 받았다.

시계열 DB를 이용하면 일정 시간의 흐름에 따른 추세를 보거나 시스템에 일어나는 상황을 역동적으로 확인할 수 있다. 시간으로 누적된 데이터 속에서 변화를 감지하는데 매우 적합하다.

이에 전세계적으로 시계열 DB는 스마트팩토리의 표준 데이터 플랫폼으로 자리잡고 있다.

지난 7월 PTC는 IoT 플랫폼인 '싱웍스(ThingWorx)의 기본 DB를 '인플럭스데이터(InfluxData)'의 시계열 DB 상용 버전으로 바꿨다. PTC는 스마트팩토리의 IoT 로그데이터를 인플럭스DB에 저장하도록 하고 있다.

국내의 경우도 비슷한 흐름이다. 중소기업벤처기업부의 스마트제조혁신추진단과 산업통상자원부의 스마트제조혁신센터 등의 관련 사업에서 시계열 DB를 주요 요소로 삼고 있다.

중기부의 스마트제조혁신추진단은 스마트팩토리의 데이터 처리 표준화를 진행중이다. 여러 설비에서 쏟아지는 데이터를 함께 활용하기 용이하도록 형식을 표준화하는 것이다. 산자부의 스마트제조혁신센터는 IoT 환경을 쉽게 구축할 수 있는 통합 플랫폼을 개발중이다.

이밖에도 국내 대형 제조기업 다수가 시계열 DB에 관심을 갖고 시범 사업을 진행중인 것으로 전해진다.

스마트팩토리(사진=이미지투데이)

시계열 DB의 유행 시점을 맞아 다양한 제품과 서비스가 나와 있다. 미국 샌프란시스코에 본사를 둔 인플럭스DB가 가장 유명하며, 오픈소스 버전과 상용 버전을 클라우드와 설치형으로 제공한다. 퍼블릭 클라우드로 아마존웹서비스(AWS)의 타임스트림, 마이크로소프트 애저 타임시리즈인사이트 등이 있으며,  쿠버네티스 환경에서 많이 쓰이는 프로메테우스도 시계열 DB다. 아파치소프트웨어재단의 '드루이드'도 있다.

한국 태생 시계열 DB인 마크베이스도 있다. 마크베이스는 현 TPCx-IoT 벤치마크 순위에서 1위를 기록중인 시계열 DB 제품이다. 초당 IoT 데이터 수집/분석 속도 2,480,917 IoTps를 기록했다.

김성진 마크베이스 대표는 "스마트팩토리의 가장 큰 보틀넥은 데이터 처리이고, 현존 기술 가운데 이를 돌파할 해법은 시계열 DB밖에 없다"며 "시계열DB가 IoT 분야에서 글로벌 표준이 되는 건 거부할 수 없는 흐름"이라고 밝혔다.

관련기사

그는 엣지 컴퓨팅과 클라우드의 하이브리드 아키텍처를 스마트팩토리의 이상적 모델로 보고 있다. 그동안 IoT 데이터를 저사양 디바이스인 엣지에   효과적으로 저장할 수 없어 클라우드로 모두 전송해 분석해왔는데, 분석기능까지 갖춘 시계열 DB를 활용하면 엣지 컴퓨팅의 데이터 활용 역량이 한차원 높아질 것이란 얘기다.

그는 "데이터를 생성 위치에 가까운 온프레미스 엣지에 저장해 분석하고, 중요한 분석거리만 클라우드에 올리는 하이브리드 모델이 주요 국가에서 나타나고 있다"며 "스마트팩토리의 공작기계 데이터를 모두 클라우드로 올리면 그중 99%의 데이터는 쓰이지 않는데도 막대한 비용을 지불해야 해 데이터 이원화 모델이 합리적인 방향으로 자리잡을 것"이라고 전망했다.