오성탁 NIA 본부장 "빅데이터 플랫폼과 센터로 데이터 강국 실현"

연말까지 누적 데이터 3천종 구축...내년엔 '센터'만 30곳 뽑아

인터뷰입력 :2020/10/27 07:12

2018년 8월 정부는 '데이터 경제로의 전환'을 발표하며 데이터 강국을 선언했다. 이의 대표적 사업이 과기정통부가 시행하는 '빅데이터 플랫폼 및 센터'다. 공공과 민간이 협업해 빅데이터 센터에서 수집한 데이터를 플랫폼에서 분석 및 유통(판매)하는 것으로 혁신 서비스를 발굴, 확산하기 위한 것이다.

사업 수행 기관은 한국정보화진흥원(NIA)이다. NIA는 정부가 '데이터 경제로의 전환'을 선언하기 몇개월 전부터 문용식 원장 지시로 원 내에 데이터 전담팀을 만들어 운영했다. '빅데이터 플랫폼 및 센터 사업'은 NIA 지능데이터본부가 맡아 하고 있다.

오성탁 NIA 지능데이터본부장은 "아직 플랫폼이 정식 개통한지 1년도 안됐다"면서 "지난 8월말 현재 빅데이터 플랫폼을 통해 약 3만6000건의 데이터가 이용됐고 연말까지 약 3천 종의 누적 데이터가 빅데이터 플랫폼에서 구축 될 것"이라고 예상했다. 오 본부장은 "이 사업은 정부가 처음으로 하는 유형의 사업"이라며 "세계적으로도 처음 하는 사업이라 힘들지만 원 내에서 자부심이 크다"고 덧붙였다.

'빅데이터 플랫폼 사업'은 크게 '플랫폼'과 '센터'로 나눠진다. '플랫폼'이 본사라면 '센터'는 지사다. 지사인 '센터'가 현장에서 데이터를 모아 플랫폼에 보내면 플랫폼은 이 데이터를 취합해 가공하거나 유통(판매)한다. 플랫폼은 데이터가 모이는 일종의 허브로 모은 데이터를 유료로 판매할 수 있는 데이터 거래소 역할도 한다.

'플랫폼'은 지난해 10개 분야(금융·통신·유통·중소기업·교통·헬스케어·문화·지역경제·산림·환경)에서 10개가 선정됐다. 올해 추경으로 6개 분야(농식품·해양수산·소방안전·스마트치안·라이프로그·디지털산업혁신)를 추가, 플랫폼이 총 16개로 늘었다. 작년에 선정한 10개 플랫폼은 현재 운영중이고, 올해 선정한 6개 플랫폼은 시범 운영을 거쳐 내년초에 개통된다.

오성탁 NIA 본부장을 26일 만나 빅데이터 플랫폼 사업 현황과 계획을 들어봤다. 97년 4월 NIA에 입사한 오 본부장은 지능데이터단장과 정책기획 팀장, 전자정부성과제도 팀장 등을 역임했다.

빅데이터 플랫폼 사업을 맡고 있는 오성탁 NIA 지능데이터본부장이 사업을 설명하고 있다.

-플랫폼사업에 대한 산업계 관심이 높다. 현황을 말해달라

"2019년 3월 1차 사업공모로 10개 분야 플랫폼과 72개 센터를 선정했다. 이어 9월에 2차 공모로 22개 센터를 추가했다. 올해 6개 플랫폼을 추가로 선정, 플랫폼이 16개로 늘었다. 16개 플랫폼 중 운영자가 민간인 플랫폼이 4개(금융, 통신, 유통, 중소기업)다. 플랫폼과 매칭 되는 센터는 총 150개다."

-플랫폼과 센터 예산은 어떻게 되나

"1개 플랫폼당 3년간 총 50억원을 지원한다. 센터는 3년간 10억원 내외를 준다. 2019년 전체 예산은 736억원, 올해 전체 예산은 추경(400억원)을 포함해 848억원이다."

-내년 사업은 어떻게 되나

"내년에는 플랫폼을 뽑지 않는다. 센터만 30개 선정할 계획이다. 센터 선정 공고는 내년 1~2월로 생각하고 있다."

-현재 플랫폼이 16개 선정됐다. 플랫폼을 30개로 늘린다고 했는데

"내년에 플랫폼을 뽑지 않는 대신 후년인 2022년 5개, 2023년 5개, 2025년 5개를 각각 더 뽑는다. 2025년까지 15개 플랫폼을 더 추가한다."

-플랫폼이 보유한 데이터 품질에 대한 우려가 있다. 업계가 원하는 데이터보다 단순 정보 제공에 그치고 있다는 것이다. 또 센터의 경우 계약 기간이 1년 단위여서 데이터 제공 연속성을 보장할 수 없다는 지적도 있다

"현재 10개 플랫폼에 있는 단순 통계성 데이터는 19% 정도다. 반면 활용가치가 큰 원시 및 가공데이터는 전체 데이터의 81% 정도다. 센터의 경우 계약 기간은 1년이지만 성과 평가를 통해 최대 3년간 지원한다. 센터에서 생산한 데이터는 지속적으로 업데이트가 이뤄지고 있다."

-플랫폼 사업자를 선정한 지 1년이 넘었다. 그동안 생성한 데이터는 얼마나 되며, 한눈에 볼 수 있나

"10개 빅데이터 플랫폼이 생산 및 개방한 데이터를 한눈에 볼 수 있는 포털(http://www.bigdata-map.kr)을 올 3월 31일에 개통했다. 일종의 '플랫폼 지도'다. 데이터 현황을 분야별, 유형별, 주제별, 지역별로 구분해 시각화한 통계정보를 제공하고 있다. 데이터 간 연관성을 분석하는 시맨틱 검색을 통해 일반인도 데이터 분석 및 융합을 쉽고 빠르게 할 수 있게 했다. 10월 25일 현재 데이터 총 수는 8841건이고 이중 유통 분야가 66.6%(5888건)으로 압도적으로 많다. 유통에 이어 문화 8.83%(781건), 환경(5.98%, 529건), 산림(5.22%, 461건) 순으로 데이터가 많다."

-민간 기업 4곳이 운영하는 플랫폼의 데이터는 어떤가

"민간기업이 운영하는 플랫폼은 유통, 중소기업, 금융, 통신이다. 데이터는 유통이 제일 많고 중소기업이 전체의 2.71%(240건), 금융이 1.61%(142건), 통신이 1.48%(131건)를 차지하고 있다."

-플랫폼에서 모은 데이터는 유료로 판매하나. 그동안 거래액은 얼마나 되나

"플랫폼에서 모은 데이터는 유료로 판매하는 데이터와 무료로 공개하는 데이터 두 종류가 있다. 정부가 재정을 투입한 사업이라 일정 부분 데이터를 무료로 공개해야 한다. 데이터 거래액은 10개 플랫폼마다 다르다. 10월 현재 유료 데이터 거래액은 563건에 63억원에 달한다."

-데이터 거래액이 적은 거 같다. 민간이 운영자인 플랫폼과 공공이 운영자인 플랫폼간성과에 차이가 없나

"기존에 구하기 어려운 민간기업의 데이터를 정부 지원을 통해 무료 데이터 형태로 개방을 많이 하고 있다. 유료데이터는 갑자기 거래되는 것이 아니라 무료 데이터를 활용해 다양한 비즈니스에 적용해 보고 그 가능성을 보면서 기업들이 구매하고 있어 시간이 걸린다. 공공과 민간 플랫폼 운영기관의 차이 보다 데이터를 생산해 유통거래하는 빅데이터 센터가 공공기관인지 민간기업인지에 따라 차이가 있다."

-우리나라는 제조 강국이다. 16개 플랫폼에 제조 분야가 없다

"제조 데이터 플랫폼은 중기부에서 추진중이다. 앞으로 우리 플랫폼과 연계할 생각이다. 과기정통부가 중심이 돼 운영하는 '데이터 얼라이언스'에 중기부도 참여하고 있다."

-데이터는 보안, 표준, 연계, 접근성 문제가 있다. 플랫폼 사업을 통해 생성한 데이터들은 어떤가

"보안에 아무 문제가 없다. 개별 플랫폼별로 보안 기준을 만들었고, 강력한 보안 솔루션도 탑재했다. 개인정보도 법에 따라 철저히 익명처리 하고 있다. 플랫폼간 데이터 연계성도 문제 없다. 이를 위해 10개 플랫폼 개발자들을 모아 의견을 수렴해 연계 규격을 지난해 말 만들었다. 올해 말까지 상호 데이터 검색이 가능하도록 할 예정이다. UI 와 UX도 사용자 의견을 들어 지속적으로 개선하고 있다. 앞으로 인공지능(AI) 포털인 'AI허브'와 연계할 계획이다."

-그동안 성과를 말해준다면

"올 8월말 현재 플랫폼을 통해 약 3만6000건의 데이터가 이용됐다. 유료 데이터 거래는 563건으로 약 63억원의 매출이 발생했다. 플랫폼과 센터간 협력해 새로운 비즈니스를 만들고 있고, 센터 사업에 참여하고 있는 중소기업과 스타트업들이 투자를 받는 사례도 생기고 있다. 무엇보다 데이터를 활용한 사례들이 많이 나오고 있다. 산악지역의 통신 신호 세기 데이터를 개방해 통신사가 통신 음영 지역을 해소하거나, 산림 기상 데이터를 활용해 휴양림의 산불 확산을 분석해 소화 시설을 최적지에 설치하는 일 등이 일어나고 있다. 코로나19에 따른 지역 경제 활성화에도 기여했다. 카드소비 데이터를 기반으로 대구시의 코로나19 피해 업종과 지역을 분석, 우선 지원 정책을 수립하게 돕는 등 지역 경제 활성화에도 힘을 보탰다."

NIA 광화문 사무실에서 활짝 웃고 있는 오 본부장. 오 본부장은 지능데이터단장과 정책기획 팀장 등을 역임했다.

-지난 8월 5일 데이터3법이 시행됨에 따라 이의 후속 조치로 정부가 데이터 결합 전문기관 지정을 추진하고 있다. 데이터 경제 활성화를 위해 빅데이터 플랫폼기관들도 데이터 결합 전문기관으로 지정받아야 한다고 업계가 주장하고 있는데....

"빅데이터 플랫폼이 데이터 결합 전문기관으로 지정 받으면 빅데이터 센터에서 생산한 데이터와 데이터 결합을 희망하는 기업간에 데이터를 쉽게 결합할 수 있어 데이터 활용이 보다 촉진될 것이다. 하지만 현재는 '셀프 결합' 금지 때문에 플랫폼들이 결합 전문기관으로 신청하는데 소극적이다. '셀프 결합' 금지는 자기 데이터를 가지고 다른 데이터와 결합하는 걸 금지한 것으로, 예를 들면 통신의 경우 KT가 플랫폼 사업자인데 자기 데이터인 통신을 가지고 다른 데이터와 결합할 수 없다. 플랫폼 운영기관들이 결합기관이 되려면 이 '셀프 결합'을 할 수 있도록 승인해야 된다."

-NIA는 AI를 위한 데이터 댐 구축 사업도 하고 있다. 빅데이터 플랫폼의 데이터와 AI데이터 사업의 데이터는 어떤 차이가 있나

"둘 간에 차이가 있다. AI데이터는 가공을 필요로 하는 데이터다. 사진과 영상 같은 비정형 데이터가 중요하며 AI가 인식할 수 있게 라벨링 작업을 해야 한다. 반면 플랫폼 사업의 데이터는 AI용에 맞춰 따로 가공을 하지 않는다. 텍스트 위주의 정형 데이터와 라벨링 되지 않은 비정형 데이터가 많다. 라벨링 작업도 없다."

-빅데이터 플랫폼 사업이 국내 경제 및 산업 발전에 미치는 효과는

"올 6월 스위스 국제경영개발대학원(IMD)이 발표한 국가경쟁력 평가에서 우리나라는 작년보다 순위가 5계단 오른 23위를 기록했다. 특히 빅데이터 활용 및 분석은 2019년 40위에서 2020년 15위로 25계단이나 상승했다. 빅데이터 플랫폼 사업이 이에 기여한 것으로 생각한다.

무엇보다 빅데이터 플랫폼을 통해 기존에 데이터를 구하기 어려웠던 중소기업과 스타트업들이 플랫폼을 통해 공공과 민간의 데이터를 안정적으로 적시에 구할 수 있게 됐다는 점에서 의미가 크다.  또 공공과 민간의 활용 가치가 높은 데이터가 플랫폼을 통해 유통되고, 이렇게 생산한 데이터는 AI서비스에도 활용, AI강국에도 일조할 것으로 본다."

-빅데이터 플랫폼 사업은 세계 처음으로 시행하고 잇다. K플랫폼으로 수출할 수 있을까

"플랫폼이 보유한 데이터 중 해외에서 관심을 가질 만한 데이터도 있을 것 같다. 산림플랫폼 중 산림종 유전체 데이터가 있다. 산림에서 나오는 각종 식물과 약초에 관한 데이터다. 이건 외국에서도 관심을 가질만하다. 또 작년에 통신 빅데이터 플랫폼 운영기관인 KT가 중국 구이양 거래소랑 전략적 MOU를 체결, 데이터 유통 노하우를 공유하기로 한 바 있다. 데이터 뿐 아니라 플랫폼 구축 및 운영 경험도 해외에 전수할 수 있을 것 같다."

관련기사

-정부가 플랫폼사업자로 지정하지 않은 KOTRA도 빅데이터 플랫폼 사업에 참여하고 있다던데

"사업이 탄력을 받으면서 자체 예산으로 추진하고 있는 기관들도 과기정통부가 선정한 빅데이터 플랫폼의 협력 체계에 참여하길 희망하고 있다. KOTRA가 대표적이다. KOTRA도 빅데이터 플랫폼 사업 활성화를 위한 범부처 연합체인 데이터 얼라이언스 멤버로 들어와 있다. KOTRA를 통해 플랫폼이 보유한 데이터를 해외에 공급하는 걸 계획하고 있다."