[이원석 교수의 익명정보④] 현업에 데이터 이용 날개 달아주려면

하늘을 봐야 별을 따...익명정보 창고 '공연계' 활용하면 '지능화' 동맥경화 해결할 수 있어

전문가 칼럼입력 :2024/03/23 15:54    수정: 2024/03/23 17:18

이원석 연세대학교 컴퓨터과학과 교수

예전엔 정보화가 유행이였다. 정보화란 무엇일까. 산업화 시대의 업무처리 방식을 컴퓨터로 개선하는 과정이다. 업무프로세스 재설계(BPR)라는 것도 있다. 이는 기관의 과거 업무 흐름을 컴퓨터로 할 수 있는 방식으로 재설계한 걸 말한다. 또 BPR과 연관성이 높은 정보화전략계획(ISP)은 재설계한 업무 흐름을 구동할 수 있는 정보시스템 구축 방법과 예산을 산정하는 것이다. 이 둘을 기반으로 기관의 정보화 청사진을 완료한 후 실제 정보시스템을 구축한다. 

우리나라는 모든 업무를 인터넷으로 수행하는 성숙한 정보사회를 실현했다. '육지'에서만 살던 국민이 정보화를 통해 가상공간인 '하늘'을 만들었다. 업무를 수행하는 정보시스템을 운영계라 한다. 운영계에는 매일 많은 양의 이용 내역 원천데이터가 쌓인다. 이들 과거 원천데이터를 모아 놓은 곳을 데이터 창고라 한다. 이  데이터 창고를 이용해 기업 전략이나 업무 효과를 분석하는 정보시스템을 분석계라하고, '지능화'는 분석계 시스템에서 AI와 빅데이터 기술을 적용해 새로운 인사이트를 찾거나 AI 자율 지능사물을 만드는 걸 말한다.

정보화와 지능화는 과정과 지향점이 다르다. 정보화는 명확한 목표를 먼저 세우고 전체 업무를 대상으로 진행한다. 반면 지능화는 개별 업무의 과거 데이터에 AI와 빅데이터 기술을 적용해 더 좋은 업무 방식을 찾아 개선하는 것이다. 이 둘을 미술에 비유하면, 정보화는 전체를 한꺼번에 만드는 조각이고, 지능화는 부분을 따로 만들어 취합하는 소조다.

우리나라는 법으로 원천데이터 접근을 엄격히 제한한다. 이에, IT 운영부서는 운영계와 데이터 창고에 있는 원천데이터를 보호할 책임을 갖는다. 현업 담당자는 데이터 창고에 직접 접근할 수 없다. 데이터가 있는 '하늘'을 한번 보려면 보안 서약을 하고 IT 운영부서와 법무팀 등 여러 단계의 결재를 거쳐 가명정보를 받아 사용한다. 이 부분이 우리 지능화의 동맥경화 지점이다.

데이터가 있는 '하늘'을 직접 못 보는데 어디에 '별'이 있는지 알 수 있을까? 지능화 시대에서는 협업 등 모든 직원이 데이터를 활용해야 한다. 이 구조적인 문제를 해결하지 않고는 우리 지능화의 미래는 없다. 하늘을 직접 보는 것이 위험해 불가능하다면 안전한 '보안경'을 쓰고 보자. 그 것이 바로 익명정보다. 데이터 창고에서 핵심 원천데이터를 뽑아 고순도 익명정보로 만들어 모든 직원이 서약 없이 자유롭게 접근할 수 있는 익명정보 창고에 넣자. 이 창고가 '공연계'이다. 

이렇게 하면 현업 담당자는 잠재적 범죄자가 될 각오로 보안 서약을 할 필요가 없어진다. 자신의 데이터 활용 결과가 꼭 성공해야 한다는 부담 없이 데이터 창고에 자유롭게 접근할 수 있는 것이다. 고순도 익명정보 재료의 재질을 만져보고 붙이면서 다양한 시도를 통해 창의적인 소조 조형물을 만드는 곳이다. 과거 AI 빅데이터 분석 보고서와 결과를 참고해 담당 업무의 지능화를 지속해서 향상시키는 장소이기도 하다.

산업화 시대의 지식 공유 공간은 도서관이다. 하지만 정보화 시대는 정보포털이고, 지능화 시대에서는 회사의 핵심 데이터를 공유하는 데이터관이 필요하다. 이곳이 '공연계'다. 정보화 시대에는 컴퓨터를 쓰지 못하면 '컴맹'이라 불렸다. 지능화 시대에 데이터를 활용하지 못하면 '데맹'이다. 디지털 전환 작업의 시작은 모든 현업 담당자에게 데이터 활용 교육을 제공하는 것이다.

비전공자에게 분석 기술 이론만 교육하는 건 효과가 떨어진다. 업무 도메인을 잘 이해하는 현업 담당자에게는 '공연계'에 있는 회사의 익명정보를 이용해 교육하는 것이 매우 효과적이다. 교육후에는 '공연계' 업무 데이터를 계속 이용해 지속해서 활용 능력을 향상할 수 있다.

'지능화'는 컴퓨터를 이용한 혁신이 아니라 데이터를 이용한 혁신이다. 개별 업무에서 발생한 과거 데이터를 이용해 현업 담당자가 해당 업무를 AI/빅데이터 기술로 지능화하면서 회사 전체 업무를 최적화하는 과정이다. 세계 최강인 미국은 우리와 데이터 환경이 다르다. 현업 담당자의 데이터에 대한 법적 접근성이 높아 '공연계'가 필요 없다.

데이터가 중심이 아닌 BPR과 ISP는 '반쪽'이다. 지능화 시대를 제대로 설계하지 못하기 때문이다. 우리의 '지능화' 설계도는 국내 개인정보보호법을 중심으로 개인정보 보호와 활용을 엄격히 구분해야 한다. '운영계'와 데이터 창고에 있는 원천데이터를 완벽히 보호하는 한편 '공연계'를 중심으로 AI 학습용과 분석용 익명정보 활용성을 높이는 전사 차원의 데이터 거버넌스 체계를 확립하는 '데이터전략계획(DSP)'이 현재 우리에게 필요하다. DSP가 없는 현재의 데이터 정책으로는 데이터와 AI강국이 될 수 없다. 익명 정보 기반의 DSP가 있어야 현업 담당자와 지능 자율사물간 최적 협업 방식을 자유롭게 설계하는 업무프로세스 최적화(BPO) 과정이 가능하다.

이원석 연세대 컴퓨터과학과 교수

필자 이원석 연세대 컴퓨터과학과 교수는...

미국 보스턴대학(Boston University)에서 컴퓨터공학으로 학부를 졸업했다. 석사와 박사는 미국 퍼듀대학에서 컴퓨터공학으로 학위를 받았다. 삼성전자에서 1년간 선임연구원으로 일했고 1993년부터 현재까지 연세대학교 컴퓨터과학과 교수로 재직하고 있다. 

지난 30년간 대학에 있으며 80여건의 데이터 관련 첨단 연구과제를 수행하며 데이터 분야에서 54건의 SCI급 국제 논문을 발표했다. 또 57편 국내 논문과 174편 국내 학술대회 논문도 발표했다. 그동안 170명의 석사와 22명의 박사를 배출했다.

관련기사

2005년 산업자원부 지정 최우수실험실로 뽑혔고, 2006년에는 과학기술부지정 국가지정연구실(NRL)에도 선정됐다. 2011년에는 대통령소속 국가정보화 전략위원회 실무위원으로 활동했고 같은 해 11월 국가정보화위원회의 청와대 보고에서 국가 차원의 빅데이터 활용을 담은 공공 빅데이터 기본계획을 수립하는데 기여했다.  

2012년 한국빅데이터포럼 운영위원장을 맡아 민간 빅데이터 활용을 위한 다양한 활동을했고, 2013년에는 공공데이터 전략위원회 빅데이터 전문위원장에 선임돼 6년간 활동했다. 최근에는 개인정보보호위원회의 제도발전위원으로 일했다.


*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.