'가명정보' 활용 1년…"비정형 데이터도 준비"

범정부 추진과제 발표…온·오프라인 인프라 확대 및 제도 합리화

컴퓨팅입력 :2021/07/28 18:00    수정: 2021/07/29 09:38

'데이터 3법'이 시행되면서 정보 주체를 알 수 없게 처리한 개인정보인 가명정보를 결합·분석해 활용할 수 있게 된 지 약 1년이 지났다. 정부는 향후 가명정보 활용을 지원하는 제도적 기반을 더 체계화하고, 인공지능(AI)의 핵심 자원으로 꼽히는 비정형 데이터도 가명정보로 활용할 수 있도록 준비할 계획이다.

비정형 데이터는 미리 정의된 구조에 따라 정리된 데이터인 정형 데이터의 반대말이다. 정형 데이터가 숫자, 글자 등 텍스트 기반이라면 비정형 데이터는 이미지, 영상 등으로 구성된 데이터를 뜻한다. 정형 데이터와 달리 비정형 데이터의 경우 제도 상에서 가명처리 방식이 없어 데이터 간 결합 및 분석이 어려운데, 이에 대해 구체적인 기준을 마련한다는 것이다.

28일 개최된 '가명정보 성과보고회'에서 정부가 발표한 주요 추진과제에는 이같은 내용이 담겼다.

(사진=이미지투데이)

비정형 데이터 지원을 포함한 가명정보 활용 활성화와 함께 전문기관 및 지역별 지원센터 중심의 제도 접근성 향상, 가명정보 결합 과정에서의 안전성 향상 등이 추진될 예정이다.

정부는 이 중 법령 개정 없이 개선이 가능한 과제는 오는 9월까지 우선 마무리하고, 법령 개정이 동반되는 과제는 개인정보보호법 및 시행령 개정을 연내 추진한다고 밝혔다. 가명정보 결합 고시, 가명정보 처리 가이드라인 상의 절차·기준 구체화 및 관련 서식 제공을 위한 개정은 9월까지 완료된다. 가이드라인 내용 중 가명·익명 처리 수준 체크리스트를 포함한 2차 개정은 연내로 계획했다.

추진과제가 이행될 경우 가명정보 결합 기간이 40.5일에서 20일 수준으로 단축되고, 전문기관은 지난해 말 기준 9개에서 올해 말 27개로 확대될 것으로 봤다. 이에 따라 가명정보 결합사례도 현 105건에서 내년 300건 이상 축적되고, 결합 분야도 다양해질 것으로 전망했다.

가명정보 활성화 방안 주요 기대효과

■크고 복잡한 데이터도 '가명정보'로…전문 인력도 매년 600명 양성

가명정보 활용을 두고 산업계가 호소한 문제를 해결하기 위해 정부는 기술 개발 및 전문 인력 확보에 나선다.

기술 개발 측면에선 대용량 정형 데이터, 비정형 데이터 등 데이터 처리 기술을 고도화한다.

개인정보보호위원회는 연구개발(R&D) 과제로 '대화형 및 실시간 대용량 데이터 등에 대한 가명·익명 처리 기술개발'을  마련, 내년부터 2025년까지 완료하는 것을 목표로 잡았다.

보건복지부는 유전체, 음성정보 등에 대한 가명처리 연구 및 안전한 보호·활용 기술개발을 추진 중이다. 사업 기간은 지난 2019년부터 2023년까지로, 총 사업비 310억원이 투입될 예정이다.

과학기술정보통신부는 올해부터 정형·비정형 데이터의 가명 처리 자동화 및 안전성 검증 기술개발을 하고 있다. 오는 2024년까지 총 사업비 114억원이 투입된다.

출처=픽사베이

인력 양성 측면에선 가명처리 및 적정성 검토, 반출심사 등을 수행할 수 있는 전문 인재를 연 600명 양성하고, 가명‧익명처리 경험‧실무 지식 등을 밀착 지원하는 맞춤형 컨설팅도 연 50회 이상 제공할 계획이다.

데이터 바우처 지원을 확대해 경제적 여력이 부족한 중소기업 및 스타트업의 부담을 덜고, 가명정보 활용에 대한 사회 인식도 확산한다. 개인정보위는 데이터 가명처리 및 가명정보 결합 활용 전 과정에 대한 지원 체계를 구축한다. 과기정통부는 데이터 가공 및 결합 교육과 컨설팅에 대한 비용 지원 예산으로 164억원을 마련했다.

■결합전문기관 제도 손질…데이터 처리 전·후 역할 확대

데이터의 가명처리 및 결합, 분석을 지원하는 결합전문기관의 기능 확대 및 분야별 전문화도 추진된다.

우선 데이터 결합 및 반출에 한정된 전문기관의 기능을 사전 가명처리, 컨설팅, 분석 등 결합의 전 단계로 확대할 방침이다.

전문기관의 인력, 재정 요건은 완화된다. 인력의 경우 법률·기술 전문가 중 1인에 한해 법인, 단체, 기관 내 다른 조직 소속 직원의 겸임 허용 또는 전문가 요건 완화가 이뤄질 예정이다. 공공기관의 경우 자본금 50억원 이상인 재정 요건이 미적용된다.

데이터를 결합한 후 가명·익명처리해 결과값을 전달하는 '데이터전문기관'과 결합전문기관 간 지정 절차는 간소화된다.

결합전문기관을 지정하는 부처별 성격에 따라 국토, 의료 등 분야별 특화 기관 및 특화 결합 서비스 모델도 구축될 예정이다.

온·오프라인을 아우르는 통합 지원 체계를 위해 지역별로 가명정보 활용을 일괄 지원하는 '가명정보 활용지원센터'를 구축한다. 강원도 원주를 시작으로 내년에는 지역 센터 4곳이 추가 운영될 전망이다.

가명정보 활용 지원체계

가명·익명처리 테스트베드는 기능을 확대하고 지역 활용지원센터와 연계해 서비스 표준화, 교육·컨설팅 운영 등을 수행하게 된다.

정부는 수요기관과 데이터 보유기관, 결합전문기관 연계를 지원하는 '매칭 지원시스템'이 오는 11월 개발되면 내년 참가기관의 소통·협업이 가능한 온라인 시스템을 구축할 계획이다.

가명정보 활용 통합 플랫폼

■필요한 정보만 취사선택…가명정보 결합 제도 유연성 확대

가명처리·결합 과정에서의 안전성 확보 절차도 명확화, 간소화된다.

안전성 강화를 위해 가명처리·결합 주요 단계별 상세 체크리스트 개발·보급 및 제3자 제공 시 개인정보 보호 수준 확인 절차 구체화가 추진된다. 가명처리 목적에 필요한 기간이 지나면 가명정보를 지체없이 파기하고, 관련 기록은 파기 후 3년 이상 보관하는 것도 의무화된다.

해석 상 혼란이 있었던 가명정보 특례 적용범위도 명확하게 정비할 계획이다. 현행 개인정보보호법은 가명정보 활용이 가능한 경우로 '통계작성, 과학적 연구, 공익적 기록보존 등'을 명시하고 있다. 정부는 산업적 활용도 특례에 포함된다는 입장이나, 이에 대한 해석 논란이 지속적으로 제기돼왔다.

가명정보 국외 이전은 개인정보와 동일 규정을 적용해 보호한다는 방침이다.

탄력적인 제도 운영을 위해 결합 키 기반 '결합률 사전확인', 필요한 최소한의 정보만 전문기관에 전송하는 '추출결합', 일부 결합 정보로 테스트해 결합 효과를 예측하는 '모의결합' 등의 결합절차를 도입한다. 데이터 결합의 효율성과 안전성을 높이고, 비용을 낮춘다는 취지다. 반복적·주기적 결합은 반출심사위를 면제하는 등 절차가 간소화될 전망이다.

결합률을 높이기 위해 주민등록번호 일부를 활용한 결합 키 생성도 허용할 계획이다. 안전성 확보를 위해 생년월일, 성별 외 한 자리 수만 활용하는 등의 생성방안이 검토될 예정이다.