"미래 가스사용량 익명정보 활용 정확히 예측"

연대 이원석 교수팀, 경동도시가스와 함께 NIA 시행 '2023 데이터 활용 기획·검증 사업' 참여 성과

컴퓨팅입력 :2023/12/03 11:27    수정: 2023/12/03 12:48

 시간이 오래 걸리는 가명결합데이터 대신 익명정보를 활용해 미래 가스 사용량을 예측하는 분석 모델이 등장했다. 특히 이 분석 모델은 최대 1년 이상 걸리는 가명결합 데이터 대신 익명정보를 사용해 익명정보의 활용 가능성을 검증했다. 현재 국내 모든 도시가스회사는 매년 5개년 공급계획 과 1개년 약정물량을 수립해 한국가스공사의 승인을 받고 있는데, 기업 고객은 공정운영 이슈와 경기영향 등으로 물량 추정이 원활하지 않은 실정이다. 모델을 개발한 연세대학교 인공지능대학 컴퓨터과학과 이원석 교수 연구팀은 이 모델을 향후 전국 도시가스 사용량 예측을 위해 전국 도시가스회사로 전파할 계획이다.

과기정통부와 한국지능정보사회진흥원(NIA, 원장 황종성)이 추진하는 '2023년 데이터 활용 기획·검증 사업'에 참여하고 있는 연세대학교 인공지능대학 컴퓨터과학과 이원석 교수 연구팀은 도시가스 사용량 데이터를 활용해 익명데이터 기술을 검증하고 이를 활용한 도시가스 사용량 예측 모델 개발 과제를 진행, 막바지 완료를 앞두고 있다고 3일 밝혔다. 이 과제는 최종 결과보고회와 성과 평가를 거쳐 내년 1월 사업비 정산 과정을 마치면 최종 마무리된다.

이 교수 연구팀이 참여하고 있는 '데이터 활용 기획·검증 사업'은 데이터를 활용해 사회에 유의미한 사례 창출을 위한 것으로, 매년 공모로 사업자를 선정한다. 올해는 연세대학교를 포함해 3개 과제를 선정했다. 최종 성과평가 결과를 토대로 실증 서비스 개발 사업인 '데이터 플래그십 사업'으로 연계할 계획이다.

이원석 연대 컴퓨터과학과 교수(오른쪽 줄 모니터 앞)가 학생들과 과제를 논의하고 있다.

 이 교수 연구팀 과제는 울산광역시와 경상남도 양산시에 도시가스를 공급하는 경동도시가스가 참여했고, 경동도시가스가 보유한 개인 및 기업 고객의 과거 가스 사용량 원본데이터를 이용해 크게 두 가지 목적을 위해 과제를 진행했다.

첫 번째 목적은 개인정보를 담고 있는 원본데이터를 이용해 개별 고객의 미래 가스 사용량을 정확히 예측하는 분석 모델을 개발해 경동도시가스의 가스 사용량 예측 업무를 고도화하는 것이다. 

두 번째 목적은 국내 10여개 도시가스 공급회사들이 지역별로 도시가스를 분할해 공급하는 현실에서 국가차원의 도시가스 사용 총량을 정확히 예측하기 위해서는 가명정보 결합전문기관을 통해 법인들이 갖고 있는 고객데이터를 가명결합해야 하는데 이는 최대 1년 이상 걸리는 단점이 있다. 이에, 1년 이전의 과거데이터를 사용해 예측하면 총사용량의 유효성이 문제가 되기때문에 이 문제를 해결하기 위해 이 교수 연구팀은 이번 과제에서 익명정보를 사용해 익명정보의 활용 가능성을 검증했다.

특히 이 교수 연구팀은 자체 개발 솔루션으로 원본 데이터를 개인 재식별이 불가능하게 익명처리하게 해주는 'MASQ(Multi level Abstraction & Synchronization Quest, 마스Q)'를 이용해 원본데이터를 익명정보로 생성했다. 여기에 추가로 완벽한 익명성을 검증하기 위해 유럽 개인정보보호법(GDPR)의 익명성 요건들을 측정하는 솔루션인 'AnonyTester'를 이용해 개인재식별도와 개인추정도 등의 익명성 지표를 측정해 익명정보를 생산하고 검증했다. 더불어 익명정보의 개인추정도를 원하는 익명성 수준으로 낮춰 보정하는 개인추정도 보정 기능 효과도 검증했다. 

이 교수는 "원본데이터를 이용해 개발한 미래 가스사용량 예측 모델에 익명정보를 적용한 결과 원본데이터를 이용한 예측 결과와 매우 유사함을 입증했다"면서 "개인고객의 경우 원본데이터의 예측정확도 88%에 대해 MASQ 익명정보의 예측정확도가 86.2%였고, 법인고객의 경우 원본데이터와 MASQ 익명정보의 예측정확도가 각각 77.5%와 82.9%로 확인돼 개인정보보호법에 규제를 받지 않는 익명정보의 활용 효용성을 실체적으로 실증했다"고 밝혔다.

이어 "가명결합 문제점을 해결하면서 국가 가스 총사용량을 신속히 예측하기 위해서는 모든 가스공급회사들의 최신 데이터를 신속하게 통합해야 한다. 이를 위해 이번 과제에서 MASQ의 익명식별자기반 익명성과 효용성을 경동도시가스 데이터를 이용해 익명결합한 결과, 가명결합과의 차이를 최소 2%에서 최대 40%까지 조절하면서 익명결합의 익명성 수준을 관리할 수 있음을 입증했다"면서 "이번 과제의 익명결합 기술 실증으로 개인정보보호법상 유일한 데이터 결합 방법인 결합전문기관의 가명결합 방법 이외에 법적 규제 없이 자유롭게 데이터를 결합할 수 있는 방법을 실증했으며, 가까운 미래에 익명결합을 활용한 국가 도시가스 수급 예측 모델 개발이 가능할 것으로 생각한다"고 덧붙였다.

관련기사

실제 이 교수 연구팀은 국내 데이터를 보유한 기업과 컨소시엄을 구성해 법적 제약 없이 원본데이터를 자유롭게 익명정보로 가공, 검증, 유통할 수 있는 서비스를 과기정통부의 규제샌드박스 과제로 신청해 실제 환경에서 익명정보 기술 및 유통의 안전성과 효용성을 입증할 계획이다.

또 경동도시가스는 이번 과제에서 개발한 가스 사용량 예측 모델을 영업계획을 위한 자료로 활용할 예정이며, 향후 개인고객용 공급비용 산정을 위한 근거자료로 활용할 의사가 있음을 밝혔다고 이 교수 연구팀은 설명했다. 이 교수 연구팀은 전국적인 가스 사용량 예측 모델 전파를 위해 전국 도시가스사를 대상으로 이를 알리는 홍보 세미나를 실시, 전국 도시가스 데이터 확보를 통한 국가적 차원의 탄소중립 로드맵 수립 가능성을 제안할 계획이다.