베가스, 개인정보 보호 강화한 ‘재현자료’ 생성기법 개발

컴퓨팅입력 :2025/02/03 13:59

데이터분석 AI 전문기업 베가스가 개인정보 유출의 위험성을 통제하면서 데이터 활용도를 극대화하는 재현자료(Synthetic Data) 생성 기법을 개발했다고 3일 밝혔다.

재현자료 생성 기법을 활용한 주요 기술인 ‘재현자료 자동 생성 시스템’은 현재 특허 등록을 마친 상태다.

재현자료는 원본 데이터의 통계적 특성을 유지하면서도 개별 응답자의 개인정보를 보호하기 위해 특수한 형태로 생성된 데이터를 뜻한다. 데이터의 합계나 평균 등 통계적 추론 값은 원본 데이터와 비슷하지만, 유사성이 높아지더라도 개별 응답자의 정보는 노출되지 않도록 합성된 자료다.

베가스가 개발한 재현자료 생성 기법은 데이터 보호와 개방이라는 두 가지 가치를 동시에 충족시킬 수 있는 혁신적인 기술이며, 데이터의 활용 범위 확장과 세밀한 분석이 가능하게 한다. 또한 이 기술을 통해 만들어진 재현자료는 원본 데이터의 항목 간 상관성을 자동으로 탐지하고 이러한 상관성을 반영해 생성되기 때문에 활용성이 높다는 장점이 있다.

이같은 재현자료 기법을 적용해 생성된 재현자료는 다양한 분야에서 폭넓게 활용될 수 있다. 정부는 고용, 복지, 경제 등 분야에서 중요한 정책 결정을 내릴 때 활용할 수 있으며 기업은 시장 동향과 소비자 행동 분석 등을 수행할 때 재현자료를 적극 활용할 수 있다.

관련기사

이미희 베가스 R&D센터장은 “재현자료 기술은 데이터 보호와 활용의 균형을 맞추는 중요한 도전 과제이자 핵심 기술”이라며 “베가스는 AI 데이터 분석 기술 개발뿐만 아니라 데이터를 안전하게 활용하는 최신 정보보호 기술 연구도 지속적으로 해나갈 것”이라고 말했다.

한편 2009년 설립된 베가스는 60여명의 인력 대부분 통계, 데이터 분석, 컴퓨터 엔지니어링 분야 석박사 학위를 보유한 맨파워 그룹이다. 이 회사는 서울대, 한국과학기술원(KAIST), 건국대를 포함한 국내외 유수 연구진과 협업해 최근 3년간 과학기술정보통신부, 정보통신기획평가원(IITP)이 지원하는 '데이터 프라이버시 글로벌 선도기술 연구개발' 사업을 통해 데이터 보호 기술의 핵심인 재현자료 생성 기반 기술을 연구해왔다.