"AI가 개인정보만 잊게 한다"…BBC가 '이 대학' 연구 주목한 이유는

우 사이먼 성일 성균관대 교수 "개인정보 삭제하는 '머신 언러닝' 기술로 AI 책임·혁신 실현"

컴퓨팅입력 :2024/10/07 16:19    수정: 2024/10/08 09:47

"인공지능(AI)이 학습한 개인정보를 재학습 없이도 삭제할 수 있는 기술을 개발했습니다. 이는 AI 성능을 유지하면서도 개인정보 보호를 실현하는 최적의 방법입니다."

성균관대학교에서 AI와 사이버 보안을 연구하는 우 사이먼 성일 교수 겸 대시랩(Dash Lab) 소장은 최근 성대 수원 자연과학캠퍼스에서 기자와 만나 자신의 최신 연구 성과인 '머신 언러닝(Machine Unlearning)' 기술을 설명하며 이같이 밝혔다. 그는 AI 기술의 급속한 발전으로 개인정보 보호가 중요한 이슈로 부각되고 있는 상황에서 일부 데이터를 효율적으로 제거하는 기술의 필요성을 강조했다.

7일 업계에 따르면 최근 AI가 방대한 데이터를 학습하면서 개인정보까지 처리해 프라이버시를 침해하는 사례가 증가하고 있다. 이에 따라 개인정보 데이터를 AI 내에서 효율적으로 삭제하는 처리절차가 점점 더 중요한 과제로 부상하고 있다.

우 사이먼 성일 성균관대학교 소프트웨어학과 부교수 겸 대시랩 소장 (사진=조이환 기자)

기존에는 AI 모델에서 개인정보를 포함한 일부 데이터를 삭제하려면 모델 전체를 처음부터 재학습시켜야 해 엄청난 시간과 비용이 소요됐다. 이러한 비효율을 해결하기 위해 우 교수가 최근 개발하고 특허를 낸 것이 '머신 언러닝' 기술이다.

머신 언러닝은 이미 학습된 딥러닝 모델에서 특정 데이터만을 선택적으로 삭제하는 기술이다. 민감한 정보가 포함된 데이터를 명령에 따라 효율적으로 제거하면서도 모델을 처음부터 재학습할 필요 없어 시간과 비용을 크게 절감하는 동시에 성능을 유지할 수 있다.

우 교수는 "'챗GPT' 등 거대 언어 모델(LLM)에서 특정 데이터를 삭제하고 다시 학습하려면 최소 3개월에서 6개월의 시간과 수백만 달러의 비용이 든다"며 "머신 언러닝 기술은 이러한 문제를 해결해 기업과 개인 모두에게 효율적인 솔루션을 제공할 가능성을 열었다"고 설명했다.

이 기술의 핵심은 고급 알고리즘을 활용해 일부 데이터를 제거하면서도 나머지 데이터를 보호하는 방식에 있다. 딥러닝 모델이 제거 대상 데이터를 더 이상 학습에 반영하지 않게 하면서도 발생가능한 부작용을 최소화한다. 이에 따라 모델은 삭제된 데이터를 제외하고 남은 데이터만으로도 빠르게 학습을 완료해 전체 모델의 성능과 정확성을 유지한다.

'언러닝' 기술 실험 결과 기존에 4만5천 장의 데이터를 학습해야 했던 것이 5천장으로 감소했으며 학습 시간도 4천초에서 77초로 단축됐다. (사진=대시랩)

그는 "기존에는 4만5천 장의 데이터를 재학습해야 했던 것을 이 기술을 통해 5천 장만 학습시켜도 되게 됐다"며 "학습 시간 역시 4천 초에서 77초로 대폭 단축됐다"고 설명했다.

우 교수의 연구실은 AI 해악 방지 기술 개발로 국제적으로도 주목받고 있다. 실제로 그는 최근 딥페이크와 생성 AI를 이용한 가짜사진을 탐지하는 기술을 개발해 영국 공영방송사인 BBC로부터 자문 요청을 받았다.

BBC는 그의 논문 '대조 학습을 이용한 이미지 위조 탐지(CFL-Net : Image Forgery Localization Using Contrastive Learning)'에 주목했다. 이 논문은 대조 학습을 활용한 이미지 위변조 탐지 기술을 다룬 연구로, 위성사진뿐만 아니라 일반 이미지나 영상에도 적용 가능해 언론사들의 보도 정확성을 비약적으로 향상시킬 잠재력이 있다.

그는 "BBC가 우리 논문을 보고 가짜 이미지를 탐지할 수 있는 기법에 대해 문의해 왔다"며 "딥페이크와 같은 조작된 콘텐츠를 판별하는 기술이 사진의 진위를 판단해야하는 언론사에 필수적이기 때문에 연락한 것 같다"고 밝혔다.

지난해 우 교수가 발간한 '대조 학습을 이용한 이미지 위조 탐지' 논문 (사진=CVF 오픈 액세스 캡처)

우 교수가 이렇게 희귀하면서도 혁신적인 기술들을 개발할 수 있었던 배경에는 사이버 보안 분야에서의 오랜 연구 경험이 있다. 실제로 그는 성대 교수 부임 전에는 미 항공우주국(NASA), 인텔 등에서 사이버 보안 관련 연구를 수행한 경력이 있다.

우 교수는 "많은 연구자들이 AI나 정보 보안 중 한 분야에만 집중하는 것과 달리 두 분야를 모두 연구할 수 있었다"며 "이러한 간학문적 접근이 개인정보 보호와 AI 성능 향상을 동시에 이룰 수 있는 기술 개발로 이어졌다"고 밝혔다.

또 그는 "인공지능은 인간에 대한 보호와 함께 가야 한다는 마음으로 사람을 보호하는 기술에 매진하고 있다"고 강조했다.

우 사이먼 성일 교수 (사진=대시랩)

우 교수의 연구들은 정부의 다양한 지원 사업 덕분에 가능했다. 특히 지난 2022년 시작된 언러닝 연구는 과학기술정보통신부의 재원과 정보통신기획평가원(IITP)의 지원을 통해 진행됐다. '개인정보 보호 정책 변화를 유연하게 반영하고 준수할 수 있는 AI 플랫폼 연구 및 개발'이라는 프로젝트 하에 수행된 이 연구는 개인정보 보호 관련 정책 변동에 신속하게 대응하는 AI 개발을 목표로 하고 있다.

그는 "기업들은 돈이 되지 않는다고 생각해 혁신에만 투자를 하는 경향이 있다"며 "감사하게도 정부 지원 덕분에 안전과 혁신이 같이 가는 방향에 기여할 수 있었다"고 밝혔다.

그러면서 "언러닝 기술로 시간과 비용이 절약되니 전 세계 어느 곳의 규제에도 발 빠르게 대응할 수 있게 돼 기업에도 실질적인 이익을 가져다줄 수 있다"고 덧붙였다.

우 교수는 랩실 연구 외에도 AI 인재 양성에 힘쓰고 있다. (사진=대시랩)

우 교수는 랩실 연구 외에도 AI 인재 양성에 힘쓰고 있다. 성균관대가 실시하는 BK21, 인공지능대학원 및 융합보안대학원 사업 등을 통해 학생들이 AI 실무에 적합한 인재로 성장하도록 지원하고 있기 때문이다.

관련기사

우 교수는 "전공자뿐만 아니라 문과 등 비전공자들도 AI 전문가로 성장할 수 있도록 다양한 교육 프로그램을 운영하고 있다"며 "취업이 어려워 고민하는 요즘 청년들이 실무 능력을 키우는 데 도움이 될 것"이라고 말했다.

이어 "인간을 위한 AI를 개발하는데 힘쓰는 동시에 사회에 도움되는 실사구시형 AI 인재를 키우는데도 집중하겠다"고 강조했다.