"딥페이크 차단"…샌즈랩, AI 범죄 막는 플랫폼 개발 착수

사이버보안 특화 소형언어모델·국민 체감형 플랫폼 구축 예정

컴퓨팅입력 :2024/08/28 17:38

샌즈랩이 생성형 인공지능(AI)을 악용한 허위 정보와 저작권 침해, 딥페이크 차단에 나섰다. 

샌즈랩은 생성형 AI 역기능 억제를 위한 사이버 보안 특화 검색증강생성(RAG) 기반 소형언어모델(sLLM)과 국민 체감형 플랫폼을 개발 중이라고 28일 밝혔다. 

생성형 AI 역기능이란 AI 기술이 허위 정보 및 가짜 뉴스 생성, 저작권 침해, 딥페이크 생성, 사이버 범죄 약용 등의 부정적이거나 예상치 못한 방식으로 악용되는 것을 말한다. 이에 정부는 모든 국민이 안전하게 AI를 활용할 수 있도록 생성형 AI의 윤리적 활용을 위한 제도 보완과 핵심기술 개발에 많은 노력을 기울이고 있다.

생성형 AI 역기능 탐지 대응 기술 개발 이미지. (사진=샌즈랩)

과학기술정보통신부와 정보통신기획평가원(IITP)은 AI 역기능 억제를 위한 사이버 보안 특화 RAG 기반 sLLM 모델 개발과 국민 체감형 플랫폼 구축을 과제로 총 100억 규모 '정보보호 핵심 원천기술 개발사업'을 발주했다. 지난 4월 해당 사업을 수주한 샌즈랩은 엘지유플러스, 포티투마루, 로그프레소, 한국과학기술원(KAIST)와 공동 연구에 착수했다.

사업 핵심은 딥페이크, 보이스피싱, 음성 합성 등 AI 역기능 방지 기술과 온프레미스 기반 sLLM 개발을 목표로 한다. 생성형 AI 역기능으로 인한 피해를 최소화하고 디지털 환경의 안정성 및 신뢰성 향상에 기여함은 물론 정보 조회 및 분석의 신속화로 의사결정 지원 시간의 단축과 대화형 인터페이스 개발로 사용자 경험 중심의 보안 서비스를 제공하는 것이 목적이다.

샌즈랩은 AI 모델 개발을 위한 필수 요건인 데이터셋을 페타바이트(Petabyte) 규모로 자체 보유하고 있다. 특정 분야를 식별하는 AI 모델이 필요한 수집 및 전처리된 데이터를 즉시 학습해 곧바로 탐지 및 대응 통합 시스템에 활용할 수 있는 셈이다. 이를 위한 분야별 데이터셋 구축, sLLM 및 대화형 인터페이스 개발을 통해 사이버 보안에 특화된 다양한 AI 기술 기반 응용 서비스의 연구개발에 유용하다는 평가를 받고 있다.

이번 연구개발 과제 중 하나인 생성형 AI 역기능 탐지 대응 기술을 통한 국민 체감형 플랫폼은 최근 사회적 문제로 가장 대두되고 있는 피싱 공격, 허위 정보 생성, 악성코드 대량 생산, 음성 합성, 딥페이크 이미지·영상 제작 같은 디지털 범죄 근절과 피해 확산을 막기 위한 대책 마련에 따른 개발이다.

관련기사

샌즈랩 AI 기술개발팀은 엘지유플러스와 공동 연구개발하는 딥페이크 영상·이미지 탐지 기술은 심층 학습 기반의 알고리즘 개발, 생성적 적대 신경망(GAN) 기술에 대항하기 위한 적대적 학습 방법 적용, 멀티 모달 데이터 분석을 통해 더욱 정확하고 정밀하게 딥페이크를 탐지할 수 있다고 강조했다. 실시간 비디오 스트리밍이나 소셜 미디어 플랫폼에서의 즉각적인 탐지를 위해 모델을 경량화함으로써 복잡도는 최소화하고 탐지 정확도는 유지하거나 올릴 수 있는 최적화 기법을 적용할 방침이다.

샌즈랩 관계자는 "딥페이크를 비롯해 피싱 메일, 악성코드, 음성 합성, 가짜 뉴스 등을 탐지하는 국민 체감형 플랫폼은 각종 탐지 기술은 물론 결과 설명을 위한 RAG, 암호화 해제 등 다양한 AI 관련 기술들이 모인다"며 "국내 보안 기술에 대한 신뢰 구축에 중요한 기여를 할 것으로 보인다"고 강조했다.