구글, '신스ID 텍스트' 오픈소스로 공개..."AI 작성 텍스트 잡아낸다"

신스ID 텍스트, AI 생성 텍스트 식별 및 비가시성 워터마크 삽입

인터넷입력 :2024/10/24 11:02

구글이 생성형 인공지능(AI) 모델이 작성한 텍스트 감지 및 워터마크 삽입 기술 '신스ID 텍스트'를 오픈소스로 공개했다. 이에 따라 개발자, 기업 등도 신스ID 텍스트를 사용할 수 있게 됐다.

더버지 등 외신에 따르면, 구글 딥마인드는 23일(현지시간) X 게시글을 통해 "신스ID 텍스트 워터마킹 도구를 오픈 소스로 공개한다"며 "개발자와 기업이 무료로 사용할 수 있고 AI에서 생성한 콘텐츠를 식별하는 데 도움이 될 것"이라고 밝혔다.

신스ID 텍스트는 AI 모델이 생성한 텍스트에 보이지 않는 워터마크를 삽입하는 기술이다. AI로 제작된 이미지, 영에 눈에 띄지 않는 워터마크를 삽입하는 기존 '신스 ID' 기술을 텍스트에 확대 적용한 것이다. 현재 텍스트용 신스ID는 AI 플랫폼 '허깅페이스(Hugging Face)'와 구글의 '책임감 있는 생성 AI 툴킷(Responsible Generative AI Toolkit)'에서 다운로드할 수 있다.

관련기사

구글 데이터센터 전경.

LLM은 텍스트를 문자, 단어, 구문 등 토큰으로 분해한 다음 특정 토큰 뒤에 나올 가능성이 높은 토큰에 대해 예측한다. 각 토큰은 문장의 다음 단어로 선택될 가능성에 대한 백분율 점수를 받는다. 백분율이 높을수록 출력 텍스트에 포함될 가능성이 높다. 이때 신스ID 텍스트는 토큰 선택 점수 패턴과 조정 확률 점수를 합쳐 출력된 텍스트를 생성형 AI 모델이 작성한 것인지 구분한다.

푸쉬밋 콜리 구글 딥마인드 AI 연구 부사장은 MIT 테크놀로지 리뷰와의 인터뷰에서 신스ID 텍스트를 언급하며 "이제 AI 개발자는 이 기술을 사용해 텍스트 출력이 대규모 언어 모델에서 나왔는지 감지할 수 있다"며 "더 많은 개발자가 책임감 있게 AI를 사용하기 더 쉬워질 것"이라고 말했다.