AI 생성 글, 지금보다 수준 높아지면 구분 불가능…수학적 증명 나왔다

스페인 발렌시아 폴리테크닉 대학교 연구원이 놀라운 사실을 밝혀냈다. 챗GPT나 클로드 같은 AI가 쓴 글을 완벽하게 가려내는 것이 수학적으로 불가능하다는 것이다. 연구진은 물리학의 유명한 법칙을 빌려와 이 현상을 설명했다. AI 기술이 발전할수록 구별은 더욱 어려워질 수밖에 없다는 결론이다.

물리학 법칙으로 본 AI 글쓰기의 비밀

연구진은 물리학의 '하이젠베르크 불확정성 원리'를 AI 글쓰기에 적용했다. 이 법칙은 아주 작은 입자가 어디 있는지와 얼마나 빠르게 움직이는지를 동시에 정확히 알 수 없다는 내용이다. 연구진은 이와 똑같은 일이 AI 글쓰기에서도 일어난다고 설명한다.

글을 누가 썼는지 정확히 알아내려 할수록, 그 글이 원래 가진 자연스러움이 깨진다는 것이다. 마치 시소처럼 한쪽을 올리면 다른 쪽이 내려가는 관계다.

연구진은 복잡한 계산으로 이를 증명했다. 사람이 쓴 글과 AI가 쓴 글의 통계적 차이를 나타내는 '총변동거리'라는 값이 0에 가까워지면, 어떤 프로그램도 동전 던지기처럼 50%의 확률로밖에 맞히지 못한다. 이는 '핀스커 부등식'이라는 수학 법칙으로도 뒷받침된다. 기술이 부족해서가 아니라 원래 불가능한 일이라는 뜻이다.

98% 맞히던 프로그램도 결국 무용지물

현재 AI가 쓴 글을 찾아내는 방법은 크게 세 가지다.

첫 번째는 글쓰기 습관을 분석하는 방법이다. 문장 길이, 자주 쓰는 단어, 문법 특징 등을 살펴 AI가 썼는지 판단한다. 프자스탈스키 연구팀은 이 방법으로 GPT-4가 쓴 요약문과 사람이 쓴 위키피디아 항목을 98%의 정확도로 구별했다. 프레이저 연구팀도 AI가 문법적으로 더 표준화된 표현을 쓰고 독특한 단어 사용이 적다는 차이를 발견했다

두 번째는 AI로 AI를 잡는 방법이다. 많은 글을 학습한 특별한 프로그램을 만들어 AI가 쓴 글을 구별한다. 통제된 실험 환경에서는 90% 이상 맞혔다. 하지만 실제 상황에서는 정확도가 크게 떨어진다.

세 번째는 워터마크다. AI가 글을 쓸 때 사람 눈에는 안 보이지만 컴퓨터로는 확인할 수 있는 특별한 표시를 남기는 방식이다. 키르헨바우어 연구팀이 개발한 이 방법은 비밀 키를 사용해 단어 선택 확률을 조정해 탐지 가능한 패턴을 남긴다.

하지만 이 모든 방법에 문제가 있다. AI가 특정 작가처럼 글을 쓰는 법을 배우면 첫 번째 방법은 소용없다. 히 연구팀은 특수한 교란 기법이나 문장 바꾸기로 탐지 정확도를 거의 무작위 수준으로 낮출 수 있음을 증명했다. 세 번째 방법은 글을 다시 쓰거나 편집하면 표시가 지워진다. 결국 AI가 발전할수록 이런 방법들은 점점 무용지물이 된다.

AI의 글쓰기 방식, 양자 세계와 닮았다

연구진은 AI가 글을 쓰는 방식을 아주 작은 입자의 세계에 비유했다.

AI는 다음 단어를 고를 때 수천, 수만 개의 단어 중 어떤 걸 쓸지 미리 정하지 않는다. 모든 단어가 선택될 가능성을 동시에 갖고 있다가, 마지막 순간에 하나를 고른다. 마치 주사위를 던지기 전까지 어떤 숫자가 나올지 모르는 것과 비슷하다.

연구진은 AI가 사용하는 소프트맥스 함수가 마치 양자 상태처럼 작동한다고 설명한다. 단어를 실제로 선택하는 순간은 양자 측정처럼 여러 가능성 중 하나로 확정되는 것과 같다. 이 과정은 되돌릴 수 없고 확률에 따라 결정된다.

문제는 AI가 자연스러운 글을 쓰려고 노력할수록 탐지가 어려워진다는 점이다. AI가 단어 선택의 폭을 넓혀 다양한 표현을 쓰면, 특정 패턴을 찾기 어렵다. 반대로 탐지하기 쉽게 특정 패턴을 유지하면 글이 어색해진다. 이것이 바로 연구진이 말하는 '불확정성의 맞바꿈' 관계다.

이제는 찾아내기보다 밝히는 게 답

연구진은 완벽한 탐지가 불가능하다면 방법을 바꿔야 한다고 제안한다. 숨바꼭질하듯 AI를 찾는 대신, 처음부터 AI 사용을 밝히도록 하자는 것이다.

구체적인 방법으로 세 가지를 제시했다. 첫째, 암호화 워터마킹과 디지털 서명을 의무화한다. 둘째, 블록체인 같은 기술로 글이 어떻게 만들어졌는지 기록을 남긴다. 셋째, AI를 사용했다면 숨기지 말고 밝히도록 규칙을 만든다.

특히 교육 분야에서는 더 이상 AI 사용을 막는 데 집중하지 말고, AI를 잘 쓰는 법을 가르쳐야 한다고 강조했다. AI를 활용하면서도 스스로 생각하는 능력을 키우는 교육이 필요하다는 것이다.

연구진은 "앞으로는 '누가 썼는가'보다 '어떻게 만들었는가'와 '믿을 수 있는가'를 물어야 한다"고 말했다. 사람이 100% 쓴 글과 AI가 100% 쓴 글로 나누는 것보다, AI가 어떤 역할을 했는지 밝히는 게 더 중요하다는 설명이다.

산업 지형 변화의 신호탄, 탐지에서 투명성으로

이 연구는 AI와의 숨바꼭질이 결국 우리가 질 수밖에 없는 게임임을 보여준다. 이는 여러 중요한 교훈을 준다.

첫째, 정부와 기업은 탐지 프로그램 개발에 돈을 쓰기보다 AI 사용 표시 시스템을 만드는 데 투자해야 한다.

둘째, 학교는 AI 사용을 막으려 하지 말고 올바르게 쓰는 법을 가르쳐야 한다. AI 시대에는 AI를 잘 활용하는 것도 중요한 능력이기 때문이다.

셋째, 신문사와 출판사는 새로운 검증 방식이 필요하다. 단순히 AI를 썼는지만 따지지 말고, 어떤 과정을 거쳐 만들어졌는지를 중요하게 봐야 한다.

마지막으로 우리는 '진짜'의 의미를 다시 생각해야 한다. 100% 사람이 쓴 글과 100% AI가 쓴 글로 나누는 것보다, AI가 얼마나 도움을 주었고 사람이 어떻게 검토했는지가 더 중요한 기준이 될 것이다.

주목할 점은 이 변화가 역설적으로 AI 도구 시장의 확대로 이어질 수 있다는 것이다. 탐지 불가능성이 증명되면서 'AI 사용'이 더 이상 숨겨야 할 것이 아니라 효율적으로 활용해야 할 도구로 인식될 수 있기 때문이다. 투명하게 AI를 활용하는 것이 새로운 경쟁력이 될 것이다.

결국 이 연구는 AI 콘텐츠 생태계 전체에 근본적 질문을 던진다. '진짜와 가짜'의 이분법이 아니라 '신뢰할 수 있는 과정'이 중요한 시대로의 전환이다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI가 쓴 글을 구별할 수 없다는 게 무슨 뜻인가요?

A1. AI가 사람처럼 글을 쓰는 법을 완벽하게 배우면, 어떤 방법으로도 구별할 수 없다는 뜻입니다. 가장 좋은 프로그램도 동전 던지기처럼 반반의 확률로만 맞힐 수 있습니다. 기술이 부족해서가 아니라 원래 불가능한 일입니다.

Q2. 지금 쓰는 AI 탐지 프로그램은 왜 작동하나요?

A2. 현재 AI가 아직 완벽하지 않아서 특정 버릇이나 패턴을 보이기 때문입니다. 탐지 프로그램은 이런 차이를 찾아냅니다. 하지만 AI가 계속 좋아지면서 이런 차이가 점점 없어지고 있어서, 탐지가 갈수록 어려워집니다.

Q3. AI 글을 구별할 수 없다면 어떻게 해야 하나요?