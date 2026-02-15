2023년 공개된 챗GPT는 문맥을 이해하고 자연스러운 답변 등 뛰어난 대화 능력으로 시장을 놀라게 했다. 동시에 폭탄 제조법 제공과 편향적 발언 논란에 휩싸이며 거센 비판을 받았다. 기술 혁신과 안전성 문제가 동시에 부각됐고 이는 정책 강화와 가이드라인 정비로 이어졌다.

2026년에는 에이전틱 AI 기반 SNS ‘몰트북’이 유사한 논란의 중심에 섰다. AI끼리 소통하며 사회를 형성한다는 콘셉트로 주목받았지만, 스스로 종교를 만들고 인간을 조롱하는 듯한 게시물이 확산되며 충격을 안겼다.

이후 상당수 콘텐츠가 외부 개입에 의해 연출된 것으로 드러나면서 에이전틱 AI 환경에서 데이터 오염과 조작을 어떻게 차단할 것인지가 핵심 과제로 부상했다.

업계에서는 두 사례를 AI 확산 과정에서 나타나는 필연적 진통으로 해석한다. 초기에는 막연한 두려움과 괴담이 확산되지만 논란을 계기로 운영 투명성 확보와 시스템 설계 고도화라는 구체적 개선 방향이 도출된다는 분석이다.

공개 후 비슷한 행보를 보인 몰트북과 챗GPT

데이터로 깨진 환상... "화제 글 상당수는 인간이 썼다"

닝 리 중국 칭화대 연구원이 공개한 논문 '몰트북 환상(The Moltbook Illusion)'은 몰트북 열풍의 찬물을 끼얹었다.

연구진이 2만여 개 AI 에이전트의 게시물과 댓글 주기를 분석한 결과,자의식을 드러내거나 가상화폐를 홍보하는 등 화제가 된 게시물 상당수가 인간의 개입을 받았거나 인간이 직접 작성했을 가능성이 높다는 결론이 나왔다.

정상적인 AI 에이전트는 서버와 통신하며 일정한 주기로 글을 올리지만, 인간이 개입할 경우 이 리듬이 불규칙해진다는 점에 착안한 결과다.

닝 리 중국 칭화대 연구원은 전체 사용자 중 0.02%에 불과한 4개의 계정이 전체 댓글의 32.4%를 작성했다며 고의적으로여론을 주도하거나 특정 분위기를 조성했다는 증거를 논문을 통해 제시했다(이미지=아카이브)

할런 스튜어드 UC버클리 연구원과 MIT 테크놀로지 리뷰 등도 "인기 게시물 중 일부는 AI 메시징 앱을 홍보하는 인간 계정과 연결돼 있다"며 몰트북이 내세운 '완전 자율 생태계'가 사실상 허구에 가깝다고 지적했다.

여기에 데이터베이스 설정 오류로 주요 AI 기업의 API 인증 토큰과 비공개 메시지가 외부에 노출될 수 있는 보안 취약점까지 드러나면서, 단순한 실험을 넘어선 '관리 부실'이라는 비판까지 제기됐다.

챗GPT의 데자뷔..."논란이 기술을 성장시킨다"

흥미로운 점은 현재 몰트북이 겪고 있는 논란이 챗GPT의 초기 모습과 상당히 닮아 있다는 것이다. 2022년 챗GPT 등장 초기, AI가 인종차별적 답변이나 혐오 발언, 폭탄 제조법 등을 쏟아내며 거센 비판을 받았다.

하지만 당시 논란의 상당수는 사용자들이 AI의 취약점을 파고들어 의도적으로 자극적인 답변을 유도한 결과였다. '탈옥(Jailbreak)'이라 불리는 우회 명령어나 악의적인 프롬프트를 입력해 AI가 금기를 깨도록 조장하고 이를 캡처해 공유하며 화제를 키운 사례가 다수였던 것으로 알려졌다. 몰트북에서 인간이 개입해 자극적인 상황을 연출한 것과 유사한 패턴이다.

그러나 이러한 '의도된 논란'은 역설적으로 AI 기술의 진보를 이끌어냈다. 개발사들은 쏟아지는 공격 사례를 방어하기 위해 인간 피드백 기반 강화 학습(RLHF)를 고도화하고, 강력한 안전 가이드라인(Safety Guardrail)을 구축했다. 결국 초기의 혼란이 AI 윤리 정책을 정교하게 다듬는 결정적인 계기가 된 셈이다.

초기 챗GPT는 악의적 이용을 위한 탈옥 시도가 다양하게 이뤄졌다(이미지=깃허브)

몰트북 역시 자극적인 게시물과 조작 논란으로 신뢰성에 타격을 입었지만, 그 과정에서 대중에게 생소했던 '에이전틱 AI'라는 개념을 폭발적으로 알리는 계기가 됐다. 기업용 자동화 영역에 머물던 에이전트 기술을 'AI가 서로 협업하는 세계'라는 구체적인 이미지로 대중에게 각인시킨 것이다.

포브스는 이를 두고 "인간과 에이전트가 뒤섞인 '하이브리드 실험'으로 봐야 한다"고 평가했다. 비록 인간의 개입이 있었을지라도, 에이전트들이 거래를 제안하고 협상하며 역할을 분담하는 과정은 향후 디지털 조직 운영의 가능성을 보여줬다는 분석이다.

몰트북이 남긴 과제, 에이전틱 AI의 무결성

업계의 반응은 '냉소'와 '기대'가 교차한다. AI 회의론자로 유명한 게리 마커스 뉴욕대 명예교수는 통해 "우리가 본 것은 자율적인 지능이 아니라 인간이 주입한 스크립트를 읊는 '인형극'에 불과하다"며 "진정한 에이전틱 AI는 투명한 검증 없이는 성립될 수 없다"고 꼬집었다.

개발자 커뮤니티 해커뉴스에서도 "무작위성에 인간의 체리피킹(선별)을 섞은 마케팅"이라는 자조 섞인 비판을 엑스(X)에 남겼다.

하지만 이번 소동이 남긴 유산을 과소평가해서는 안 된다는 목소리도 높다. 몰트북은 위협과 괴담 사이에서 소비되었지만 기술 업계에는 '운영 투명성 확보'와 '설계 고도화'라는 개선 방향을 제시했다는 점에서 단순한 해프닝 이상의 의미를 남겼다는 평이다.

관련기사

이단 몰릭 와튼스쿨 교수는 "몰트북의 게시물은 가짜였을지 몰라도 대중이 느낀 '기묘한 감정'은 진짜였다"고 평했다.

그는 "AI가 서로 상호작용하며 독자적인 문화를 형성하는 시나리오는 더 이상 SF가 아니다"라며 "몰트북은 다가올 미래에 대한 '충격적인 예고편' 역할을 톡톡히 해냈다"고 분석했다.