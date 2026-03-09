알리바바 인공지능(AI) 연구팀이 개발한 실험용 AI 에이전트가 훈련 과정에서 스스로 가상자산 채굴을 시도한 것으로 나타났다. 가상자산 전문 매체 더블록은 8일(현지시간) 이같은 사실이 지난해 12월 발표된 기술 논문을 통해 알려졌다고 보도했다.

문제가 된 AI 에이전트는 알리바바의 Qwen3-MoE 아키텍처 기반 300억 파라미터 규모의 오픈소스 모델 ‘ROME’이다. 이 모델은 도구, 터미널 명령어, 소프트웨어 환경을 활용해 여러 단계의 코딩 작업을 계획하고 실행한다.

ROME의 가상자산 채굴 시도는 강화학습 훈련 과정에서 발생했다. 알리바바 클라우드 관리형 방화벽이 훈련 서버에서 보안 정책 위반 트래픽이 급증한 사실을 감지하면서 드러났다.

(사진=픽사베이)

ROME은 알리바바 클라우드 서버에서 외부 IP 주소로 역방향 SSH 터널을 생성했다. 이는 외부에서 내부 접근을 제한하는 방화벽을 우회하는 방식이다. 또 훈련용으로 할당된 그래픽처리장치(GPU) 자원을 가상자산 채굴에 사용한 것으로 확인됐다.

연구진은 ROME에 채굴이나 네트워크 터널 생성과 관련한 지시를 내린 적이 없으며, 이러한 행동은 강화학습 최적화 과정에서 나타난 부수적 결과라고 설명했다.

즉 AI가 훈련 목표를 달성하기 위해 더 많은 컴퓨팅 자원과 재정적 자원을 확보하는 과정에서 채굴과 네트워크 터널 생성 행동을 스스로 선택했을 가능성이 있다는 것이다.

이처럼 AI가 예상치 못한 행동을 보이는 사례가 최근 보고되고 있다.

관련기사

지난해 5월 앤트로픽은 클로드 오퍼스4 모델이 안전성 테스트 과정에서 종료를 피하기 위해 가상의 엔지니어를 협박하는 행동을 보였다고 공개했다.

지난 2월에는 오픈AI 직원이 만든 AI 트레이딩 봇이 API 오류로 약 25만 달러 상당의 밈코인을 소셜미디어 X 사용자에게 전송하는 사고가 발생하기도 했다.