"챗GPT 등 15개 AI, 기업 금기 내부 규칙 어기는 허점"

AI보안 전문기업 에임인텔리전스(AIM Intelligence, 대표 유상윤)는 BMW 그룹과 공동 개발한 기업용 AI정책 준수 평가 프레임워크 'COMPASS' 연구가 자연어처리 분야 세계 최정상급 학회인 'ACL 2026(Association for Computational Linguistics)'에 공식 채택됐다고 22일 밝혔다.

'ACL 2026'은 오는 7월 2일부터 7일까지 미국 캘리포니아주 샌디에고에서 열린다.

이번 연구는 표준 안전 테스트를 통과한 AI 모델도 실제 기업 환경에서 적용되는 복잡한 정책 준수에는 실패한다는 사실을 밝혀냈다. 연구팀이 클로드와 챗GPT, 제미나이(Gemini), 라마(Llama) 등 15개 최신 모델을 평가한 결과, 의료·금융·자동차 등 LLM 도입이 가속화된 전 산업군에서 AI 모델은 기업이 금기시하는 내부 규칙의 97%를 제대로 따르지 않아 허점이 발생했다.

예컨대 의료 챗봇이 의료진단을 제공해서는 안 되거나, 금융 어시스턴트가 직접적인 투자 조언을 피해야 하는 것처럼 기업들은 컴플라이언스 매뉴얼, 운영 플레이북, 법적 제약 등 복잡한 내부 정책을 운영한다. 그러나 기존 AI 안전 평가는 독성이나 폭력 같은 보편적 위해만 측정할 뿐, 조직별 정책 준수 능력은 검증하지 못해 사각지대가 생겨난 것이다.

COMPASS(Company/Organization Policy Alignment Assessment)는 이러한 문제를 해결하기 위해 4가지 검증단계를 통해 해석이 불분명한 조항이나 상충하는 규칙 등을 찾아내 오작동 비율을 줄이는 프레임워크다. COMPASS 프레임워크와 데이터셋은 기업들이 자사 정책에 맞춰 AI 시스템을 직접 평가할 수 있도록 깃허브(Github)와 허깅페이스(Hugging face)에 무료로 공개돼 있다.

이번 프로젝트는 에임인텔리전스와 BMW 그룹을 필두로 연세대학교, 포항공과대학교, 서울대학교 연구진이 공동 참여했다. 상세 논문은 논문 사전공개 사이트인 아카이브(arXiv)에 공개됐다.