인공지능(AI) 보안 전문기업 에임인텔리전스(대표 유상운)가 BMW 그룹과 협력해 LLM의 기업별 맞춤형 정책 준수 여부를 체계적으로 평가하는 최초의 프레임워크 ‘COMPASS’를 공동개발했다고 10일 밝혔다.

COMPASS는 LLM이 기업별 특정 정책을 잘 준수하고 있는지 체계적으로 평가하는 프레임워크다. 최근 의료·금융·자동차 등 전 산업군에서 LLM 도입이 가속화되고 있으나, 기업 내부의 복잡한 운영 지침이나 법적 제약 사항을 AI가 정확히 따르는지에 대한 객관적인 지표는 부족한 실정이었다.

COMPASS 프레임워크 개요.(사진=에임인텔리전스)

이번 연구는 기존의 표준 안전성 테스트를 통과한 AI 모델이라도, 실제 기업 현장 상황에 따라 달라지는 복잡한 규칙을 적용 시 금지된 규칙을 제대로 따르지 않는 문제점을 발견했다. 또한 이러한 문제점을 해결하기 위해 해석이 불분명한 조항이나, 상충하는 규칙 등을 찾아내 해결하는 등 4가지 검증단계를 통해 오작동 비율을 현격히 줄여나갈 방침이다.

특히 최근 LLM 도입이 가속화 되고 있는 자동차·금융·의료·교육 등 8개 핵심 산업에서 발생하는 시나리오를 기반으로, 6000여개의 질의 데이터를 생성해 검증의 신뢰도를 높였다. 또한 기업들이 자사의 정책에 맞춰 AI 시스템을 직접 평가해 볼 수 있도록 COMPASS 프레임워크와 데이터셋을 깃허브(GitHub) 및 허깅페이스(HuggingFace)에 무료로 공개하기도 했다.

이번 프로젝트는 에임인텔리전스와 BMW 그룹을 필두로 서울대학교·연세대학교· 포항공과대학교(POSTECH) 연구진이 공동으로 참여했다. 상세 논문은 논문 사전공개 사이트인 ‘아카이브(arXiv)’에 공개됐다.

유상윤 에임인텔리전스 대표는 "일반적인 관점에만 초점을 맞추는 AI 안전 테스트와 달리, COMPASS는 실무적 관점에서 모든 규칙이 제대로 지켜지도록 신뢰성을 높인 것이 특징"이라며 "앞으로도 기업과 공공기관이 AI를 보다 안심하고 활용할 수 있는 현실적인 AI 보안 적용 방안을 선보일 것"이라고 말했다.