에인인텔리전스, BMW와 기업용 AI 정책 '사각지대' 밝혀냈다

에임인텔리전스가 BMW그룹과 함께 거대언어모델(LLM)을 도입한 기업이 설정한 정책 수준을 넘어선 답변을 내놓지 않도록 하는 프레임워크를 개발했다.

인공지능(AI) 보안 전문기업 에임인텔리전스(대표 유상운)가 BMW 그룹과 협력해 LLM의 기업별 맞춤형 정책 준수 여부를 체계적으로 평가하는 최초의 프레임워크 ‘COMPASS’를 공동개발했다고 10일 밝혔다.

COMPASS는 LLM이 기업별 특정 정책을 잘 준수하고 있는지 체계적으로 평가하는 프레임워크다. 최근 의료·금융·자동차 등 전 산업군에서 LLM 도입이 가속화되고 있으나, 기업 내부의 복잡한 운영 지침이나 법적 제약 사항을 AI가 정확히 따르는지에 대한 객관적인 지표는 부족한 실정이었다.

이번 연구는 기존의 표준 안전성 테스트를 통과한 AI 모델이라도, 실제 기업 현장 상황에 따라 달라지는 복잡한 규칙을 적용 시 금지된 규칙을 제대로 따르지 않는 문제점을 발견했다. 또한 이러한 문제점을 해결하기 위해 해석이 불분명한 조항이나, 상충하는 규칙 등을 찾아내 해결하는 등 4가지 검증단계를 통해 오작동 비율을 현격히 줄여나갈 방침이다.

특히 최근 LLM 도입이 가속화 되고 있는 자동차·금융·의료·교육 등 8개 핵심 산업에서 발생하는 시나리오를 기반으로, 6000여개의 질의 데이터를 생성해 검증의 신뢰도를 높였다. 또한 기업들이 자사의 정책에 맞춰 AI 시스템을 직접 평가해 볼 수 있도록 COMPASS 프레임워크와 데이터셋을 깃허브(GitHub) 및 허깅페이스(HuggingFace)에 무료로 공개하기도 했다.