셀렉트스타가 자체 개발한 인공지능(AI) 안전성 검증 기술로 세계 최고 권위의 학회에서 기술력을 인정받았다.

셀렉트스타는 자사 AI 세이프티팀의 연구 논문 'CAGE: 문화 맞춤형 레드티밍 벤치마크 생성 프레임워크'가 오는 4월 브라질에서 열리는 'ICLR 2026' 메인 컨퍼런스에 채택됐다고 19일 밝혔다. ICLR은 구글 스칼라 기준 AI 및 머신러닝 분야 최상위권 학회로, 올해는 1만 9000여 건의 제출 논문 중 상위 약 28%만이 채택됐다.

이번 논문의 핵심은 각 나라 문화와 법적 맥락을 반영해 AI 안전성을 검증하는 레드티밍 데이터를 자동 생성하는 기술이다. 기존 안전성 검증이 영미권 데이터셋을 단순 번역해 사용하던 한계를 극복하고, 언어 및 문화권별 맞춤형 시험문제를 생성해 AI의 잠재적 취약점을 파악한다.

CAGE(KoRSET)과 단순 번역 공격 질문을 비교했을 때 ASR(테스트 질문을 던졌을 때 모델이 뚫리는 공격 성공률)에서 확실한 차이를 보여준다. (사진=셀렉트스타)

셀렉트스타 연구팀은 '시맨틱 몰드' 개념을 제안해 국가별 문화적 특성을 반영한 현지화된 공격 질문을 생성했다. 그 결과 캄보디아어(크메르어) 등 데이터가 부족한 언어권에서도 우수한 성능을 보였다. 한국 상황에 최적화된 안전성 벤치마크 '코르셋(KoRSET)' 역시 기존 번역 데이터셋보다 효과적으로 모델 약점을 찾아내는 데 성공했다.

이번 연구는 기획부터 구현, 검증까지 외부 기관의 도움 없이 셀렉트스타 내부 인력만으로 일궈낸 성과라고 회사 측은 강조했다. 해당 기술은 이미 국내 주요 대기업 AI 프로젝트에 선제 도입돼 모델 취약점 점검과 운영 효율 개선에 기여하고 있다.

김민우 셀렉트스타 AI 세이프티 팀장은 "이번 ICLR 채택은 우리가 단순 데이터 구축 기업을 넘어 독보적인 원천 기술을 보유한 AI 기술 기업임을 입증한 사례"라며 "CAGE 기술은 이미 대기업 프로젝트에 적용돼 실질적인 성과를 내고 있다"고 강조했다.

공동 저자인 임용택 셀렉트스타 연구원은 "AI 성능 경쟁을 넘어 이제는 안전성이 핵심 경쟁력인 시대"라며 "현장에서 바로 활용 가능한 품질의 안전 평가 기술로 글로벌 기준을 만드는 데 기여할 것"이라고 말했다.