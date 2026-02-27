셀렉트스타가 거대언어모델(LLM) 기반 서비스의 실제 성능과 신뢰성을 정교하게 측정하려는 기업들을 위해 실무적인 검증 기준을 제시한다.

셀렉트스타는 다음 달 5일 오후 2시 '커스텀 평가 체계로 LLM 서비스 평가 기준 만들기'를 주제로 무료 웨비나를 개최한다고 27일 밝혔다. 이번 행사는 벤치마크 점수와 실제 서비스 위험 간의 괴리를 좁히고, 기업이 AI 서비스를 안심하고 출시할 수 있도록 돕는 의사결정 프레임워크를 공유하는 자리다.

웨비나에선 ▲LLM 판사 기반 평가 ▲정량·정성·혼합 평가 방법론 등 최신 트렌드를 소개하고 수작업 중심 평가를 자동화해 리소스를 효율화하는 전략을 다룬다. 특히 기업 내부 거버넌스 체계에 맞춘 서비스 출시 기준 설정법과 실제 기업들 운영 사례를 공개할 예정이다.

(사진=셀렉트스타)

셀렉트스타는 국내 최초 AI 신뢰성 평가 자동화 플랫폼인 '다투모 플랫폼'을 활용해 평가 프로세스를 체계화한 사례도 소개한다.

이찬수 셀렉트스타 사업개발팀장은 "많은 기업이 LLM을 도입하면서도 정작 서비스 목적에 맞는 명확한 평가 기준을 세우는 데 어려움을 겪는다"며 "이번 웨비나를 통해 데이터 기반으로 AI 서비스 출시 여부를 판단할 수 있는 지표를 마련하길 기대한다"고 말했다.