KT는 고려대와 공동 개발한 멀티모달 대형언어모델(MLLM) 벤치마크 'KSAFE-MM'을 공개했다고 16일 밝혔다.
벤치마크는 멀티모달 AI 모델 안전성을 한국 사회 이슈와 문화적 맥락을 반영해 평가한다. 글로벌 공통 리스크를 한국 문화 맥락으로 변환한 'KSAFE-MM-G'와 전세 사기, 독도 분쟁과 같은 한국 사회 고유의 이슈를 반영한 'KSAFE-MM-C'로 구성된다.
총 평가 샘플 1만 4135개로 구성돼 한국 최대규모 한국어 멀티모달 안전성 평가 데이터셋이다. 이제까지 젬마, 하이퍼클로바엑스 등 글로벌 멀티모달 대형 언어모델 12개를 검증했다.
벤치마크엔 자동화한 범용 파이프라인이 적용됐다. 'KSAFE-MM'은 현지 커뮤니티 기반 민감 주제 수집부터 템플릿 기반 쿼리 생성, 합성 이미지 생성, AI 안전 장치나 윤리 제한을 우회하도록 변형된 탈옥 쿼리 생성까지 전 과정을 아우르는 4단계 자동화 파이프라인을 구현했다.
이는 특정 문화권 전문가 없이도 현지 특성을 반영한 안전성 벤치마크를 신속하게 구축할 수 있는 표준 프레임워크를 제공해 비용은 낮추고 효율을 높일 수 있다는 의미라고 KT는 설명했다.
KT, 고려대 공동 연구진은 동일한 파이프라인을 일본어에 적용한 파일럿 실험을 통해 전 세계 어느 문화권에도 즉시 적용 가능함을 실증했다.
관련기사
- KT, 셋톱박스 협력사에 메모리 확보용 선금 지급2026.06.16
- KT "IPTV 새 요금제로 지상파-종편 VOD 다 보세요"2026.06.16
- KT, '던킨 반값 할인' 등 6월 멤버십 이벤트 공개2026.06.15
- KT, 통신매장에 '다국어 AI 상담사' 도입2026.06.15
연구 결과는 실제 AI 서비스 환경에서의 안전성 검증, 레드팀 테스트, 가드레일 모델 평가 등 목적으로 활용될 수 있을 것으로 기대된다. 연구 결과와 벤치마크는 아카이브와 허깅페이스에 공개된다.
박재형 KT AX미래기술원 프론티어 AI랩장은 "벤치마크 공개는 단순한 데이터 배포를 넘어, AI 안전성 연구 생태계 전반이 함께 발전할 수 있는 기반을 만드는 일"이라며 "KSAFE-MM이 학계와 산업계에서 한국어, 한국 문화 맥락의 AI 안전성을 검증하는 공통 기준으로 자리잡길 기대한다"고 말했다.











