KISTI, AI 추론성능 3~10% 개선…"문장 8개로 분해한뒤 분석"

기존 인공지능(AI) 추론 성능을 3~10%p까지 끌어올릴 수 있는 새 평가 기술이 개발됐다.

한국과학기술정보연구원(KISTI)은 양혜영 에이전트연구팀장 연구팀이 AI 추론 과정을 평가할 수 있는 새로운 평가기술 ‘트레이스(TRACE)'를 개발했다고 12일 밝혔다.

연구결과는 '국제 머신러닝학회(ICML) 2026'에 채택됐다. ICML은 인공지능과 머신러닝 분야를 대표하는 국제 학회다.

AI 추론 성능을 개선할 수 있는 평가 기술이 개발됐다. (사진=클립아트코리아)

이번에 개발한 '트레이스'는 AI가 생성한 추론 문장을 주장(Claim), 근거(Evidence), 논거(Warrant), 보강근거(Backing), 평가(evaluation), 한정(Qualifier), 반박(Rebuttal), 모니터링(Monitoring) 등 8개 요소로 분해한 뒤, 각 요소의 타당성과 문장 간 논리적 연결성을 분석할 수 있다.

연구팀은 10만 개의 추론 문장을 활용해 TRACE 모델(DeBERTa)을 학습했다. 이를 통해 7개 주요 언어모델과 2만 6천여 개의 추론 사례를 분석했다. 그 결과 TRACE 점수와 실제 벤치마크 정답률 사이에서 높은 상관관계(0.741)를 확인했다. 0.741은 비교적 강한 연관성이 있음을 시사한다.