[AI는 지금] MS, 코파일럿 '신뢰성 강화' 승부수…멀티모델 전략 본격화

'크리틱' 도입으로 생성·검증 분리…정확성·출처 중심으로 AI 경쟁 축 이동

컴퓨팅입력 :2026/03/31 10:52

마이크로소프트(MS)가 기업용 인공지능(AI) 시장에서 신뢰성 강화에 초점을 맞춘 전략을 본격화하고 있다. 단일 모델 중심 구조에서 벗어나 복수 AI가 생성과 검증을 분담하는 '멀티모델' 체계를 도입해 코파일럿의 실사용 전환율을 끌어올리겠다는 의도로 풀이된다.

MS는 30일(현지시간) 공식 블로그를 통해 마이크로소프트 365 코파일럿의 심층 리서치 기능 '리서처(Researcher)'에 '크리틱(Critique)'과 '카운슬(Council)'을 추가했다고 밝혔다.

크리틱은 서로 다른 AI 모델이 조사·초안 작성과 검토·보완 역할을 나눠 수행하는 구조다. 카운슬은 복수 모델이 각각 독립 보고서를 생성한 뒤 요약 레이어(커버레터)가 공통점과 차이점, 고유 인사이트를 정리하는 방식이다.

마이크로소프트 365 코파일럿의 심층 리서치 기능 '리서처(Researcher)'에 '크리틱(Critique)'과 '카운슬(Council)'이 추가됐다. (이미지=마이크로소프트 공식 블로그)

이번 개편은 기능 추가를 넘어 코파일럿의 구조적 한계를 보완하려는 시도로 해석된다. 그동안 코파일럿은 워드, 엑셀, 아웃룩 등 업무 도구에 통합된 점을 강점으로 내세워 왔지만, 실제 현장에서는 생성 결과를 그대로 활용하기보다는 추가 검토와 수정이 필수적인 '보조 도구' 수준에 머무르는 경우가 많았다. 이로 인해 그동안 기업 환경에서 요구되는 정확성과 근거 기반 분석을 충분히 충족하지 못했다는 지적을 받았다.

이 같은 문제는 생성형 AI 경쟁 구도 변화에서 비롯된 것으로 분석된다. 초기에는 자연스러운 문장 생성과 속도가 경쟁력이었지만, 최근에는 결과의 정확성과 출처 신뢰성이 핵심 평가 기준으로 부상하고 있다. 특히 기업 환경에서는 보고서 오류가 의사결정 리스크로 직결되는 만큼, AI 결과에 대한 검증 가능성이 중요한 요소로 자리잡고 있다.

크리틱은 이러한 요구를 반영한 구조다. 생성과 검증을 분리해 결과물을 반복적으로 점검하고 출처 신뢰성과 분석 완결성을 강화하는 데 초점을 맞췄다. MS 자체 평가 기준인 드라코(DRACO) 벤치마크에 따르면, 해당 구조를 적용한 리서처는 단일 모델 구조 대비 약 13.88% 높은 성능을 기록했다.

업계에선 이번 전략을 '사용 확대'가 아닌 '신뢰 확보' 중심의 전환으로 평가하고 있다. 코파일럿은 이미 기업 환경에 광범위하게 배포돼 있어 사용 기반 자체는 확보된 상태다.

다만 실제 업무에서 AI 결과를 그대로 활용하는 비율은 제한적인 수준에 그쳤다. 또 이용 여부보다 활용 수준이 핵심 과제로 지목됐다.

이에 MS는 한계를 해소하기 위한 해법으로 멀티모델 구조 도입에 나섰다. 서로 다른 모델이 역할을 나눠 수행함으로써 오류를 줄이고 결과물의 완성도를 높이는 데 초점을 맞췄다. 동시에 특정 AI 모델에 대한 의존도를 낮추고 다양한 파트너십을 유지할 수 있다는 점에서 사업적 의미도 갖는다.

하지만 단기간 내 전환율이 급격히 상승할 가능성은 제한적이라는 전망도 나온다. 기업 환경에서는 AI 활용에 따른 책임 문제가 여전히 존재하는 만큼, 결과에 대한 신뢰가 반복 사용을 통해 점진적으로 축적되기 때문이다. 실제 현업에서 체감되는 수정 시간 감소와 검증 부담 완화가 확인돼야 활용 수준이 본격적으로 높아질 것으로 봤다.

업계에선 이번 개편의 성패가 기술 성능이 아니라 현장 체감에 달려 있다고 분석했다. 또 코파일럿이 단순 초안 생성 도구를 넘어 실제 제출 가능한 결과물을 제공하는 수준에 도달할 경우 기업 내 활용도는 구조적으로 확대될 가능성이 크다고 관측했다.

업계 관계자는 "코파일럿의 핵심 과제는 사용자를 늘리는 것이 아니라 더 중요한 업무를 맡게 만드는 것"이라며 "향후 AI 경쟁은 모델 성능보다 결과에 대한 신뢰를 얼마나 확보하느냐가 좌우할 것"이라고 말했다.