"글자 위치·역할까지 파악"…미스트랄AI, 차세대 OCR 모델 출시

바운딩 박스·블록 분류·신뢰도 점수 제공…170개 언어 처리

컴퓨팅입력 :2026/06/24 18:31

미스트랄AI가 기업 문서를 인공지능(AI)이 읽고 활용하기 쉬운 형태로 바꿀 수 있는 모델을 공개했다.

미스트랄AI는 새 광학문자인식(OCR) 모델 '미스트랄 OCR 4'를 출시했다고 24일 공식 홈페이지에서 밝혔다. 이 모델은 문서에서 텍스트를 추출할뿐 아니라 글자 위치와 문서에 적용되는 모델 신뢰도까지 측정한다.

미스트랄 OCR 4 핵심은 문서를 더 세밀하게 읽는 데 있다. 기존 OCR은 문서 속 글자를 텍스트로 바꾸는 데 초점을 맞췄지만 이 모델은 문서 내 글자 위치와 역할을 구분한다.

미스트랄AI 새 광학문자인식(OCR) 모델 '미스트랄 OCR 4' 작동 화면. (사진=미스트랄AI 홈페이지)

미스트랄 OCR 4는 텍스트 위치를 표시하는 바운딩 박스를 제공한다. 또 제목, 표, 수식, 서명 등 문서 요소를 유형별로 나누는 블록 분류 기능도 지원한다.

이 모델은 페이지별·단어별 신뢰도 점수도 제공한다. 기업은 이 점수로 출처 기반 인용, 민감 정보 삭제, 사람 검증이 필요한 업무를 더 안정적으로 처리할 수 있다.

미스트랄AI는 미스트랄 OCR 4를 기업 검색과 검색증강생성(RAG) 파이프라인 핵심 수집 도구로 내세웠다. 미스트랄 OCR 4가 문서를 구조화된 형태로 바꾸면 AI는 필요한 내용을 더 정확히 찾고 답변의 출처도 함께 제시할 수 있다.

기업은 미스트랄 OCR 4를 문서 기반 에이전트 업무에도 활용할 수 있다. 미스트랄AI는 미스트랄 OCR 4가 양식 작성, 송장 처리, 컴플라이언스 점검 같은 업무에서 AI 에이전트가 문서 내용을 이해하고 작업을 수행하는 데 필요한 기반을 제공한다고 설명했다.

미스트랄 OCR 4가 지원하는 문서 형식은 PDF, DOC, PPT, 오픈도큐먼트 등이다. 지원 언어는 10개 언어군에 걸친 170개 언어다.

독립 평가자들은 주요 OCR·문서 AI 시스템과 비교한 평가에서 미스트랄 OCR 4를 더 많이 선호했다. (사진=미스트랄AI)

미스트랄 OCR 4는 자체 호스팅도 지원한다. 미스트랄AI는 미스트랄 OCR 4를 단일 컨테이너에 배포할 수 있는 모델로 설계했다. 기업은 문서 데이터를 외부로 보내지 않고 자체 인프라 안에서 처리할 수 있다.

미스트랄AI는 성능 측면에서도 미스트랄 OCR 4의 경쟁력을 강조했다. 내부 분석에 따르면 독립 평가자들은 주요 OCR·문서 AI 시스템과 비교한 평가에서 미스트랄 OCR 4를 더 많이 선호했다. 평균 선호율은 72%였다.

미스트랄 OCR 4는 공개 벤치마크 'OlmOCRBench'에서 85.20점을 기록했다. 이는 미스트랄AI가 테스트한 모델 중 전체 최고 점수다. 'OmniDocBench'에서는 93.07점을 냈다.

미스트랄AI는 벤치마크 점수를 절대적 기준으로 보기는 어렵다고 설명했다. 수식 표기 방식이나 다단 문서 읽기 순서처럼 채점 방식에 따라 실제 성능과 다른 결과가 나올 수 있다는 이유에서다.

미스트랄 OCR 4의 가격은 API 기준 1000 페이지당 4달러다. 기업이 배치 API를 사용하면 50% 할인이 적용돼 가격은 1000 페이지당 2달러로 낮아진다. 다큐먼트 AI는 1천 페이지당 5달러다.

관련기사

미스트랄AI는 미스트랄 OCR 4와 OCR 4 기반 다큐먼트 AI를 미스트랄 스튜디오, 아마존 세이지메이커, 마이크로소프트 파운드리를 통해 API로 제공한다. 스노우플레이크 파스 다큐먼트에서도 곧 지원될 예정이다.

키미 그레월 마이크로소프트 AI 생태계 파트너십 부문 부사장은 "마이크로소프트 파운드리에서 OCR 4 기반 미스트랄 다큐먼트 AI를 사용할 수 있게 된 것은 우리 파트너십에 중요한 이정표"고 말했다.