한국딥러닝, 글로벌 OCR 벤치마크 1위…"제미나이·GPT 제쳐"

OCR벤치 v2서 68.1점 기록…제미나이 3 프로 프리뷰보다 4.7점 앞서

컴퓨팅입력 :2026/04/22 14:55

한국딥러닝이 글로벌 인공지능(AI) 시장에서 문서 처리 모델 경쟁력을 입증했다. 

한국딥러닝은 허깅페이스에 등재된 글로벌 멀티모달 광학문자인식(OCR) 벤치마크 'OCR벤치 v2' 2026년 3월 영어 부문 평가에서 68.1점으로 종합 1위를 기록했다고 22일 밝혔다. 아시아 기업이 구글 제미나이를 제치고 정상에 오른 것은 이번이 처음이다.

이번 평가에서 한국딥러닝은 제미나이 3 프로 프리뷰를 4.7점 차로 앞섰다. 오픈AI GPT-5, 알리바바 큐웬3-옴니-30B, 앤트로픽 클로드 오퍼스 4.6 등 주요 모델보다 더 높은 점수를 받았다. 

한국딥러닝이 글로벌 인공지능(AI) 시장에서 문서 처리 모델 경쟁력을 입증했다. (사진=한국딥러닝)

OCR벤치 v2는 레이아웃 분석을 비롯한 수식 해석, 도표 이해, 논리 추론 등 31개 시나리오를 검증하는 고난도 벤치마크다. 또 1만 건 수작업 검증 데이터와 1500장 비공개 테스트셋으로 성능을 이중 검증할 수 있다. 

한국딥러닝은 모델이 문서 구조화와 맥락 이해에서 강점을 보였다고 밝혔다. 문서 파싱 40.7점과 맥락 이해 85.4점을 기록하며 세부 항목 전반에서 고른 성과를 냈다는 설명이다. 

핵심 기술은 환각을 최소화한 '니어-제로 할루시네이션(Near-Zero Hallucination)'이다. 이 기술은 문서에 없는 정보를 생성하지 않고 실제 문서에 기반한 정보만 추출하도록 설계됐다.

한국딥러닝은 문서 구조 이해에 특화된 모델을 자체적으로 만든 기업으로 알려졌다. 이를 통해 레이아웃과 항목 간 관계 위치 정보를 함께 반영해 의미 오류를 줄였다는 평을 받고 있다. 

관련기사

실제 환경 적용성도 확인됐다. 한국어 손글씨 등 노이즈가 많은 입력에서도 안정적인 인식이 가능하며 비공개 테스트셋에서도 성능이 유지된 것으로 나타났다. 

김동현 한국딥러닝 최고전략책임자(CSO)는 "글로벌 빅테크들이 주도하는 AI 시장에서 아시아 기업이 순수 국내 기술로 제미나이와 GPT를 넘어섰다는 것은 의미 있는 성과"라며 "범용 모델이 따라올 수 없는 문서 지능 영역에서 구조적 설계를 통해 기술 격차를 증명했다"고 밝혔다.