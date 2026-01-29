업스테이지가 인공지능(AI) 산업의 필수 관문인 문서 처리 기술을 한 단계 진화시켰다. AI 에이전트 개발이나 검색 증강 생성(RAG), 거대언어모델(LLM) 학습 등에 필수적인 고난도 문서 구조화 성능을 강화해 개발자 수요를 끌어올리겠다는 의도로 풀이된다.

김성훈 업스테이지 대표는 29일 자신의 페이스북을 통해 문서 처리 솔루션 '다큐먼트 파스(document Parse)'를 1.9.1 버전으로 업데이트했다고 밝혔다.

김 대표는 "기존에 엄두도 못 냈던 엄청난 표도 잘 읽어낸다"며 "일명 'K-테이블'이라 불리는 표 안의 표, 그 안의 또 다른 표까지 인식한다"고 강조했다.

업스테이지 다큐먼트 파스는 PDF, 스캔 이미지, 복잡한 차트 등 비정형 데이터를 LLM이 이해할 수 있는 HTML이나 마크다운(Markdown) 형식으로 변환해 주는 도구다.

회사는 이번 업데이트를 통해 기업 사용자를 위한 워크플로우를 간소화하고, 복잡한 테이블과 차트 인식률, 요소 좌표 추출 등의 기능을 강화했다.

특히 처리 속도와 정확도 면에서 성능을 고도화했다. 업스테이지 측 자료에 따르면 이 솔루션은 페이지당 평균 0.6초의 속도로 문서를 처리하며, 100페이지 분량의 문서를 1분 이내에 소화한다.

이는 경쟁사 대비 5~10배 빠른 속도다. 정확도 측면에서도 문서 처리 모델의 성능 지표인 TEDS(Tree Edit Distance based Similarity) 점수에서 93.48점을 기록하며 레이아웃 및 테이블 인식률에서 타사 대비 5% 이상 높은 성능을 입증했다.

해당 기술은 금융 보고서나 법률 문서처럼 형식이 복잡하고 방대한 문서를 디지털화하는 데 최적화돼 있다. 복잡한 문서를 구조화된 텍스트로 변환함으로써 RAG 시스템의 검색 정밀도를 높이고, LLM이 문맥을 더 정확하게 파악하도록 한다.

업스테이지는 기업들의 접근성을 높이기 위해 가격 경쟁력도 갖췄다. 응용 프로그램 인터페이스(API) 이용 시 페이지당 0.01달러의 비용이 책정되며 AWS 마켓플레이스나 온프레미스(사내 구축형) 등 다양한 환경에서 도입이 가능하다.

김 대표는 "AI 시대에 에이전트를 하건, 간단한 RAG를 하건, LLM 학습을 하건 문서를 읽는 것은 무조건 필요한 과정"이라고 말했다.