문서 시장에 확산된 '터보퀀트'…사이냅소프트, AI 서비스 비용 낮췄다

사이냅 OCR IX에 적용…긴 문서 처리 성능 개선·GPU 부담 완화

컴퓨팅입력 :2026/04/15 17:14

사이냅소프트가 최근 인공지능(AI) 시장에서 큰 주목을 받은 경량화 기술 '터보퀀트'를 적용해 문서 AI 경쟁력을 강화한다. 대형언어모델(LLM)과 시각언어모델(VLM) 운영 시 발생하는 메모리 병목 문제를 해결하며 기업 AI 도입 비용을 낮춘다는 목표다.

사이냅소프트는 구글 리서치가 공개한 최신 벡터 양자화 알고리즘 터보퀀트를 자사 AI 솔루션 '사이냅 OCR IX'에 적용했다고 15일 밝혔다.

터보퀀트는 AI 모델이 긴 문서를 처리할 때 발생하는 메모리 사용량을 줄이기 위한 기술로, 최근 생성형 AI 확산과 함께 인프라 효율을 높이는 핵심 기술로 주목받고 있다. 특히 LLM·VLM이 사용하는 'KV 캐시'를 압축해 동일한 그래픽처리장치(GPU) 환경에서도 더 많은 데이터를 빠르게 처리할 수 있도록 지원하는 것이 특징이다.

사이냅소프트가 자사 OCR 솔루션에 터보퀀트 기술을 적용했다. (사진=사이냅소프트)

사이냅 OCR IX는 VLM과 AI 에이전트 기술을 결합한 에이전틱 광학문자인식(OCR) 솔루션으로, 비정형 문서의 맥락을 이해하고 필요한 데이터를 자동 추출한다. 기존에는 긴 문서를 처리할수록 메모리 사용량이 급증해 고가의 GPU 인프라가 필요했지만, 터보퀀트 적용으로 이러한 한계를 개선했다는 설명이다.

회사 측에 따르면 이번 기술 적용을 통해 동일한 GPU 환경에서도 더 긴 컨텍스트와 대용량 배치를 병목 없이 처리할 수 있게 됐다. 이에 고성능 GPU 서버 구축 부담을 줄이고 총소유비용(TCO)도 낮출 수 있다.

사이냅소프트는 GPU 인프라 도입이 어려운 기업을 위해 중앙처리장치(CPU) 기반 환경도 함께 지원한다. 자체 모델에 대한 정밀 프로파일링을 통해 연산 효율을 높였으며 품질 손실을 1% 이하로 억제하면서도 CPU 서버만으로 분당 약 100건 수준의 추론 처리가 가능하도록 성능을 확보했다.

기존 서버 인프라를 활용해야 하는 기업이나 GPU 도입이 어려운 환경에서도 AI OCR 적용을 가능케 한다는 방침이다.

사이냅소프트는 이같은 기술 적용이 금융·공공 등 온프레미스 환경에서 AI 도입을 확대하는 계기가 될 것으로 보고 있다. 높은 보안 요구와 인프라 제약으로 AI 도입이 쉽지 않았던 산업에서도 비용 효율성과 성능을 동시에 확보할 수 있다는 점에서다.

관련기사

전경헌 사이냅소프트 대표는 "단순히 자체 기술력에만 머물지 않고 글로벌 빅테크의 최신 연구 성과인 터보퀀트를 기민하게 상용화해 기존 VLM의 한계를 극복했다"고 말했다.

이어 "CPU 버전까지 아우르는 유연한 인프라를 지원해 기업들이 도입 비용 걱정 없이 에이전틱 OCR 환경을 구축하고 실질적인 업무 자동화를 이룰 수 있도록 적극 지원하겠다"고 덧붙였다.