인공지능∙전자문서 기업 사이냅소프트는 '사이냅 문서필터' 서비스에 인공지능 광학문자판독 'OCR' 솔루션을 연동해 텍스트 추출 기술력을 강화했다고 14일 밝혔다.
두 솔루션의 결합으로 문서에 포함된 이미지 내 텍스트도 추출할 수 있게 됐다.
사이냅 문서필터는 문서에서 텍스트를 추출하는 솔루션이다. 400종 이상의 문서 포맷을 식별하고, 그중 50가지 이상 형식의 문서 파일로부터 텍스트를 추출한다. 다국어 인코딩 지원과 빠른 속도와 안정성이 장점이며, 검색 엔진, 메일, 보안 솔루션의 첨부파일 텍스트 필터링에 활용한다. 문서필터는 네이버, 카카오 등 대형 포털 사이트에 적용될 정도로 빠르고 안정적인 텍스트 추출에 강점을 지닌 솔루션이다.
그동안 문서필터 기능으로 이미지에 포함된 텍스트는 추출할 수 없었으나, 이번 사이냅 OCR 솔루션 연동으로 이미지까지 추출할 수 있게 됐다. 또한 문서에 포함된 모든 텍스트를 완벽히 추출할 수 있게 되어 문서필터의 가치를 한 단계 끌어 올렸다.
관련기사
- 사이냅소프트, 효성그룹에 '문서뷰어' 공급2020.07.30
- 사이냅소프트, 구글 지스위트에 문서뷰어 탑재2020.07.15
- 사이냅소프트, 나라장터에 웹콘텐츠 저작 솔루션 등록2020.07.10
- 사이냅소프트, 경기시장진흥원 홈페이지에 문서뷰어 적용2020.06.04
사이냅 문서필터는 사이냅 OCR과의 연동을 통해 SK텔레콤, 안랩 등에 제공 중이다.
사이냅소프트의 김시연 부사장은 “기존 문서필터에서 이미지 내 텍스트 추출을 필요로 하는 고객사의 요구가 있었다”며 “사이냅 문서필터와 사이냅 OCR의 연동으로 고객 요구를 충족하며 대한민국 문서필터 1위 기업의 자리를 공고히 하겠다”고 말했다.