업스테이지, AI 국제대회 4개 종목 1위...아마존·엔비디아 제쳐

문자 검출·인식 기술 모두 앞서

컴퓨팅입력 :2023/04/24 15:29

AI 기업 업스테이지는 국제패턴인식협회(IAPR)가 개최한 국제대회 ‘ICDAR 로버스트 리딩 컴페티션’에서 아마존웹서비스, 엔비디아 등을 제치고 4종목(HierText-1/2, VQAonBD, IHTR) 1위에 올랐다고 24일 밝혔다.

ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오에서 텍스트를 감지·인식하는 기술인 '로버스트 리딩(Robust Reading)' 분야에서 권위 있는 국제 경진대회다. ICDAR는 문서 분석과 인식 분야의 글로벌 기업, 연구자들이 참여하는 국제 학회다. 1991년부터 매년 열렸다.

OCR은 이미지에서 ▲문자 위치 찾는 '검출 기술'과 ▲문자가 무엇인지 알아내는 '인식 기술'로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두 아마존과 엔비디아, 알리바바, 화웨이 등을 앞서고 가장 높은 점수를 기록했다고 밝혔다.

대회 순위 (사진=업스테이지)

업스테이지는 인도에서 쓰이는 대표 10종의 언어 인식 문제를 다룬 IHTR 종목에서도 활약했다. 이전 경험이 없던 신규 언어임에도 모델을 구축해 1위에 올랐다.

특히 단어, 줄, 단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 ‘HierText’를 사용했고, OCR의 새로운 작업을 수행하는 종목에서는 업스테이지 팀과 홍콩지사가 1위와 2위를 휩쓸었다.

단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 2위와 큰 점수 차로 앞섰다. 이 종목은 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목으다. 예를 들어 계산이 복잡한 세금문서를 준 후 '2019년 세금 합계가 뭐야'와 같은 질문에 대해 답변을 추출하는 것뿐만 아니라 그 값을 이용해 비율이나 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제가 제시됐다.

이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두자릿수 금메달 기록의 업스테이지 챌린지스 팀과 OCR팀이 뭉친 결과다. 챌린지스 팀에는 2021년과 2022년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함, 두명의 그랜드마스터와 한명의 마스터가 포함돼 있다. 또 현업에서 다양한 기업의 OCR 과제를 수행 중인 업스테이지의 연구원들이 힘을 합친 결과라고 강조했다.

업스테이지는 집중 연구를 통해 기존과 다른 새로운 방법론을 사용했다고 밝혔다. 기존 검출 기술은 인접한 단어 영역이 서로 겹치지 않도록 하기 위해 단어 영역을 크게 줄여 학습에 사용했다. 업스테이지 팀은 단어 영역은 적게 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 개선했다고 설명했다.

이를 통해 신설 평가 기준 중 하나인 '예측된 박스와 정답 박스 사이의 유사도'를 크게 향상할 수 있었다고 전했다.

업스테이지는 AI OCR 기술이 디지털 전환의 기반이 되는 핵심 AI 기술로, 데이터의 디지털 자산화를 위한 고도화에 여러 기업들이 속도를 내고 있다고 소개했다. OCR팩을 개발, 올 초 한화생명과 삼성SDS, 포스코그룹 등 다양한 산업의 기업의 AI 혁신에 앞장서고 있다고 덧붙였다.

관련기사

OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술 등 AI 기술을 한 번에 맞춤형으로 활용할 수 있도록 돕는 노코드-로코드 솔루션 'AI팩'과 이를 코드 복사만으로 활용할 수 있는 API 시리즈를 서비스 중이다. AI팩을 이용하면 데이터 가공, AI 모델링, 지표 관리를 활용할 수 있다고 밝혔다.

김성훈 업스테이지 대표는 “AI OCR 분야 최고 권위의 대회에서 4개 부문 1위를 휩쓸며 다시 한번 글로벌 톱 AI 기술력을 인정받아 무척 기쁘다”라며 "세계 최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 말했다.