업스테이지 "연말까지 1000억 매개변수 LLM 만들 것"

OCR 결합해 LLM 기술 고도화…AI 시장 확대 자신

디지털경제입력 :2025/09/30 17:44

국내 AI 스타트업 업스테이지가 거대언어모델(LLM) 시장 공략을 가속화한다. 올 연말까지 1000억 매개변수를 갖춘 LLM을 개발하고, 한국 뿐만 아니라 아세안·중동 등 글로벌 무대로 시장 영역을 확장할 계획이다.

최훈 업스테이지 사업개발 총괄 이사는 30일 서울 코엑스에서 열린 'AI 페스타 2025'에서 회사의 핵심 기술 및 사업 전략에 대해 밝혔다.

최훈 업스테이지 사업개발 총괄 이사(사진=지디넷코리아)

업스테이지는 자체 개발한 거대언어모델(LLM) '솔라'와 다양한 이미지 형태의 문서에서 글자 및 정보를 추출해 디지털화하는 광학문자인식(OCR) 솔루션 '도큐먼트 AI' 등을 개발해 왔다.

최 이사는 "도큐먼트 AI는 금융권에 가장 먼저 공급된 솔루션으로, 그만큼 정확도가 담보됐기 때문에 거둘 수 있었던 성과"라며 "2023년에는 자체 기술력으로 개발한 소형 LLM 모델인 솔라로 글로벌 오픈소스 차트 1위를 차지하기도 했다"고 설명했다.

덕분에 업스테이지는 지난해 1천억원 규모의 추가 투자를 유치했으며, 글로벌 시장조사기관인 CB인사이츠로부터 '글로벌 혁신 AI 스타트업 100'에 선정된 바 있다. 지난달에는 스타트업 중 유일하게 ‘AI 국가대표’ 5팀 중 한 곳으로 선정되기도 했다.

최 이사는 "업스테이지의 솔루션은 글로벌 탑3 이내로 비용 효율성이 높다"며 "고성능 업무에서도 충분한 성능을 보이면서 비용은 거의 25분의 1 수준이기 때문에 많은 기업들이 업스테이지의 모델을 선택하고 있다"고 말했다.

또한 업스테이지는 솔라와 도큐먼트 AI를 결합해 AI 모델에서 발생하는 할루시네이션 현상을 크게 줄였다. 도큐먼트 AI를 통해 방대한 양의 문서에서 정보를 정확하게 추출해낸 뒤, 이를 솔라와 연계해 필요한 답을 도출하는 구조다.

나아가 업스테이지는 올 연말까지 1000억(100B) 매개변수 규모의 차세대 LLM을 개발할 계획이다. 업스테이지가 올해 공개 '솔라 프로 2'의 경우 310억개의 매개변수를 보유하고 있다.

관련기사

또한 국내 기업들을 타겟으로 금융, 법률, 제조, 교육 등 특정 형태의 모델 개발을 추진한다. 내년 하반기부터는 멀티모달 비전언어모델(VLM)을 포함하고, 아세안 중동 지역까지 지원할 수 있는 거대 AI 모델을 개발하는 것이 목표다.

최 이사는 "OCR과 LLM을 동시에 사용할 수 있는 솔루션을 제공하는 회사는 현재 한국에서 업스테이지가 유일할 것"이라며 "글로벌 3강 AI 기업이 돼서 한국뿐만 아니라 아세안, 그리고 미국과 중국이 닿지 않는 국가들에게 AI 모델을 공급하고자 한다"고 강조했다.