"비용·업무 최적화"…IBM, 기업 전용 LLM 그래니트 신형 출시

IBM이 기업 업무환경에 최적화된 대규모언어모델(LLM) 최신 버전을 선보인다.

IBM은 LLM 제품군 차세대 버전인 그래니트(Granite) 3.2를 출시했다고 27일 밝혔다.

그래니트는 작고 효율적이며 실용적인 기업용 인공지능(AI)을 제공해 실질적인 비즈니스 효과를 창출하기 위한 IBM의 지속적인 노력이 담긴 솔루션이다.

그래니트 3.2 모델은 허깅 페이스에서 허용되는 아파치 2.0 라이선스에 따라 사용할 수 있다.

일부 모델들은 IBM 왓슨x.ai, 올라마(Ollama), 리플리케이트(Replicate), LM 스튜디오에서 바로 사용가능하다. 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 제공돼 기업과 오픈 소스 커뮤니티에 새로운 기능을 제공할 예정이다.

그래니트 3.2은 문서 해석 작업을 위한 새로운 비전언어모델(VLM)이다. 엔터프라이즈 벤치마크인 DocVQA, ChartQA, AI2D 및 OCR벤치에서 기존 대형 모델인 라마 3.2 11B 및 픽스트랄 12B와 동등하거나 그 이상의 성능을 입증했다.

IBM은 풍부한 학습 데이터뿐 아니라 자체 오픈 소스 도클링(Docling) 도구를 활용해 8천500만 개의 PDF를 처리하고 2천600만 개의 합성 질문-답변 조합을 생성해 복잡한 문서 중심의 업무를 처리하는 VLM의 능력을 향상시켰다.

프로그래밍 방식으로 '연쇄적 사고(Chain of thought)'기능을 활성화 또는 비활성화할 수 있는 기능을 도입했다. 이 기능을 활용해 간단한 작업은 추론 기능을 최소화해 불필요한 연산 부하를 줄일 수 있다.

이 기능을 통해 8B 모델은 안전성이나 성능 저하 없이 아레나하드및 알파카이벨과 같은 인스트럭션 추종 벤치마크에서 이전 모델보다 두 자릿수 개선된 성과를 달성했다.

그래니트 3.2 8B 모델의 경우 새로운 추론 확장(inference scaling) 방법으로 AIME2024 및 MATH500과 같은 수학 추론 벤치마크에서 클로드 3.5-소넷 또는 GPT-4o와 같은 대규모 모델의 성능에 필적하도록 보정 가능하다.

관련기사