"적은 리소스로 고성능 지원"…IBM, '그래니트 3.0' 앞세워 기업용 AI 시장 공략

엔터프라이즈 환경에 맞춰 추론 속도 최대 220% 향상…고성능·안전성 강화

컴퓨팅입력 :2024/10/22 09:41

IBM이 엔터프라이즈 환경에 최적화된 새로운 대형 언어 모델(LLM)인 '그래니트 3.0(Granite 3.0)'을 앞세워 기업용 인공지능(AI) 시장 공략에 속도를 낸다.

IBM은 22일 연례 테크익스체인지(TechXchange) 행사에서 신규 AI 모델 제품군인 그래니트 3.0을 발표했다. 그래니트 3.0은 기업 업무환경에 맞춰 복잡한 작업을 안전하고 효율적으로 처리할 수 있도록 설계된 AI 모델로, 고성능, 비용 효율성, 안전성을 강화했다.

IBM의 엔터프라이즈 전용 AI '그래니트 3.0'(이미지=IBM)

IBM의 왓슨X(Watsonx) 플랫폼을 통해 제공되는 그래니트 3.0은 AI를 도입하는 기업을 위해 복잡한 작업을 더욱 안전하고 효율적으로 처리할 수 있도록 설계된 AI 모델이다. 특히 IBM은 기업에서 요구하는 비용 효율성을 충족할 수 있도록 설계됐다고 강조했다.

그래니트 3.0 시리즈의 주력 모델인 그래니트 3.0 8B 인스트럭트는 8억 개의 매개변수를 가진 AI 모델이다. 매개변수 규모가 더 큰 AI 모델보다 적은 리소스로도 고성능을 제공할 수 있도록 명령어 튜닝(Instruct-tuned) 기술을 적용한 것이 특징이다.

다양한 외부 API와 도구를 통합한 고급 작업을 위한 도구 호출(Agentic Use Cases) 기능도 지원한다. 이를 통해 사용자의 요청에 맞춰 복잡한 데이터 분석을 실행하거나 외부 시스템과 연계하여 자동화된 비즈니스 프로세스를 관리할 수 있다.

이 외에도 시간 처리 응답이 중요한 엔터프라이즈 환경을 위해 추론 속도를 최대 220% 향상할 수 있는 추측 디코딩(speculative decoding)도 제공한다.

함께 공개한 그래니트 3.0 2B 인스트럭트는 소규모 리소스와 비용으로 운영할 수 있도록 개발된 AI 모델이다. 2억 개의 매개변수 기반으로 고성능이 필요하지 않은 작업이나 리소스가 제한된 환경에서 적합한 솔루션을 제공하며 소규모 작업이나 특정 도메인에 특화된 앱에서 활용할 수 있다.

이 모델은 텍스트 생성, 요약, 분류 등 자연어 처리(NLP) 작업을 비롯해 코드 생성 및 수정 등 텍스트 관련 업무에 최적화해 개발됐다.

그래니트 3.0 모델들은 글로벌 비즈니스를 운영하는 기업이 다양한 언어로 AI를 활용할 수 있도록 12개의 자연어와 116개의 프로그래밍 언어를 지원한다.

이러한 특성을 살려 고객 지원 시스템, 문서 분석, 데이터 처리와 고객 지원, 글로벌 문서 분석, 다국적 비즈니스 프로세스 관리에 적합하다.

그래니트 3.0 시리즈는 기업 환경에 맞춰 안전성을 강화하기 위해 보안 전문 AI인 그래니트 가디언(Granite Guardian)도 함께 선보인다.

이 모델은 애플리케이션 개발자가 사용자 명령어와 LLM의 답변에서 발생할 수 있는 다양한 위험 요소를 감지해 안전장치를 구현할 수 있도록 지원한다. 그래니트 가디언 3.0 8B와 2B 모델은 현재 시장에서 가장 포괄적인 위험 및 피해 탐지 기능을 제공한다.

그래니트 가디언은 사회적 편견, 증오, 유해성, 욕설, 폭력, 보안 우회(jailbreaking) 등의 위험 요소를 감지할 뿐만 아니라 정보의 신뢰성, 맥락의 적합성, 답변의 관련성과 같이 검색 증강 생성(RAG) 작업에 특화된 고유한 검증 기능도 갖추고 있다.

19개 이상의 안전성 및 RAG 벤치마크 테스트에서 그래니트 가디언 3.0 8B 모델은 메타(Meta)의 라마 가드모델보다 유해성 감지 분야에서 평균적으로 높은 정확도를 기록했다. 환각 감지 분야에서도 위첵(WeCheck) 및 미니첵(MiniCheck) 같은 전문 감지 모델과 비슷한 성능을 달성했다.

IBM은 다른 AI 플랫폼이나 개발자들이 쉽게 접근하고 사용할 수 있도록 그래니트 3.0을 오픈소스 라이스선스인 아파치 2.0으로 제공한다. 덕분에 허깅페이스, 구글 버텍스, 엔비디아를 비롯한 여러 파트너 플랫폼에서 그래니트 3.0 모델 연계해 사용할 수 있다.

더불어 IBM은 왓슨x 오케스트레이트와 같이 로우코드 도구와 자동화를 통해 기업들이 자체 AI 어시스턴트를 쉽게 개발할 수 있도록 지원할 방침이다.

관련기사

이 밖에도 고객 서비스, 인사, 영업, 마케팅 등 특정 업무와 영역에 특화해 사전 구축된 어시스턴트에 이르기까지 다양한 AI 어시스턴트 기술 포트폴리오를 지속적으로 발전시키고 있다.

IBM은 "그래니트 코드 모델을 기반으로 C, C++, 고(Go), 자바(Java), 파이썬(Python) 등 다양한 프로그래밍 언어에 대한 범용 코딩 지원에 나설 것"이라며 "엔터프라이즈 자바(Java) 애플리케이션을 위한 고급 애플리케이션 현대화 기능을 제공하는 차세대 왓슨x 코드 어시스턴트도 올해 4분기에 출시할 예정"이라고 밝혔다.