구글이 대규모 인공지능(AI) 서비스에 최적화된 경량 생성형AI 모델을 공개했다. 성능과 속도를 유지하면서도 운영 비용을 크게 낮춘 것이 특징이다.

구글은 5일(현지시간) '제미나이 3.1 플래시-라이트'를 개발자 대상으로 프리뷰 형태로 공개했다고 밝혔다. 해당 모델은 구글 AI 스튜디오 제미나이 API를 통해 제공된다. 기업 고객은 버텍스 AI에서 사용할 수 있다.

이번 모델은 제미나이 3 시리즈 가운데 가장 빠르고 비용 효율적인 모델로 설계됐다. 특히 대규모 API 호출과 실시간 서비스를 처리하는 개발자 워크로드를 겨냥했다. 번역, 콘텐츠 검열, 요약, 고객 서비스 자동화 등 고빈도 AI 작업에 활용하기 쉽도록 설계됐다.

제미나이 3.1 플래시라이트(왼쪽)와 제미나이 2.5 플래시 속도와 품질 비교 (이미지=구글)

성능 개선도 눈에 띈다. 외부 AI 분석 기관 아티피셜 애널리시스(Artificial Analysis) 벤치마크에 따르면 제미나이 3.1 플래시-라이트는 이전 모델인 '제미나이 2.5 플래시' 대비 첫 응답 토큰 생성 속도가 2.5배 빨라졌다. 전체 출력 속도도 약 45% 향상됐다. 이러한 낮은 지연 시간은 실시간 챗봇, 검색, 인터랙티브 애플리케이션 구축에 중요한 요소다.

가격 경쟁력도 강조됐다. 제미나이 3.1 플래시-라이트의 가격은 입력 토큰 기준 100만 개당 0.25달러, 출력 토큰 기준 100만 개당 1.50달러다. 이는 상위 모델인 '제미나이 3.1 프로' 대비 최대 약 8분의 1 수준이다.

다만 두 모델은 성능 등급이 다른 라인업이다. 제미나이 프로는 복잡한 추론과 장문 컨텍스트 처리 등 고성능 작업을 위한 모델이다. 반면 플래시-라이트는 대량 트래픽 처리와 비용 효율에 초점을 맞춘 경량 모델이다.

제미나이 3.1 플래시 라이트 벤치마크 결과(이미지=구글)

경량 모델이지만 벤치마크 성능도 경쟁력을 확보했다. '아레나.ai 리더보드'에서 Elo 점수 1432점을 기록했다. 고난도 과학 문제 평가인 'GPQA 다이아몬드'에서 86.9%, 멀티모달 이해 평가인 'MMMU 프로'에서 76.8%를 기록하며 이전 세대 모델을 넘어서는 성능을 보였다.

개발자 활용성을 높이기 위한 기능도 추가됐다. 제미나이 3.1 플래시-라이트는 AI 스튜디오와 버텍스 AI에서 '씽킹 레벨' 기능을 제공한다. 작업 난이도에 따라 모델의 추론 수준을 조정할 수 있는 기능이다. 이를 통해 단순 작업부터 복잡한 작업까지 비용과 성능을 상황에 맞게 조절할 수 있다.

현재 일부 기업은 해당 모델을 활용해 초기 테스트를 진행하고 있다. 라티튜드, 카트휠, 웨어링 등이 서비스 적용을 위한 실험을 진행 중이다. 초기 사용자은 복잡한 입력 처리와 지시 수행 능력에서 높은 효율성을 보였다고 평가했다.

구글 제미나이팀은 "제미나이 3.1 플래시 라이트는 제미나이 3 시리즈 중가장 빠르고 비용 효율적인 모델"이라며 " 대규모 개발자 워크로드에 최적화된 것이 특징으로 반응형 실시간 환경을 구축하는 데 이상적인 모델"이라고 설명했다.