[AI는 지금] 오픈AI 'GPT-5.2'에 맞불…구글, '빠르고 싼 AI'로 판 흔든다

'GPT-5.2'와 성능 경쟁 대신 확산 전략…경량 '제미나이3 플래시'로 정면 대응

컴퓨팅입력 :2025/12/18 18:14

최근 오픈AI가 차세대 인공지능(AI) 모델 'GPT-5.2'를 내놓으며 기술 우위를 강조한 가운데 구글이 속도와 비용을 앞세운 경량 모델로 맞불을 놨다. 최고 성능 경쟁이 아닌 실사용 시장을 둘러싼 AI 시장 주도권 다툼이 본격화되는 양상이다.

18일 테크크런치에 따르면 구글은 지난 17일 답변 속도를 높이고 비용을 낮춘 '제미나이3 플래시'를 출시했다. 지난 달 공개한 '제미나이3'의 경량 버전으로, 구글 제미나이3는 최상위 모델인 '딥싱크'와 균형 모델인 '프로'를 포함해 삼각 편대를 완성했다.

경량 모델인 '제미나이3 플래시'는 방대한 데이터로 학습한 상위 모델을 기반으로 이른바 '증류(distillation)' 과정을 거쳐 개발됐다. 속도와 비용 효율성을 높이면서도 성능 저하를 최소화한 것이 특징이다. 구글은 이번 모델이 기존 경량 AI가 안고 있던 '빠르지만 성능이 떨어진다'는 한계를 넘어섰다고 강조했다.

조시 우드워드 구글랩스·제미나이 담당 부사장은 "그동안 AI 사용자는 비싸고 느린 대형 모델과 성능이 낮은 고속 모델 중 하나를 선택해야 했다"며 "'제미나이3 플래시'는 지능과 속도를 동시에 제공하는 모델"이라고 설명했다.

구글 '제미나이3 플래시' (이미지=구글 공식 뉴스룸)

구글이 공개한 벤치마크 결과에 따르면 '제미나이3 플래시'는 일부 지표에서 상위 모델과 유사하거나 오히려 앞서는 성능을 기록했다. 일반 지식과 추론 능력을 평가하는 'MMLU-프로(Pro)' 점수는 81.2%로, 프로 모델(81%)과 비슷한 수준을 보였다. 또 코딩 능력을 측정하는 'SWE-벤치 베리파이드'에서는 78%를 기록해 프로 모델(76.2%)을 웃돌았다.

고난도 과학 지식을 평가하는 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE'에서는 각각 90.4%, 33.7%를 기록했다. 이는 프로 모델보다는 다소 낮지만, 경량 모델이라는 점을 고려하면 격차가 크지 않은 수준이라는 평가다. 특히 HLE 점수는 최근 공개된 GPT-5.2와 유사한 수준으로 나타났다.

구글은 '제미나이3 플래시'를 이날부터 전 세계 제미나이 앱의 기본 모델로 적용하며 기존 '제미나이2.5 플래시'를 대체했다. 검색 서비스에서도 챗봇 형태의 'AI 모드' 기본 모델로 플래시를 채택했다. 대규모 트래픽을 처리해야 하는 서비스 전반에 경량 모델을 전면 배치한 셈이다.

멀티모달 활용성도 강화됐다. 이에 사용자는 이미지·영상·오디오 파일을 업로드해 분석이나 설명을 요청할 수 있다. 또 간단한 스케치 인식이나 영상 기반 조언, 음성 분석을 통한 퀴즈 생성 등도 가능하다. 구글은 '제미나이3 플래시'가 사용자 의도를 더 정확히 이해하고 이미지와 표 등 시각적 요소를 활용한 응답 생성 능력도 개선됐다고 밝혔다.

기업과 개발자 대상 활용도 확대될 전망이다. 외부 개발자가 API를 통해 '제미나이3 플래시'를 사용할 경우 요금은 입력 토큰 100만 개당 0.5달러, 출력 토큰 100만 개당 3달러로, 프로 모델의 4분의 1 수준이다. 비용 부담이 낮아지면서 대규모 반복 업무나 실시간 처리 환경에서 채택이 늘어날 것으로 예상된다.

구글은 "피그마, 커서 등 다수 기업이 이미 '제미나이3 플래시'를 활용하고 있다"며 "해당 모델을 버텍스 AI와 제미나이 엔터프라이즈를 통해 제공하고 있다"고 밝혔다. 

관련기사

구글에 따르면 '제미나이3' 출시 이후 API를 통해 하루에 처리되는 토큰 수는 1조 개를 넘어섰다. 토큰은 AI가 문장을 분석하기 위해 쪼개는 단위로, 서비스 활용 규모를 가늠하는 지표로 활용된다.

업계 관계자는 "이번 '제미나이3 플래시' 출시는 오픈AI가 GPT-5.2를 통해 최고 성능을 강조한 데 대한 구글의 전략적 대응으로 보인다"며 "성능 경쟁에 정면으로 나서는 대신 속도와 비용, 확산성을 앞세워 실사용 시장을 선점하겠다는 계산이 깔린 듯 하다"고 분석했다. 그러면서 "이젠 AI 경쟁의 초점이 '누가 더 똑똑한가'에서 '누가 더 많이 쓰이느냐'로 옮겨가고 있는 듯 하다"고 덧붙였다.