오픈AI, 한 달 만에 GPT-5.2 공개…구글 제미나이에 반격 나섰다

'코드 레드' 발동 후 출시 시점 앞당겨…전문 작업 성능 향상

컴퓨팅입력 :2025/12/12 10:08    수정: 2025/12/12 16:37

구글 제미나이의 거센 추격 속에서 오픈AI가 한 달 만에 프런티어 모델 'GPT-5.2'를 내놓으며 정면 돌파에 나섰다. 챗GPT 트래픽 감소와 내부 '코드 레드' 비상 체제까지 겹친 상황에서 강화된 성능의 신모델이 경쟁 구도를 다시 뒤흔들 것이라는 평가가 나온다.

오픈AI는 11일(현지시간) GPT-5.2 시리즈를 출시한다고 발표했다. 새 모델은 즉답·사고·프로 등 세 가지 모드로 구성되며 전문 지식 업무와 장시간 에이전트 실행에 최적화된 것이 특징이다.

GPT-5.2는 챗GPT 유료 구독자에게 순차 제공되며 개발자들은 API를 통해 즉시 이용할 수 있다. GPT-5.1은 앞으로 3개월 뒤 지원이 종료된다.

샘 알트먼 오픈AI CEO (사진=지디넷코리아)

이번 공개는 단순한 기능 업그레이드를 넘어 최근 제미나이 3의 급성장으로 흔들린 인공지능(AI) 시장 판도에 오픈AI가 다시 우위를 확보하려는 전략으로 풀이된다. 시장조사업체 시밀러웹에 따르면 챗GPT 트래픽 점유율은 1년 전 87%에서 최근 71.3%까지 떨어진 반면, 구글 제미나이는 같은 기간 5.7%에서 15.1%로 뛰어올랐다.

내부적으로도 샘 알트먼 오픈AI 최고경영자(CEO)는 직원들에게 코드 레드를 선언하며 챗GPT 모델 품질 개선을 최우선 과제로 지시한 바 있다.

이번에 공개된 GPT-5.2는 추론·코딩·수학·장문 분석·비전·도구 활용 등 전 영역에서 성능이 향상됐다. 오픈AI 자체 평가에서 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가와 대등하거나 능가하는 수준으로 평가됐다.

이전 버전 GPT-5의 38.8%와 비교하면 압도적인 성장이다. SWE 벤치마크에서도 80%를 기록하며 구글 제미나이 3 프로(76.2%)를 넘어섰고 앤트로픽 클로드 오퍼스4.5(80.9%)와도 1% 미만 차이에 불과한 것으로 나타났다.

또 사고 모드의 환각 오류율은 6.2%로 전작 대비 약 30% 감소했으며 긴 문서 맥락 이해와 이미지·그래프 분석 능력, 다단계 업무 처리 능력도 상향됐다. 복잡한 논리·수학 문제 해결 과정에 있어서도 이전보다 38% 적은 오류를 냈고 추론·코딩·과학 벤치마크에서도 최고치를 기록했다.

개발자들을 위한 API 측면에서는 추론 강도를 선택할 수 있는 다섯 단계의 옵션을 제공해 복잡한 프로젝트 수행 능력을 강화했다.

GPT-5.2 벤치마크 결과 (사진=오픈AI)

오픈AI 피지 시모 최고제품책임자(CPO)는 "GPT-5.2는 스프레드시트 제작, 프레젠테이션 구성, 코드 작성, 이미지 이해, 장문 맥락 추론, 도구 활용 등 실제 업무에서 큰 경제적 가치를 제공하도록 설계됐다"고 설명했다.

이번 공개는 오픈AI가 빠른 속도로 AI 모델을 출시하는 전환점으로 평가된다. GPT-5.1 발표 후 불과 한 달 만의 출시로, 이는 챗GPT 서비스를 시작한 2022년 이후 가장 짧은 주기다. 월스트리트저널과 여러 외신은 오픈AI가 내부 비상 상황 속에서 제미나이 3 프로의 벤치마크 공세를 의식해 GPT-5.2 출시 일정을 당긴 것으로 분석했다.

이번 GPT-5.2 공개로 오픈AI·구글·앤트로픽 간 경쟁이 한층 격렬해질 전망이다.

관련기사

한편 오픈AI 내부에서는 고도화된 추론 모델 중심 전략이 높은 연산 비용 부담으로 이어질 수 있다는 우려도 제기되고 있다. 업계에서는 오픈AI의 추론 비용 상당 부분이 클라우드 이용료가 아닌 현금으로 지불되고 있다는 관측도 나온다.

오픈AI는 "더 효율적인 모델 구조와 강화된 성능을 통해 동일 비용 대비 더 높은 지능을 제공하는 방향으로 나아가고 있다"며 "앞으로도 안전성과 신뢰성을 강화하고 사용자가 기대하는 품질을 꾸준히 발전시켜 나가겠다"고 밝혔다.