中 딥시크에 자극 받은 오픈AI, 'GPT-4.5'로 격차 벌리기 총력

추론·증류 없는 마지막 모델 출시…월200달러 챗GPT 프로에 우선 제공

컴퓨팅입력 :2025/02/28 09:49    수정: 2025/02/28 10:56

최근 중국 인공지능(AI) 스타트업 딥시크에 자극 받은 오픈AI가 최신 AI 모델인 'GPT-4.5'를 출시하며 경쟁사들과의 기술 격차 벌이기에 나섰다. 추론 AI 모델이 출시되고 있는 상황 속에 일반 모델이 한계를 드러내고 있다는 분석이 많았지만, 이번 일로 기술력을 다시 입증한 분위기다.

블룸버그통신에 따르면 오픈AI는 27일(현지시간) 공식 블로그를 통해 최신 AI 모델인 'GPT-4.5'를 리서치 프리뷰 방식으로 출시한다고 발표했다. 

GPT-4.5는 지난해 5월 처음 선보인 GPT-4o의 후속 모델로, 추론을 사용하지 않는 오픈AI의 마지막 모델이다. 추론 모델인 'o 시리즈'와는 다른 일반 모델로, GPT-5부터는 추론 모델과 일반 모델이 통합된다.

오픈AI가 GPT-4.5를 공개하는 영상 (사진=오픈AI 유튜브 캡처)

리서치 프리뷰는 특정 사용자 그룹에 제한적으로 공개해 테스트하고 피드백을 수집하는 단계를 뜻한다. 오픈AI는 GPT-4.5를 월 200달러 요금제인 '챗GPT 프로'를 사용하는 고객들에게 우선 제공할 예정이다. 또 다음 주 중 수만 개의 그래픽처리장치(GPU)를 추가한 후 월 20달러인 '챗GPT 플러스' 가입자에게도 서비스할 계획이다.

앞서 샘 알트먼 최고경영자(CEO)는 지난 12일 자신의 소셜미디어(SNS)에서 GPT-4.5와 관련해 "수주 내 출시할 예정"이라며 "사고의 사슬(chain-of-thought)이 아닌 마지막 모델이 될 것"이라고 밝힌 바 있다. '사고의 사슬'은 AI가 답을 도출하는 과정에서 중간 사고 과정을 거치는 추론을 의미하는 것을 뜻한다.

GPT-4.5는 더욱 광범위한 지식과 사용자 의도를 이해하는 능력, 특히 감성지능(EQ) 향상으로 한층 더 사람처럼 자연스러운 대화가 가능해졌다. 또 AI가 사실과 다른 정보를 생성하는 '환각(hallucination·할루시네이션)' 현상도 감소할 것으로 전망된다.

오픈AI는 "GPT-4.5가 사용자의 프롬프트에서 미묘한 신호를 포착하고 반응하는 데 더 능숙하다"며 "특히 채팅, 글쓰기, 코딩 등에서 우수한 성능을 보였다"고 말했다. 이어 "새 모델이 이전 소프트웨어보다 오류 발생 빈도가 줄어들 것으로 예상된다"고 덧붙였다.

블룸버그통신은 오픈AI가 '챗GPT'를 출시한 후 생성형 AI 열풍을 일으켰으나, 최근 들어 중국 딥시크와 일론 머스크가 만든 xAI, 앤트로픽 등과 치열한 경쟁을 벌이게 됐다고 평가했다. 특히 딥시크가 공개한 'R1'은 저비용·고성능 AI 모델로, 오픈AI의 최신 AI 추론 모델인 'o1'과 유사한 성능을 냈다는 점에서 위협적인 존재로 떠올랐다.

블룸버그통신은 "오픈AI는 지난해 내놓으려던 '오라이온'으로 불리는 모델은 원하는 성능에 도달하지 못했다"며 "오픈AI와 개발자들은 고급 AI 시스템을 개발하기 위해 아직 활용되지 않는 새로운 고품질 학습 데이터 소스를 찾는데 어려움에 직면했다"고 분석했다.

AI 모델 벤치마크 평가 (사진=오픈AI)

하지만 오픈AI는 사후 학습이라는 프로세스를 통해 문제를 개선했다. 기존 일반 AI 모델은 사전 학습량을 늘려 성능을 개선하는 것인 반면, 최근 선보이는 오픈AI의 모델들은 자체 학습량을 늘리는 대신 기존에 완성된 모델이 작동할 때 추론하는 시간을 늘려 성능을 끌어올리고 있다.

이를 통해 오픈AI는 직전 모델인 'GPT-4o'와 최근 출시한 추론 모델인 'o3-미니'에 비해서도 'GPT-4.5'의 성능을 다소 높일 수 있었던 것으로 분석됐다. 오픈AI에 따르면 GPT-4.5는 AI의 사실적 정확성을 평가하는 '심플QA' 성능 평가(벤치마크)에서 정답률 62.5%를 기록했다. 이는 GPT-4o(38.6%), o3-미니(15.0%)를 넘어서는 수치다. 같은 평가에서 환각 비율은 37.1%로 GPT-4o(59.8%), o3-미니(80.3%)보다 낮았다.

관련기사

AI 모델 벤치마크 테스트에서는 수학과 과학 등 4개 전 부문에서 GPT-4o를 능가했다. o3-미니보다는 언어와 멀티모달은 앞섰고 과학과 수학은 떨어졌다. 답변은 이전 모델들보다 좀 더 인간적으로 변했다. 알트먼 CEO는 "사려 깊은 사람과 대화하는 것 같은 느낌을 주는 최초의 모델"이라고 강조했다.

오픈AI 관계자는 "기존 GPT-4 모델을 훈련하는 데 사용된 정보에서 파생된 데이터를 사용해 모델을 훈련하는 새로운 방법을 고안했다"며 "GPT-4.5의 기능이 이전보다 크게 도약할 것으로 기대한다"고 말했다.