"AI가 직접 계획하고 코드까지 짠다"…GPT-5.4 공개

오픈AI, GDPval 전문가 수준 83% 달성

컴퓨팅입력 :2026/03/06 09:54    수정: 2026/03/06 10:13

오픈AI가 전문 업무 수행에 최적화된 프론티어 모델인 GPT-5.4를 공개하며 인공지능(AI) 에이전트 시장 선점에 나섰다.

오픈AI는 5일(현지시간) 공식 블로그를 통해 GPT-5.4를 챗GPT, 응용 프로그램 인터페이스(API), 코덱스 등 주요 제품 전반에 적용한다고 밝혔다. 

GPT-5.4는 추론 능력과 코딩 성능, 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징이다. 기존 GPT-5.3 코덱스의 코딩 능력을 흡수해 스프레드시트, 프레젠테이션, 문서 등 전문 업무 환경 내 도구 활용 능력을 개선했다.

GPT-5.4 (사진=오픈AI)

회사에 따르면 GPT-5.4는 실제 지식 기반 업무 수행 능력을 평가하는 GDPval 벤치마크에서 전체 과제의 83%에 대해 산업 전문가와 동등하거나 그 이상의 결과를 냈다. 이는 GPT-5.2의 71%를 크게 상회하는 수치다. GDPval은 미국 국내총생산(GDP) 주요 산업을 대표하는 44개 직군의 업무를 기반으로 모델의 실질적인 업무 수행력을 측정한다.

세부 업무별로는 투자은행 주니어 애널리스트 수준의 스프레드시트 모델링 작업에서 87.5% 점수를 기록해 GPT-5.2(68.4%) 대비 성능이 크게 향상됐다. 프레젠테이션 제작 시에도 디자인 완성도와 시각적 다양성, 사실 정확성이 보강됐다.

GPT-5.4는 오픈AI 범용 모델 중 최초로 컴퓨터 사용 능력을 기본 탑재했다. 이를 통해 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 직접 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있다. 최대 100만 토큰 컨텍스트를 지원해 장시간 소요되는 작업의 계획부터 실행, 검증까지 가능하다.

관련기사

챗GPT 사용자들을 위한 'GPT-5.4 씽킹(Thinking)' 기능도 도입됐다. 모델이 답변 생성 전 작업 계획을 먼저 제시해 사용자가 중간에 방향을 조정할 수 있도록 해 반복적인 대화 과정을 줄였다. 대규모 도구 환경에서 필요한 도구를 정확히 찾아내는 '도구 검색' 기능을 통해 토큰 사용량과 응답 지연 시간도 단축했다.

오픈AI 측은 "GPT-5.4는 문제 해결에 필요한 토큰 수를 줄인 가장 효율적인 추론 모델"이라며 "기업과 전문가들이 복잡한 업무를 더 빠르고 정확하게 수행하는 에이전트 중심의 새로운 업무 방식이 확산될 것으로 기대한다"고 말했다.