"AI가 직접 계획하고 코드까지 짠다"…GPT-5.4 공개

오픈AI가 전문 업무 수행에 최적화된 프론티어 모델인 GPT-5.4를 공개하며 인공지능(AI) 에이전트 시장 선점에 나섰다.

오픈AI는 5일(현지시간) 공식 블로그를 통해 GPT-5.4를 챗GPT, 응용 프로그램 인터페이스(API), 코덱스 등 주요 제품 전반에 적용한다고 밝혔다.

GPT-5.4는 추론 능력과 코딩 성능, 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징이다. 기존 GPT-5.3 코덱스의 코딩 능력을 흡수해 스프레드시트, 프레젠테이션, 문서 등 전문 업무 환경 내 도구 활용 능력을 개선했다.

회사에 따르면 GPT-5.4는 실제 지식 기반 업무 수행 능력을 평가하는 GDPval 벤치마크에서 전체 과제의 83%에 대해 산업 전문가와 동등하거나 그 이상의 결과를 냈다. 이는 GPT-5.2의 71%를 크게 상회하는 수치다. GDPval은 미국 국내총생산(GDP) 주요 산업을 대표하는 44개 직군의 업무를 기반으로 모델의 실질적인 업무 수행력을 측정한다.

세부 업무별로는 투자은행 주니어 애널리스트 수준의 스프레드시트 모델링 작업에서 87.5% 점수를 기록해 GPT-5.2(68.4%) 대비 성능이 크게 향상됐다. 프레젠테이션 제작 시에도 디자인 완성도와 시각적 다양성, 사실 정확성이 보강됐다.

GPT-5.4는 오픈AI 범용 모델 중 최초로 컴퓨터 사용 능력을 기본 탑재했다. 이를 통해 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 직접 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있다. 최대 100만 토큰 컨텍스트를 지원해 장시간 소요되는 작업의 계획부터 실행, 검증까지 가능하다.