오픈AI가 5일(현지 시각) 공개한 'GPT-5.3-Codex'는 자신의 학습 과정을 디버깅하고, 배포를 관리하며, 테스트 결과를 스스로 진단한 첫 AI 모델이다. 오픈AI 연구원과 엔지니어들은 "불과 2개월 전과 비교해 지금 하는 일이 근본적으로 달라졌다"고 밝혔다.

GPT-5.3-Codex의 실력은 구체적인 결과물로 입증됐다. 며칠에 걸쳐 완전히 작동하는 복잡한 게임을 처음부터 끝까지 혼자 만들어낸다. 오픈AI가 테스트로 제작하도록 한 레이싱 게임은 8개 지도, 다양한 레이서, 스페이스 바로 사용하는 아이템까지 갖췄다. 다이빙 게임은 여러 산호초를 탐험하고, 산소·압력·위험을 관리하며 물고기 도감을 완성하는 방식이다. '버그 수정' 또는 '게임 개선'과 같은 간단한 지시만으로 GPT-5.3-Codex는 수백만 개의 토큰에 걸쳐 자율적으로 게임을 반복 개선했다.

일상적인 웹사이트 제작도 한층 똑똑해졌다. 예를 들어 랜딩 페이지를 만들어달라고 요청하면, 이전 버전은 단순하게 만들었지만 GPT-5.3-Codex는 연간 요금제를 할인된 월 단위 가격으로 자동 표시하고, 3개의 서로 다른 사용자 후기가 자동으로 전환되는 캐러셀을 만드는 등 완성도 높은 결과물을 기본값으로 제공한다.

개발 현장의 변화는 더욱 극적이다. 오픈AI 연구팀은 GPT-5.3-Codex를 사용해 학습 실행을 모니터링하고 디버깅했다. 인프라 문제를 넘어 학습 과정 전반의 패턴을 추적하고, 상호작용 품질을 심층 분석하며, 수정 사항을 제안하고 이전 모델과 어떻게 다른지 정확히 이해할 수 있는 애플리케이션을 구축했다.

GPT-5.3-Codex는 단순히 코드만 작성하지 않는다. 디버깅, 배포, 모니터링, 요구사항 문서 작성, 사용자 연구, 테스트, 지표 분석 등 소프트웨어 생명주기의 모든 작업을 지원한다. 슬라이드 덱 제작이나 스프레드시트 데이터 분석 같은 일반 업무도 처리한다. 오픈AI가 2025년 발표한 GDPval 평가에서 44개 직업에 걸친 지식 작업 과제를 측정한 결과, 재무 자문 슬라이드, 소매 교육 문서, NPV 분석 스프레드시트, 패션 프레젠테이션 PDF 등을 전문가 수준으로 제작했다.

실시간 협업 기능도 한층 강화됐다. 최종 결과물을 기다리는 대신 작업 중인 AI와 실시간으로 대화하며 질문하고, 접근 방식을 논의하고, 방향을 조정할 수 있다. GPT-5.3-Codex는 작업 중 주요 결정과 진행 상황을 자주 업데이트해 사용자가 계속 파악할 수 있도록 한다.

하지만 오픈AI는 이 강력한 도구를 조심스럽게 공개하고 있다. GPT-5.3-Codex는 오픈AI의 준비 프레임워크에 따라 사이버 보안 관련 작업에서 '높은 역량'으로 분류된 첫 모델이며, 소프트웨어 취약점을 식별하도록 직접 학습된 첫 모델이다. 사이버 공격을 처음부터 끝까지 자동화할 수 있다는 확실한 증거는 없지만, 오픈AI는 예방적 접근 방식을 취하고 지금까지 가장 포괄적인 사이버 보안 안전장치를 배포했다.

오픈AI는 사이버 방어를 강화하기 위해 보안 연구 에이전트인 아드바크(Aardvark) 비공개 베타를 확대하고, Next.js 같은 오픈소스 프로젝트에 무료 코드베이스 스캐닝을 제공한다. 지난주 보안 연구자가 Codex를 사용해 발견한 취약점이 실제로 공개되기도 했다. 2023년 시작한 100만 달러 사이버 보안 보조금 프로그램을 확대해 1,000만 달러의 API 크레딧을 제공하며, 특히 오픈소스 소프트웨어와 핵심 인프라 시스템 보안에 집중한다.

GPT-5.3-Codex는 유료 챗GPT플랜으로 앱, CLI, IDE 확장 프로그램, 웹에서 사용할 수 있다. 오픈AI는 곧 API 접근도 안전하게 활성화할 계획이다. 처리 속도는 이전보다 25% 빨라졌으며, 엔비디아GB200 NVL72 시스템에서 개발됐다.

관련기사

해당 서비스에 대한 자세한 사항은 오픈AI에서 확인 가능하다.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)