오픈AI가 스스로 사고하고 판단하는 인공지능(AI) 모델 'o' 시리즈를 업데이트하며 이미지 인식·도구 자동 활용 기능을 통합했다. AI가 사용자 지시 없이 웹 검색이나 코드 실행을 수행하고 저해상도 이미지도 해석하게 해 기술 경쟁 속 리더십 확보에 나선 것이다.
오픈AI는 'o3', 'o4-미니', 'o4-미니-하이' 모델을 '챗GPT'에 연동했다고 17일 밝혔다. 해당 모델들은 프로, 플러스, 팀 요금제 유료 구독자에게 우선 제공되며 도구 사용 환경에서는 자동 호출 기능이 기본으로 적용된다.
이번 신모델들은 코딩, 수학, 과학, 추론 등 전 영역에서 기존 모델보다 성능이 크게 향상된 것으로 평가된다. 특히 오픈소스 문제를 힌트 없이 해결해야 하는 고난도 벤치마크인 'SWE-벤치 베리파이드'에서 'o3'는 69.1%, 'o4-미니'는 68.1%를 기록해 기존에 49.3%를 기록한 'o3-미니' 큰 폭으로 앞질렀다. 경쟁사 가운데서는 앤트로픽의 '클로드 3.7 소넷'이 62.3%로 뒤를 이었다.

알고리즘 기반 코딩 대회 플랫폼인 코드포스 평가에서도 'o3'와 'o4-미니'는 각각 2천706점, 2천719점의 최상위권 점수를 기록해 2천73점을 기록한 'o3-미니'와 1천891점을 기록한 'o1'을 앞섰다. 이 점수는 실제 인간 참가자 기준으로도 상위 1%에 해당하는 실력으로, 두 모델 모두 복잡한 알고리즘 문제를 실전처럼 해결할 수 있는 수준에 도달했음을 의미한다.
시각적 이해 기능도 대폭 강화됐다. 사용자가 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다.
추론 과정에서 모델은 코드 작성, 웹 검색, 이미지 생성 등 다양한 도구를 자동으로 불러와 응답을 생성한다. 이 도구들은 '챗GPT'의 전용 브라우저 환경인 '캔버스' 내에서 작동하며 사용자가 따로 명령하지 않아도 모델이 스스로 판단해 필요한 기능을 호출하는 구조다. 이는 최초의 추론 전용 모델이었던 'o1'에서는 구현되지 않았던 기능으로, 도구 활용 범위와 자율성이 크게 확장된 셈이다.
세 모델은 오픈AI의 응답 생성 애플리케이션 프로그램 인터페이스(API)인 '채팅 완성 API(Chat Completions API)'와 '응답 API(Responses API)'를 통해서도 제공된다. 개발자는 이들 모델을 사용량 기반 요금제로 앱에 통합할 수 있으며 입력 토큰 백만 개당 요금은 'o3'가 10달러(한화 약 1만4천원), 'o4-미니'는 'o3-미니'와 동일한 1.10달러(한화 약 1천540원)로 책정돼 있다.

업계에선 이번 발표를 오픈AI의 전략 전환으로 평가한다. 당초 CEO 샘 알트먼은 'o3'를 출시하지 않겠다는 입장을 밝혔지만 경쟁사 모델들의 추격이 거세지자 입장을 바꿔 실제 제품에 적용했다는 평가다.
관련기사
- AI 추론 CoT 신뢰성, '빨간불'…사고과정 드러낸다더니 숨겼다2025.04.06
- 오픈AI, 'o1-프로' 출시…역대 최고가 AI 모델 선보여2025.03.20
- "앤트로픽, 클로드 새 모델 공개 임박?"…출시설에 AI 업계 촉각2025.02.14
- 오픈AI CRO, 장병탁 원장 만나…"AI 모델 추론·견고함에 집중"2025.02.04
향후엔 더 강력한 'o3-프로'도 출시가 예고돼 있다. 이는 'GPT-5'와의 통합 전에 ChatGPT에 적용될 마지막 독립 추론 모델로 더 많은 연산 자원을 활용해 정밀한 결과를 제공할 예정일 것으로 알려졌다.
사전 테스트에 참여한 전문가들은 'o3'를 '가장 똑똑하고 신뢰할 수 있는 모델'이라며 극찬했다. 의학 연구자인 데리야 우누트마즈 박사는 "오픈AI 'o3'는 마치 지능이 천재 수준에 도달한 느낌으로, 복잡한 고차원 작업도 거침없이 처리하고 언제나 정교하고 정확한 응답을 준다"며 "이건 단순한 기술 업데이트가 아니라 명백한 게임 체인저"라고 강조했다.