오픈AI, 초고성능 추론 AI 모델 'o3' 공개…쉽마스 대장정 마무리

샘 알트먼 "응답 전 사고 훈련, AI 다음 단계"…ARC AGI 대표 "LLM 한계 해결한 모델"

컴퓨팅입력 :2024/12/22 09:21

오픈AI가 12일간의 쉽마스 행사를 마무리하며 초고성능 추론 인공지능(AI) 모델 'o3'와 소형 모델 'o3 미니'를 공개했다. 내년 1월 말 'o3 미니'를 먼저 출시한 뒤 곧이어 'o3'를 정식으로 내놓을 예정으로, 업계는 기존 AI 모델의 한계를 뛰어넘는 기술력에 주목하고 있다.

오픈AI는 지난 20일(현지시간) 쉽마스 마지막 날 행사에서 'o3' 모델을 선보이며 AI 기술의 새로운 시대를 예고했다. 'o3'는 지난 9월 오픈AI가 발표한 고급 추론 모델인 'o1'의 후속 모델로, 영국의 통신사 'O2'와의 혼동을 피하기 위해 명칭을 조정한 것으로 알려졌다. 

이 모델은 프로그래밍, 수학, 과학 등 여러 분야에서 탁월한 성능을 보였으며 고급 추론 모델 벤치마크인 '아크 일반인공지능(ARC AGI)'에서 87.5%라는 높은 점수를 기록했다. 수학 올림피아드 예선에서는 96.7%의 정답률을 달성하고 박사급 과학 질문 데이터셋에서도 87.7%에 이르는 정확도를 보인 것으로 알려졌다.

오픈AI가 12일간의 쉽마스 행사를 마무리하며 초고성능 추론 AI 모델 'o3'와 소형 모델 'o3 미니'를 공개했다. (사진=오픈AI 유튜브 캡처)

특히 프로그래밍 기술 평가 플랫폼 코드포스에서 2천700점 이상의 점수를 기록하며 세계 상위 0.2% 수준의 '인터내셔널 그랜드마스터' 실력을 입증했다. 업계 전문가들은 'o3'의 성능이 국내 상위 100위권에 해당하는 수준으로 평가하고 있으며 오픈AI 내부에서도 이를 뛰어넘는 프로그래머는 극히 드문 것으로 알려졌다.

프랑수아 쇼레 아크 AGI 창업자는 "'o3'는 LLM의 근본적인 한계를 해결한 모델"이라며 "단순한 점진적 진보가 아니라 완전히 새로운 영역으로, 중대한 과학적 관심이 필요하다"고 평가했다.

다만 'o3'의 우수한 성능 뒤에는 높은 비용이 뒤따른다. 저성능 모드에서는 약 20달러(한화 2만8천원) 정도 비용으로 아크 AGI 기준 75.7%의 성능을 내지만 고성능 모드에서는 성능이 87.5%로 오르는 대신 최대 3천~6천 달러(한화 약 420~840만원)까지 비용이 증가하기 때문이다. 이러한 높은 비용 구조로 'o3'는 주로 기업이나 연구기관과 같은 특정 사용자층에서 활용될 가능성이 높다.

오픈AI 'o3'는 코드포스의 상위 0.2% 수준 점수인 2천700점을 기록했다.

샘 알트먼 오픈AI 대표는 "'o3'는 'o1'과 마찬가지로 응답 전에 먼저 생각하도록 훈련했다"며 "이는 AI의 '다음 단계'를 시사한다"고 강조했다.

오픈AI는 이번 쉽마스에서 연이어 새로운 기술과 기능을 공개하며 AI 활용 범위를 크게 확장했다. 'o3' 공개 이전에는 지난 11일 동안 ▲ 'o1' 및 '프로' 모델 발표 ▲ 강화 학습 미세 조정 프로그램 ▲ 영상 AI '소라' ▲ '캔버스' 기능 ▲ 애플 인텔리전스 통합 ▲ '고급 음성 모드' 및 '산타 모드' 추가 ▲ '프로젝트' 기능 발표 ▲ '챗GPT 서치' 기능 무료 공개 ▲ 'o1' 추론 모델 API 공개 ▲ 유선전화 및 왓츠앱 기반 '챗GPT' ▲ 데스크톱 앱 업데이트 등을 발표해 주목을 받았다.

오픈AI는 1일차에 정확도와 응답 속도를 개선한 'o1' 모델을 발표했다. 이 모델은 데모 버전에서 탈피해 멀티모달 처리와 복잡한 논리 문제 해결 능력을 갖췄으며 '프로' 구독 서비스를 통해 최신 모델과 고급 음성 모드에 무제한 접근이 가능하다. 2일차에는 연구자, 대학, 기업을 대상으로 자체 AI 모델 성능을 개선할 수 있도록 돕는 강화 학습 미세 조정 프로그램이 발표됐다. 이 프로그램은 다양한 산업 분야에서 맞춤형 AI 기술을 활용할 가능성을 열었다.

3일차에는 텍스트 입력만으로 동영상을 제작하고 기존 이미지에 애니메이션을 입힐 수 있는 영상 AI '소라'가, 4일차에는 파이썬 코드 실행·그래픽 미리보기 등이 가능한 '캔버스' 기능이 연이어 공개됐다. 오픈AI는 이를 통해 멀티미디어 콘텐츠 제작 및 AI 협업의 문턱을 낮췄다는 평가를 받았다. 5일차에는 애플 인텔리전스 통합이 이뤄졌다.

오픈AI가 쉽마스 6일차 행사에서 '챗GPT' 고급 음성 모드에 실시간 영상 이해 기능을 추가했다. (사진=오픈AI 유튜브 캡처)

6일차에는 '고급 음성 모드'와 '산타 모드'가 추가돼 서비스 완성도를 한층 높였다. 고급 음성 모드는 기존 실시간 음성 모드에 영상 인식 기능까지 합쳐져 사용자가 움직이는 사물을 보여주면 AI가 이를 인식하고 답변할 수 있다. 산타 모드는 크리스마스 분위기를 반영한 재미 요소로 관심을 모았다. 7일차에는 대화를 업무 단위로 관리하는 '프로젝트' 기능이 발표됐다. 사용자 맞춤형 지침 설정과 파일 업로드 등으로 복잡한 작업 환경에서도 효율적으로 대화를 이어갈 수 있어 생산성을 대폭 높일 것으로 기대된다.

8일차에는 'GPT-4o' 기반 웹 검색 기능인 '챗GPT 서치'를 무료로 전면 공개했다. 사용자 질문에 따라 자동으로 웹 검색을 실시해 뉴스, 스포츠, 주식 관련 정보를 요약하고 콘텐츠로도 제공한다. 9일차에는 레벨 5 개발자 전용으로 'o1' 추론 모델 API를 공개했다. 사실 확인 능력, 외부 데이터 연동, 이미지 분석 등 고급 기능을 갖췄으나 비용이 다소 높다는 점이 특징이다.

(사진=오픈AI)

10일차에는 미국에서 유선전화로 '챗GPT'와 대화할 수 있는 기능이 소개됐다. 기술 소외 계층과 접점을 넓히기 위한 행보로, 소셜미디어 왓츠앱 기반의 텍스트 대화도 별도 계정 없이 제공된다. 11일차에는 '챗GPT' 데스크톱 앱이 업데이트돼 다른 앱으로 전환하지 않고도 작업 화면을 공유하며 AI와 협업할 수 있게 됐다. '엑스코드(Xcode)', '워프(Warp)', '노션(Notion)' 등과 연동해 코드 생성부터 콘텐츠 제작까지 자연어로 처리가 가능하다는 점이 시연됐다.

관련기사

이번달 내내 진행된 오픈AI 쉽마스는 회사의 AI 기술이 어디까지 발전해왔고 또 어디로 향하고 있는지를 가늠케 한 일정이었다. 특히 마지막 날 공개된 'o3'와 'o3 미니'는 전례가 없는 압도적인 성능과 함께 AI의 새로운 과제를 제시하며 업계의 주목을 받고 있다.

샘 알트먼 오픈AI 대표는 "이번 쉽마스는 우리가 지난 1년간 얼마나 진화했는지를 보여주는 기회"라며 "모든 사용자가 AI를 통해 더 나은 경험을 할 수 있도록 계속 노력할 것"이라고 강조했다.