오픈AI의 첫 개발자 컨퍼런스, 어땠나

GPT-4 터보·맞춤형 챗GPT·어시스턴트 API 소개

컴퓨팅입력 :2023/11/07 13:57    수정: 2023/11/07 16:41

오픈AI의 첫 개발자 컨퍼런스가 개최됐다. 샘 알트먼 최고경영자(CEO)의 기조연설이 40분간 진행하며 새로운 모델과 개발자 관련 새 기능을 소개했다. 중간에 사티아 나델라 마이크로소프트 회장이 무대에 올라 두 회사의 파트너십을 강조하기도 했다.

샘 알트먼 CEO는 6일(현지시간) 미국 샌프란시스코에서 개최한 '오픈AI 데브데이' 기조연설에서 최신 대규모언어모델(LLM)인 'GPT-4 터보', 노코드 기반 맞춤형 챗GPT인 'GPTs(지피티스)', GPTs로 만든 맞춤형 챗GPT를 사고 팔 수 있는 마켓 'GPT 스토어', 일반 앱에 GPT 기반 에이전시를 붙일 수 있는 '어시스턴트 API'를 발표했다.

이날 기조연설의 내용은 크게 세 갈래였다. 하나는 새로운 버전의 언어모델이고, 두번째는 마이크로소프트와 파트너십 강조였다. 세번째는 챗GPT의 시장 확장이었다.

샘 알트먼 오픈AI CEO

그는 작년 11월30일 챗GPT 출시 후 1년 사이 벌어진 상황을 언급해가며 연설을 시작했다. GPT-4, 챗GPT 음성 및 비전 기능, 달리3, 챗GPT 엔터프라이즈 등이 언급됐다. 그는 "현재 약 200만명의 개발자가 API를 기반으로 다양한 사례를 개발하며 놀라운 일을 하고 있다"며 "포춘 500대 기업 중 92%가 우리 제품을 기반으로 하며, 현재 챗GPT는 약 1억명의 주간활성사용자가 있다"고 밝혔다.

■ 더 싸지고 더 많이 이해하는 최신 LLM 'GPT-4 터보'

여러 사용자 인터뷰 영상을 보여준 후 새로운 기술을 소개하기 시작했다. 가장 먼저 발표된 건 'GPT-4 터보'다.

GPT-4 터보는 새로운 모델이다. 이전 버전인 GPT-4보다 더 빨라지고, 한번에 더 많은 콘텐츠를 이해할 수 있다. 올해 4월까지 수집한 데이터를 학습해 더 최신 정보를 알고 있다. 그러면서 가격은 더 저렴해졌다.

GPT-4 터보는 한 질문에서 최대 12만8천개의 컨텍스트 토큰을 지원한다. GPT-4는 8천개 컨텍스트 토큰을 지원했는데, 한번에 이해할 수 있는 길이가 16배 늘어난 것이다. 이는 일반적인 책의 300페이지에 해당하는 양이다.

이와 함께 개발자가 모델의 응답과 출력을 더 제어할 수 있도록 했다. GPT-4 터보는 JSON 모드를 제공해, 모델이 유효한 JSON으로 응답하게 할 수 있다.

알트먼 CEO는 "개발자의 엄청난 요청이었다"라며 "이를 통해 API 호출이 훨씬 더 쉬워질 것"이라고 설명했다.

GPT-4 터보 모델은 함수 호출에도 훨씬 뛰어나 한번에 여러 기능을 호출할 수 있다. 일반적 지침을 더 잘 따르도록 '재현가능한 출력(reproducible outputs)'이란 기능도 소개됐다. 시드 매개변수를 주면 모델이 일관된 출력을 반환해 더 높은 수준의 결과를 얻을 수 있다. 이는 모델의 행동을 제어할 수 있게 한다. 이는 베타 기능으로 출시돼 현재 사용가능하다.

알트먼 CEO는 수주일 내 API에서 로그 문제를 볼 수 있는 기능도 출시할 예정이라고 밝혔다.

GPT-4 터보는 달리3, 비전, 새로운 텍스트음성변환(TTS) 모델을 API로 호출할 수 있게 됐다.

GPT-4 터보에서 달리3 API를 호출해 이미지와 디자인을 생성할 수 있다. 코카콜라, 셔터스톡, 스냅 등이 달리3로 고객 캠페인을 위한 이미지와 디자인을 프로그래밍 방식으로 생성했다고 알트먼 CEO는 소개했다.

GPT-4 터보는 이미지를 챗 컴플레션 API 입력으로 받아들이고 캡션, 분류, 분석, 그림응 포함한 문서 읽기 등의 작업을 할 수 있다. GPT-4 터보 비전 기능의 가격은 1080x1080 픽셀 이미지 당 0.00765 달러다.

또한, 새로운 TTS 모델은 사전설정된 6가지 음성 중 하나로 API의 텍스트를 자연스러운 오디오로 만들어준다. 실시간 사용 사례와 품질에 최적화돼 있다고 회사측은 설명했다. 가격은 입력 1천자 당 0.015달러부터 시작된다.

오픈AI는 오픈소스 음성 인식 모델인 위스퍼(Whisper) V3의 다음 버전을 곧 출시하고 API에 적용할 예정이라고 밝혔다. 새 버전은 여러 언어에서 향상된 성능을 제공한다.

■ GPT-4 파인튜닝, GPT 모델 커스터마이징

알트먼 CEO는 GPT-4 미세조정(fine tuning)의 실험 접근 프로그램을 시작한다고 밝혔다. 현재 미세조정 가능한 GPT 모델은 'GPT-3.5'다. GPT-3.5 미세조정은 16k 버전으로 확장될 예정이다.

그는 이어 GPT 모델을 직접 커스터마이징할 수 있는 프로그램도 발표했다.

그는 "API 미세조정은 비교적 적은 양의 데이터로 다양한 애플리케이션에서 더 나은 성능을 달성하기 위해 모델을 조정하는데 유용하지만 완전히 새로운 지식 영역을 학습하거나 많은 독점 데이터를 사용하기 위해 모델링을 원할 수도 있다"며 "그래서 커스텀 모델이란 새로운 프로그램을 출시한다"고 밝혔다.

커스텀모델은 최소 수십억개 토큰을 가진 대규모 데이터세트를 다뤄야 하는 조직을 위한 프로그램이다. 선택된 일부 조직만 이용 가능하다. 특정 도메인에 맞게 GPT-4를 학습시킬 수 있다. 추가 도메인별 사전교육 수행, 특정 도메인에 맞춘 사용자정의 강화학습(RL), 사후 교육 프로세스 실행 등 모델 교육의 모든 진행단계를 수정할 수 있다. 맞춤형 모델은 해당 조직만 독점적으로 접근할 수 있다. 커스텀모델은 타 고객에게 제공되거나 공유되지 않으며, 다뤄지는 데이터는 일반 GPT 모델의 학습에 사용되지 않는다.

알트먼 CEO는 "이 일은 많은 기업과 함께 시작할 수 없을 것"이라며 "많은 일을 해야 할 것이고, 기대에 부응하기 위해 적어도 처음엔 비용이 저렴하지 않을 것"이라고 말했다.

오픈AI는 기존 GPT-4 유료 고객의 분당 토큰을 두배로 늘렸다. API 계정 설정에서 직접 추가 비율 제한과 할당량에 대한 변경을 요청할 수 있다.

오픈AI는 자사 모델을 활용해 생성된 콘텐츠에 대한 저작권 보호에도 나서겠다고 밝혔다. 오픈AI는 '카피라이트 실드(Copyright Shield)'를 도입한다. 이용자가 저작권 침해 소송을 당할 경우 이에 직접 개입해 방어하고, 챗GPT 엔터프라이즈와 API에서 발생한 비용을 모두 지불한다.

이어 알트먼 CEO는 "오픈AI는 API나 챗GPT 엔터프라이즈의 데이터를 교육시키지 않는다는 점을 분명히 말씀드린다"고 강조했다.

■ GPT 토큰 가격 인하

GPT-4 터보의 프롬프트 토큰 가격은 GPT-4보다 3배 저렴하다. 출력 토큰은 2배 더 지급된다. 즉, 프롬프트 입력 토큰은 1천개당 1센트이며, 출력 토큰은 1천개당 3센트다. 알트먼 CEO는 "대부분의 고객은 혼합을 통해 3.75% 저렴하게 이용할 수 있다"고 설명했다.

GPT-3.5 터보 16k 비용은 입력 토큰은 3배 싸지고, 출력 토큰은 2배 싸진다. 미세조정된 GPT-3.5 16k 버전 실행 비용도 저렴해진다.

■ 사티아 나델라 "마이크로소프트는 오픈AI의 파트너면서 고객"

이어서 사티아 나델라 마이크로소프트 회장의 이름이 호명됐다. 사티아 나델라 회장의 인사 후 샘 알트먼은 그에게 "마이크로소프트는 파트너십을 어떻게 생각하냐"고 물었다.

이에 사티아 나델라 회장은 "처음으로 당신이 연락해 애저 크레딧이 있느냐고 말했던 때를 기억한다"며 "그리고 거기에서 만 길을 왔다"고 말했다.

샘 알트먼 오픈AI CEO(왼쪽)와 사티아 나델라 마이크로소프트 회장

나델라 회장은 "파트너십 관련해 첫번째는 워크로드로, 워크로드와 워크로드 패턴, 교육 작업은 동기식이고, 대규모이며, 데이터는 병렬인 정말 다르고 이상한 워크로드"라며 "전원부터 데이터센터, 랙, 가속기, 네트워크, 그리고 애저의 모양이 크게 변경됐고, 오픈AI에서 구축하는 모델을 지원하는 최고의 시스템을 구축하고 그 모든 것을 개발자에 제공하고 있다"고 밝혔다.

이어 "우리 자신이 개발자이고 제품을 만드는 회사이므로, 개발자로서 오픈AI API 위에 깃허브 코파일럿을 처음으로 구축했다"며 "API 지원을 통해 애저에서 최고의 인프라를 모두에게 제공하고, 애저 마켓플레이스 같은 것도 제공해 신속하게 제품을 구축해 시장에 춠시하게 한다"고 덧붙였다.

샘 알트먼은 다음 질문으로 파트너십과 AI의 미래에 대해 질문했다. 이에 나델라 회장은 "우리의 조합은 지구상 모든 사람과 조직이 더 많은 것을 성취할 수 있도록 역량을 부여한느 것이며, 궁극적으로 AI 역량을 강화하는 경우에만 유용할 것"이라며 "AI의 혜택을 모든 사람에게 널리 알리는 궁극적 목표와 함께, (AI의) 안전이 중요하고 나중에 관심을 갖지 않고 모두와 함께 매우 집중하고 있다"고 밝혔다.

■ 지피티스(GPTs), 노코드로 개인화 챗GPT 제작

다음으로 챗GPT의 개선 사항이 소개됐다. 챗GPT는 GPT-4 터보를 기반으로 작동하며, 모델 선택을 위해 드롭다운 메뉴를 클릭할 필요가 없어졌다.

오픈AI는 일반 사용자도 쉽게 자신만의 챗GPT를 만들 수 있는 'GPTs'를 발표했다. GPTs는 회사 내부용도나 일반 대중을 위해 만들어질 수 있다. 대화 시작, 지침과 추가 지식 제공, 웹 검색, 이미지 만들기, 데이터 분석 등 작업을 개인화할 수 있다. 캔바(Canva), 자피어(Zapier) AI 등의 예제가 공개됐다.

GPTs 예시

GPTs는 고급 챗GPT 이용자의 맞춤형 기본 설정 지정, 제작된 프롬프트와 지침 세트 목록 유지관리, 챗GPT로 수동 복사 등을 모두 대신해준다. 코드 작성도 필요없다 자연어로 GPTs를 프로그래밍할 수 있다. 샘 알트먼은 직접 GPTs를 이용해 '스타트업 멘토링' 챗GPT를 즉석에서 만들었다. GPT 빌더에게 스타트업 창업자와 개발자에게 조언을 제공할 수 있는 것을 만들고 싶다고 입력하면 GPT가 이를 실제 챗봇으로 만들어준다. 알트먼은 자세한 지침을 작성해 입력했고, 만드는 서비스의 이름을 추천받았다. 화면 오른쪽의 미리보기 모드에서 만들어지는 서비스를 보면서다. 구성 탭에서 스타트업 대상 강의 원고 파일을 업로드해 GPT-4 터보의 배경지식과 알트먼의 지식을 기반으로 답변하게 했다. 그렇게 시제품이 만들어지는데 5분밖에 걸리지 않았다.

사용자는 GPTs로 만들어낸 자신만의 챗GPT를 타인에게 판매하거나 공유할 수 있다. 오픈AI는 이달말 GPT스토어를 열어 GPTs를 거래할 수 있게 한다고 밝혔다. 단, 오픈AI와 개발자 간의 구체적 수익공유 모델은 밝히지 않았다.

어시트턴트 플레이그라운드에서 ' 어시스턴트 API' 이용 모습

다음으로 '어시스턴트 API'가 소개됐다. 어시스턴트 API는 일반 애플리케이션에 가상 에이전트를 만들어 붙일 수 있게 한다. 영구적 스레드, 리트라이벌, 코드 해석기, 함수 호출 등을 포함한다. 자연어 기반 데이터 분석 앱, 코딩 도우미, AI 기반 휴가 플래너, 음성 제어 DJ 등이 사용 사례로 소개됐다. 지속적이고 무한한 긴 스레드와 메시지를 어시트턴트 API로 통합할 수 있다.

코드 해석기는 샌드박스 실행환경에서 파이썬 코드를 작성하고 실행하며, 그래프와 차트를 생성한다. 다양한 데이터와 서식을 포함한 파일을 처리할 수 있다. 독점 도메인 데이터, 제품 정보, 사용자 제공 문서 등으로 어시스턴트를 강화하도록 검색을 제공한다. 사용자 정의 함수를 호출해 메시지에 응답을 통합할 수 있다. 어시스턴트 플레이그라운드에서 코드 작성 없이 어시스턴트 API 베타를 사용해볼 수 있다.

관련기사

샘 알트먼은 기조연설을 마무리하며 "AI가 기술적, 사회적 혁명이며 여러 방식으로 세상을 변화시킬 것이라고 믿는다"며 "우리는 더 많은 것을 할 수 있고, 더 많이 창조하고, 더 많이 가질 수 있다"고 말했다.

그는 "지능이 모든 곳에 통합되면 우리 모두 필요에 따라 초능력을 갖게 될 것"이라고 강조했다.