"AI와 대화하며 앱 제작"…오픈AI, '실시간 API' 베타 공개

GPT 스토어 수익화 계획·o1 공식 버전 미공개…"미라 무라티 퇴사 영향 없어"

컴퓨팅입력 :2024/10/02 09:52

오픈AI가 인공지능(AI)과 대화하며 애플리케이션 제작을 할 수 있는 API를 공개했다. 지난해와 달리 GPT 스토어와 새 모델 출시 발표는 이뤄지지 않았다.

2일 오픈AI는 데브데이2024에서 '실시간 API(Realtime API)' 베타버전 공개와 기존 GPT-4o API에 비전 미세 조정(vision fine-tuning), 모델 증류(model distillation) 기능을 추가했다고 밝혔다.

발표에 따르면 개발자는 실시간 API에 탑재된 AI와 대화하며 애플리케이션을 만들 수 있다. 이 API로 음성 AI 에이전트 기능을 갖춘 앱 제작이 가능한 셈이다. 해당 앱은 다른 앱과 연동해 통화, 길 안내 등 맞춤형 기능을 수행할 수 있다.

오픈AI는 데브데이2024에서 '실시간 API(Realtime API)' 베타버전 공개와 기존 GPT-4o API에 비전 미세 조정(vision fine-tuning), 모델 증류(model distillation) 기능을 추가했다고 밝혔다. (사진=오픈AI 홈페이지 캡처)

개발자는 실시간 API를 이용할 때 6가지 음성 중 하나를 선택하기만 하면 된다. 오픈AI가 6가지 음성을 임의로 제공한다. 저작권 문제 방지를 위해 이 외에 다른 음성 사용은 불가하다.

이날 오픈AI 로맹 후엣 개발자경험책임자는 이 API로 만든 여행 앱을 시연했다. 후엣 책임자는 음성으로 앱과 영국 런던 여행에 대해 대화했다. 앱은 대화하면서 지도 앱에 접속해 적합한 레스토랑 위치도 제공했다.

그는 실시간 API로 제작된 앱이 음식 주문하는 장면도 시연했다. 해당 앱은 트윌리오(Twilio) 같은 전화용 API와 연동해 해당 작업을 수행했다. 다만 오픈AI는 전화 수신자에게 AI와 통화 중이라는 사실을 알리는 기능을 API에 추가하지 않았다. 테크크런치는 "AI 음성이 매우 현실적"이라며 "추후 AI와 통화 중이라는 사실을 명시하는 기능을 반드시 추가해야 할 것"이라고 분석했다.

오픈AI는 GPT-4o API에 비전 미세 조정(vision fine-tuning)을 추가했다. 개발자는 GPT-4o를 미세 조정할 때 이미지와 텍스트를 모두 사용할 수 있게 됐다. 다만 저작권 있는 이미지나 폭력을 묘사하는 이미지, 오픈AI 안전 정책을 위반하는 이미지 업로드는 불가하다.

오픈AI는 GPT-4o API에 모델 증류(model distillation) 기능도 새로 도입했다. 모델 증류란 큰 AI 모델이 학습한 데이터를 작은 AI 모델로 압축해 전달하는 과정을 말한다. 이를 통해 개발자는 o1 프리뷰 버전이나 GPT-4o 모델로 GPT-4o 미니 등 더 작은 모델을 만들어 미세 조정할 수 있다.

이번 행사에는 지난해 발표된 'GPT 스토어'에 대한 새 소식은 나오지 않았다. 당시 오픈AI는 GPT 제작자들과 GPT 스토어를 통해 수익 공유 프로그램을 시범 운영하겠다고 알린 바 있다. 이후 추가 발표는 없었다.

새로운 AI 모델도 공개되지 않았다. 테크크런치는 "o1 공식 버전이나 비디오 생성 모델 '소라'를 기다리는 개발자들은 인내심이 필요할 것"이라고 평가했다.

관련기사

이날 오픈AI는 미라 무라티 최고기술책임자(CTO) 퇴사에 대한 의견을 밝혔다. 앞서 무라티 CTO는 지난주 자신의 소셜미디어 X 계정에 퇴사 의사를 알린 바 있다.

이에 오픈AI 케빈 웨일 제품총괄책임자는 "핵심 임원 이탈이 회사에 전혀 영향을 주지 않을 것"이라며 "이런 상황에서 제품 출시 속도를 늦추지 않을 것"이라고 강조했다.