"수학 가르치고 실시간 통역까지"…오픈AI, 새 챗봇 'GPT-4o' 출시

구글 연례 컨퍼런스 하루 앞두고 발표…"음성 기능은 조만간 공개"

컴퓨팅입력 :2024/05/14 08:03    수정: 2024/05/14 15:00

오픈AI가 새로운 인공지능(AI) 챗봇을 출시했다. 사람처럼 말하고 보고 들을 수 있다. 수학 문제도 풀어주고, 실시간 통역까지 할 수 있다. PC뿐 아니라 모바일로도 이용할 수 있다. 

13일(현지시간) 오픈AI는 온라인 행사 '스프링 업데이트'를 통해 AI 챗봇 'GPT-4o'를 시연했다. 지난해 11월 GPT-4터보 출시 6개월 만이다. 현재 무료 버전과 유료 버전으로 이용 가능하다. 유료 버전이 무료 버전보다 한번에 입력 가능한 정보량이 5배 더 많다.

사용자는 GPT-4o를 PC뿐 아니라 모바일로도 이용할 수 있다. 문자뿐 아니라 음성으로 실시간 대화를 할 수 있다. 이 모델은 사용자 억양이나 말투를 분석할 수 있다. 

엔지니어가 직접 시연하는 장면. (사진=오픈AI)

이를 통해 사용자가 어떤 기분인지, 어떤 상태인지 파악할 수 있다. 실시간 이미지를 인식도 가능하다. 챗봇 이름에 '모든 것'을 뜻하는 '옴니(Omni)'의 'o'가 들어간 이유다. 이날 발표를 맡은 오픈AI 미라 무라티 최고기술책임자(CTO)는 "GPT-4o는 텍스트, 이미지, 소리를 종합적으로 분석하고 처리할 수 있다"고 설명했다.  

시연도 직접 선보였다. 오픈AI 엔지니어가 모바일을 통해 GPT-4o와 대화하는 장면을 보여줬다. 엔지니어가 "오늘 발표 때문에 긴장했는데 어떡하지"라고 묻자, 이 모델은 "심호흡은 긴장 완화를 돕는다"고 대답했다. 사용자가 핸드폰에 대고 숨을 거칠게 쉬었다. 그러자 챗봇은 "그런 행동은 긴장 완화를 도울 수 없다"며 "천천히 숨을 내쉬고 뱉어야 한다"고 답했다. 

다른 시연자는 챗봇에게 "불면증을 앓고 있다. 잠 잘 오는 이야기를 해달라"고 말했다. 그러자 GPT-4o는 관련 이야기를 사용자에 들려줬다. 이때 챗봇은 다양한 톤으로 이야기를 진행할 수 있었다. 일반 로봇 같은 소리부터 선생님이 아이들에게 이야기를 들려주는 듯한 목소리까지 낼 수 있었다. 

챗봇의 이미지 분석 기능도 직접 시연했다. 엔지니어가 휴대전화 카메라로 종이를 비춘 후 '3x+1=4'라는 문제를 직접 썼다. GPT-4o는 이 문제 푸는 방법을 음성으로 설명했다. 그래프를 보여주자 챗봇은 해당 그래프에 대한 해설도 실시간으로 진행했다. 

해당 챗봇은 50개국 언어를 실시간으로 통역할 수도 있다. 오픈AI는 이에 대한 시연도 선보였다. 미라 무라티 CTO는 이탈리아계 미국인이다. 그가 이탈리아어로 말하고, 다른 엔지니어는 영어로 대화했다. 둘 다 GPT-4o 실시간 통역 기능을 활용했다. 엔지니어는 "실시간으로 매우 빠르게 통역이 진행된다"며 "무리 없이 대화할 수 있었다"고 소감을 밝히기도 했다. 

오픈AI 측은 GPT-4o의 평균 응답 시간이 평균 320밀리초(1천분의 1초)라고 설명했다. 보통 사람이 대화할 때 반응하는 속도와 비슷하다. 기존 GPT-3.5는 2.8초, GPT-4는 5.4초였다. 

관련기사

이 회사는 구글 연례 컨퍼런스 'I/O'를 하루 앞두고 해당 제품을 발표했다. 일각에선 오픈AI가 생성형 AI 경쟁에서 구글을 향한 공격에 나선 것이라고 평가하고 있다. GPT-4o 사용자가 급증하면, 구글 엄색 엔진이 더 위협받을 것이란 분석도 나왔다. 

구글은 "이번 행사를 통해 기존보다 업그레이드된 생성형 AI 모델을 내놓겠다"고 밝힌 바 있다.