오픈AI 초거대 멀티모달 ‘GPT-4' 공개..."오류·편향성 줄였다"

텍스트·이미지 이해...챗GPT플러스 고객 우선 사용

컴퓨팅입력 :2023/03/15 07:32    수정: 2023/03/15 08:35

오픈AI가 초거대 인공지능(AI) 모델 'GPT-4' 버전을 공개했다. 텍스트와 이미지를 이해할 수 있는 멀티모달 모델이다. 

샘 알트먼 오픈AI 최고경영자는 "GPT-4가 이전 모델보다 더 창의적이고, 오류를 덜 내며 덜 편향적이다"고 공식 블로그를 통해 14일(현지시간) 밝혔다.

이번 모델은 문자와 텍스트를 입력으로 받아들이고 이해할 수 있다. 생성은 문자로만 한다. 문자만 이해, 생성했던 GPT-3.5 모델과 다른 점이다. 

오픈AI가 멀티모달 GPT-4를 공개했다. (사진=오픈AI)

샘 알트먼 CEO는 "이번 버전은 멀티모달 기능으로 인해 기존보다 더 다양한 프롬프트를 이해할 수 있다"며 "전보다 창의성 높은 결과물을 만든다"고 밝혔다. 

예를 들어 사용자가 곰팡이 핀 피자 사진을 입력하고 "피자 맛있겠지?"라고 GPT-4에 물어보면 "곰팡이 있는 피자는 건강에 해롭습니다"라는 반응을 얻을 수 있다. 이번 모델은 단순히 문자나 이미지를 받아들이는 것보다 사람처럼 완전히 이해할 수 있어서다. 벤처비트는 GPT-4 멀티모달 기능을 활용해 창의성 있는 여러 과제를 수행할 수 있을 것이라고 14일(현지시간) 보도했다.

오픈AI는 GPT-3.5 버전에서 생긴 문제점도 개선했다. 기존 언어 모델은 인터넷에서 수집한 데이터로 학습했다. 이를 통해 사용자 질문에 대한 답을 찾아 제공했다. 정답보다는 문맥상 가장 답과 유사한 정보를 끌어와 답했다. 결과적으로 틀린 답도 맞는 것처럼 대답하는 '환각 현상'이 발생했다.

블로그 내용에 따르면 GPT-4는 의료 등 전문적인 질문에 대해 이전보다 29% 더 정확한 답을 제공할 수 있다. 또 비윤리적인 질문에 응답할 가능성을 82% 더 줄었다. 오픈AI는 "약점을 일부 개선했지만 완전히 제거하지는 못했다"고 했다.

이번 버전은 대용량 텍스트도 처리할 수 있다. 블로그 내용에 따르면 GPT-4는 영어 기준 2만 단어 이상을 한번에 기억하고 이해할 수 있다. 영어 기준으로 2만 단어는 A4용지 약 5장 넘는 분량이다. 이전보다 문맥을 더 잘 이해할 수 있다는 의미다.

관련기사

오픈AI는 이 멀티모달 버전을 챗GPT플러스 이용자들에게 우선 개방할 방침이다. 현재 매달 20달러(약 2만5천원)를 내고 챗GPT를 활용하는 이용자들은 새 버전을 쓸 수 있다. 개발자는 대기자 명단 접수를 통해 API를 받을 수 있다.

마이크로소프트는 공식 블로그를 통해 GPT-4의 출시를 축하했다. 오픈AI가 GPT-4 버전을 개발함에 따라, 검색엔진 빙에도 이를 탑재할 것이라 전했다.