챗GPT와 말로 대화하고, 사진을 올려 답변을 받아낼 수 있게 된다.
오픈AI는 25일(현지시간) 챗GPT의 인터페이스에 음성과 이미지 업로드를 추가한다고 발표했다.
오픈AI는 새로운 챗GPT 인터페이스를 2주일 내 유료 가입자에게 제공하고, 향후 모든 사용자에게 제공할 계획이라고 밝혔다.
챗GPT는 채팅 창 대화로 생성 AI의 대중화를 열었다. 이제 버튼을 눌러 질문을 말하면, 챗GPT가 이를 문자로 변환해 답변을 생성한 뒤 다시 음성으로 변환해 들려준다.
음성 입력을 시작하려면 모바일 앱에서 '설정'의 '새로운 기능'에 들어가 음성 대화를 선택한다. 홈화면 오른쪽 상단의 헤드폰 버튼을 누르고 5가지 음성 중 하나를 선택하면 된다.
이는 음성-텍스트 변환 작업에 특화된 음성 인식 AI 모델인 오픈AI '위스퍼(Whisper)'에 기반한다. 오픈AI는 전문 성우와 협력해 개성있는 목소리를 생성했다. 몇초의 샘플 음성으로 사람과 유사한 소리를 만들 수 있다. 오픈AI는 스포티파이와 협력해 팟캐스트 진행자의 목소리를 다른 언어로 번역하는 작업을 진행중이다.
이미지 대화 기능은 여행 중 랜드마크 사진을 찍어 올리면, 챗GPT가 흥미로운 부분을 알려준다. 냉장고 사진을 찍어 올리면 식사 메뉴를 추천해준다. 이후 조리법을 질문해 레시피를 받을 수 있다. 복잡한 그래프를 분석할 수 있고, 모바일 앱에서 이미지 특정 부분에 초점을 맞춰 표시하면 해당 부분으로 대화를 집중시킬 수 있다.
관련기사
- 오픈AI, 이미지 생성 AI '달리 3' 공개2023.09.21
- 샘 알트먼 "GPT 모델 개발, 아직 안 끝났다"2023.09.14
- 오픈AI, 11월 첫 개발자 컨퍼런스 연다2023.09.07
- 오픈AI, '생성AI' 기업 시장으로 진격2023.08.29
이미지 기능을 이용하려면 사진 버튼을 탭해 이미지를 캡처하거나 선택하면 된다. iOS나 안드로이드 모바일 앱의 경우 더하기 버튼을 눌러 이미지를 올릴 수 있다.
오픈AI 측은 "우리의 목표는 안전하고 유익한 AGI 구축"이라며 "도구를 점진적으로 제공함으로써 시간이 지남에 따라 개선하고 위험을 완하면서 모든 사람이 미래에 더욱 강력한 시스템에 대비할 수 있을 것"이라고 강조했다.