'제미나이' 영상 봤더니…"논리-추론 탁월, GPT-4 능가는 글쎄?"

멀티모달 인식·추론 뛰어나…출시 후 기능 지켜봐야

컴퓨팅입력 :2023/12/07 14:41    수정: 2023/12/07 14:44

구글이 6일(현지시간) 새 범용 인공지능(AI) 모델 '제미나이'를 공개하면서 시연 영상도 함께 내놨다. 

제미나이는 문자뿐 아니라 음성, 이미지, 영상을 능숙하게 이해·생성할 수 있다는 평가를 받고 있다. 사람이 풀기 어려운 추론 문제도 단숨에 해결할 수 있는 것으로 알려졌다. 

시연 영상을 직접 확인해 봤다. 이 영상은 구글이 직접 제미나이와 대화하면서 기능을 시연한 콘텐츠다. 사용자가 제미나이에게 문자로 물어보면, 제미나이가 문자와 음성으로 동시에 답하는 식이다. 

영상 속 제미나이는 문자뿐 아니라 음성, 이미지, 영상 처리에서도 수준급 능력을 보여줬다. 추론 능력도 상당했다.

구글이 제미나이 시연 영상을 공개했다. 사진 속 인물은 순다르 피차이 구글 최고경영자. (사진=구글)

다만 제미나이가 실제로도 뛰어난 성능을 갖췄는지 지켜볼 필요가 있다. 제미나이가 정식 출시되지는 않았기 때문이다. 외신에 따르면, 구글은 아직도 제미나이 기능을 테스트하고 있다. 시연 영상 속 제미나이도 녹화본이다. 영상 속 모든 능력을 무조건적으로 믿기엔 무리다.

영상 속 제미나이, 이해력·창의력 모두 높아

영상 속 사람은 탁자 위에 종이를 두고 그림을 그렸다. 그후 제미나이와 자연스러운 대화를 시도했다. 사람이 테이블 위에 포스트잇을 올려놓고 "뭐가 보이는지 말해줄래?" 라고 물었다. 그랬더니 제미나이는 "테이블 위에 종이를 올려놨네요"라고 답했다. 

사용자가 종이에 여러 곡선을 그려봤다. 이를 본 제미나이는 "윤곽선이 부드럽게 물 흐르듯 그려져 있다"며 "그림에 뾰족한 각이나 삐죽삐죽한 가장자리도 없네요"라고 말했다. 사용자가 여기에 발을 그리자, 제미나이는 "이 그림은 마치 오리처럼 보여요"라고 추측했다. 

제미나이는 여러 곡선에 대한 변화 등 이미지 인식을 정확히 했다. (사진=구글 영상)

분명 사람 눈에도 오리 모양 같았다. 마지막으로 사용자가 배경에 물결 무늬를 그려봤다. 그랬더니 제미나이는 "오리가 물에서 헤엄치는 모습 같아요"라 답했다. 그후 바로 오리에 대한 정보를 알려줬다. 

제미나이는 장난감 성분에 대한 추측도 할 수 있었다. (사진=구글 영상)

사용자는 파란색 오리 미니어쳐 장난감을 내밀었다. 제미나이는 "손에 파란색 오리를 들고 나오셨네요"라며 "재질을 보아하니 물보다 밀도 낮은 재료로 이뤄졌네요"라고 덧붙였다. 그후 오리라는 단어를 중국어, 일본어 등 각국 언어로 표현하기도 했다. 

제미나이 창의력도 테스트했다. 오리를 세계 지도 그림 위에 올려놓았다. 그후 바다 한 가운데 오리를 뒀다. 

해양 한 가운데에 있는 오리를 인식하고 응답하는 제미나이. (사진=구글 영상)

제미나이는 이를 보고 깜짝 놀라며 "이 장소는 오리 먹이나 쉼터를 갖고 있지 않다"며 "오리가 안전하게 서식할 수 있는 장소에 두세요"라고 했다. 사용자는 지도 그림과 오리만을 가지고 새로운 게임 아이디어를 만들어 달라고 제미나이에게 지시했다. 

오리와 지도만 가지고 새로운 게임을 구상한 제미나이. (사진=구글 영상)

제미나이는 '국가 맞히기' 게임을 제안했다. 그후 코알라, 캥거루 이모티콘을 보여주면서 사용자에게 관련 국가를 맞혀보라고 게임을 바로 시작했다. 

사람만큼 논리적이고 추론력 높아

구글은 이보다 한단계 더 심화된 테스트도 했다. 추론과 시각적 능력을 실험하는 시연이다. 사용자는 컵을 세개 보여준 뒤, 이중 한 곳에 종이 공을 뒀다. 컵을 이리저리 섞은 후 "어느 컵에 종이공이 있을까?"라고 제미나이에게 물었다. 제미나이는 "가장 왼쪽 컵"이라며 정답을 맞혔다.

제미나이는 가장 왼쪽 컵에 종이 공이 있다고 했다. 정답이다. (사진=구글 영상)

마찬가지로 사용자는 손바닥 중 한 곳에 동전을 두고 이리저리 뒤섞었다. 제미나이에게 동전 위치를 또 물어봤다. 이번에 제미나이는 동전 위치를 맞히지 못했다. 

답을 맞히지 못하자 "내가 속았다"고 추론하는 제미나이. (사진=구글 영상)

그랬더니 "당신 방금 손기술을 사용해서 날 속였네요"라고 새로운 추론을 통해 답했다. 이 외에도 비슷하게 생긴 음식 두개를 두고 설명해보라고 하자, 전혀 헷갈리지 않고 음식 종류와 이에 대한 정보를 모두 정확히 설명했다. 

방향 감각까지 갖춘 제미나이. (사진=구글 영상)

이번엔 사용자가 오리 장난감 양쪽에 오리 그림과 곰 그림을 그려놨다. 제미나이에게 "어느 방향으로 오리가 가야 하지?"라고 물었다. 제미니는 "왼쪽으로 가면 친구 오리가 나온다"고 답했다. 또 "오른쪽으로 가면 천적인 곰이 나온다"고 답했다. 그는 "천적보다는 친구를 만나는 게 낫다"며 "오리는 왼쪽으로 가야한다"고 논리적으로 답했다.

과학 지식에도 꽤 정통했다. 사용자가 태양, 토성, 지구 그림을 나란히 뒀다. 그후 "이게 맞는 순서야"라고만 물었다. 그림에 대한 어떠한 설명도 없었다. 

그림만 보고 올바른 태양계 순서를 맞혔다. (사진=구글 영상)

제미나이는 해당 그림을 인식한 후 "아니다"고 답하며 "올바른 태양계 순서는 태양, 지구, 토성이다"고 답했다. 

제미나이는 더 재미있는 놀이 기구를 고른 후 이에 대한 이유도 답했다. (사진=구글 영상)

놀이 기구 사진 두개를 제시하면서 "어느쪽이 더 재밌어 보여?"라고 물었더니, 제미나이는 "루프가 있는 오른쪽 놀이기구가 더 재밌을 것 같아요"라고 답했다.

제미나이는 악기 소리를 생성하고, 이에 어울리는 음악도 만들 수 있다. (사진=구글 영상)

제미나이는 주변 이미지를 인식하고 이에 맞는 음악도 생성할 수 있다. 사용자가 일렉트로닉 기타를그렸더니, 제미나이는 일렉트로닉 기타 소리를 바로 생성했다. 사용자가 "일렉트노릭 기타로 연주할 수 있는 음원을 만들어 줘"라고 하자 관련 음악을 추천하기도 했다. 

제미나이, 바드에 세상 보는 '눈' 달아줘

현재 구글 AI 챗봇 바드에 제미나이 프로가 적용된 상태다. 바드는 프로 버전을 통해 이미지를 인식할 수 있다. 한국을 포함한 170개 국가에서 영어 버전으로 제공되고 있다. 구글은 제미나이 프로가 바드에서 텍스트 기반으로만 작동한다고 했다. 기존보다 답변 정리, 정보 품질, 높은 추론 등을 생성할 수 있다고 했다. 

이를 직접 시연하는 영상도 나왔다. 영상 속 사용자는 바드에게 "전 세계에서 가장 성능 좋은 종이 비행기 만드는 법 알려줘"라고 물었다. 바드는 정보를 조합해 종이로 ▲글라이더 ▲초음속 여객기 ▲전투용 비행기 만드는 법을 각각 소개했다. 여기까지는 기존 바드와 똑같다. 

바드는 제미나이 프로를 이용해 이미지를 정확히 인식할 수 있다. (사진=구글 영상)

사용자가 종이비행기 세 종류를 다 만든 후 사진을 찍어서 바드에 보여줬다. 그 후 바드에게 "어떤 비행기가 가장 잘 만들어진 것 같아?"라고 물어봤다. 그랬더니 바드는 "초음속 여객기가 실제 비행체와 가장 비슷한 모습"이라고 답했다. 사용자가 모든 비행기를 다 날려보니, 바드가 골랐던 초음속 여객기가 가장 잘 날았다.  

바드는 종이비행기 디자인 조언도 했다. (사진=구글 영상)

바드는 해당 종이비행기가 더 잘 날기 위한 팁도 줬다. 사용자가 초음속 여객기 모형을 찍어서 올리자, 바드는 "날개가 너무 작아요" "꼬리 부분이 작아서 기체 통제가 어려울 수 있어요" 등 디자인 보충 설명을 진행했다. 이러한 기능은 바드에 탑재된 제미나이 프로와 연동해 할 수 있는 역할이다.

구글은 내년 바드에 문자 생성뿐 아니라 이미지, 음성, 영상 생성 제공 기능을 탑재하겠다는 계획도 알렸다.

제미나이 울트라만 내년 출시…왜?

제미나이는 총 세 가지 버전으로 이뤄졌다. 구글이 가장 자신 있게 내세운 '제미나이 울트라'와 그 하위 버전 '제미나이 프로'와 '제미나이 나노'다. 

구글은 제미나이 울트라가 "AI 역사상 가장 뛰어난 추론 능력을 갖췄다"고 극찬했다. 인간 전문가뿐 아니라 오픈AI의 GPT-4를 능가할 수 있다고 자신했다. 

제미나이가 정말 GPT-4를 능가하는 등 AI 역사상 가장 뛰어난 모델이 될 수 있을지는 미지수다. 우선 구글이 앞세워 극찬한 제미나이 울트라 버전은 내년 초 출시 예정이다. 현재 제미나이 프로와 제미나이 나노만 공개된 상태다. 아직 아무도 제미나이 울트라 실제 성능을 측정할 수 없다. 

구글이 제미나이를 공개했다. (사진=구글)

물론 제미나이 울트라가 추론 능력 테스트인 대규모 다중 작업 언어이해(MMLU)에서 90.04점을 기록하긴 했다. 오픈AI의 GPT-4는 86.4점을 받았다. 이 테스트만을 가지고 제미나이 울트라가 GPT-4보다 더 높은 성능을 보인다고 장담할 수는 없다.

관련기사

이에 뉴욕타임스 등 주요 외신도 같은 입장이다. 뉴욕타임스는 울트라 버전 출시 연기에 대해 "제미나이 울트라가 다른 생성형 AI처럼 실수를 저지르기 쉬운 상태일 수 있다"며 "명령어를 완벽하게 이해하지 못하고, 잘못된 답변을 생성할 수 있다"고 분석했다.

앞서 구글 내부 관계자는 뉴욕타임스에 제미나이 모델 제품군 출시를 내년 초로 미룰 계획이라고 귀띔한 바 있다. 제미나이가 최종 테스트 과정에서 사용자 명령어에 제대로 대답하지 못하거나, 비영어권 언어를 이해하지 못하는 실수를 지속적으로 보였다고 구글 내부 관계자는 당시 상황을 알리기도 했다. 보다 정확한 제미나이 성능은 울트라 버전 출시 후 정확히 알 수 있을 전망이다.