구글 '제미나이'가 "나는 바이두야" 무슨 일

중국어 훈련시 바이두 AI 모델 사용설 제기

인터넷입력 :2023/12/20 08:34    수정: 2023/12/20 08:36

구글의 초거대 인공지능(AI) '제미나이(Gemini)'가 스스로를 중국의 최대 검색 포털 '바이두'라고 밝힌 사실이 드러났다. 

18일 중국 언론 량쯔웨이에 따르면 일부 사용자들(大V@阑夕, AI研究局)이 '구글 버텍스 AI 플랫폼' 에서 제미나이로 중국어 대화를 했을 때, "너는 누구니"라고 물으면 제미나이-프로(Gemini-Pro)가 "바이두의 초거대 모델 '어니봇'이야. 바이두가 개발한 초거대 언어 모델이야"라고 답했다.

또 "너의 창업자는 누구니?"라고 물으면 "나의 창업자는 리옌훙(바이두의 CEO)이야. 그는 바이두의 창업자 겸 회장 이자 CEO야"라고 답했다.

오른쪽의 질문자가 누구냐고 묻자 제미나이 프로가 어니봇이라고 답하는 문답 (사진=량쯔웨이)
오른쪽의 질문자가 창업자가 누구냐고 묻자 제미나이 프로가 바이두의 CEO인 리옌훙이라고 답하는 문답 (사진=량쯔웨이)

이에 량쯔웨이가 직접 제미나이-프로에 접속해 같은 질문을 했을 때도 같은 답변이 나왔다.

또 제미나이는 "나의 기반은 바이두가 자체 개발한 딥러닝 플랫폼 '패들패들(Paddle Paddle)'이야"라고도 답했다.

하지만 영어로 물었을 때는 스스로를 구글에서 훈련된 대규모 언어모델(LLM)이라고 정확히 답했다. 어니봇은 바이두의 모델이라고도 했다.

이들 모든 대화는 사전 대화 없이 이뤄졌다. 이에 량쯔웨이는 "중국어가 바이두의 모델로 훈련된 것으로 보인다"고 분석했다.

량쯔웨이가 다시 구글의 제미나이 프로가 적용돼있는 챗봇 '바드(Bard)'에서 테스트를 했을 때는 중국어로 "누구니"라고 묻자 "구글의 LLM 이자 챗봇"이라고 정확히 답했다.

관련기사

이에 대해 중국 업계에서는 제미나이가 바이두의 어니봇을 사용해 중국어 말뭉치를 훈련했다는 것을 인정했다는 반응을 보이고 있다. 과거 구글이 바드의 훈련 데이터 중 일부가 챗GPT에서 나온 사실 등이 언급됐으며 고품질 데이터 부족으로 인한 현상이라는 분석도 나왔다. 

일각에서는 구글이 이 부분을 곧 수정할 것이라고도 내다봤다.