구글번역 'dog' 19번치면 최후의 심판 시간 나와

기계번역 전문가 "소수언어, 성경으로 학습시킨 듯"

인터넷입력 :2018/07/23 17:14

구글 번역기에 마오리어로 설정, 'dog'를 19번 입력하고 한국어 등의 언어로 번역하면 종교적인 문장이 나타나는 괴현상이 발견됐다.

번역 결과는 다음과 같다. '최후 심판의 시간은 12시 3 분입니다. 우리는 세계의 인물과 극적인 변화를 경험하고 있습니다. 이는 우리가 끝 시간과 예수님의 재림에 점점 더 다가가고 있음을 나타냅니다.' 마오리족은 뉴질랜드 원주민으로 해신, 삼림신 등 다신교를 믿고 있다.

21일(현지시간) 과학 블로그 마더보드에 따르면 최근 미국 최대 온라인 커뮤니티 레딧의 '번역 게이트' 카테고리에는 구글의 이상한 번역 결과를 공유하는 글들이 지속적으로 올라오고 있다.

소말리아어로 'ag'를 21번 입력하면 '그 결과 게르손 자손의 지파 회원 수는 백 오십 만 명이었습니다'로 번역된다. ag를 10회 입력하면 '그 길이는 한 편에 백 규빗이요'라는 문장이 나온다. 규빗은 성서에 등장하는 히브리인들이 사용하는 길이 단위다.

위 번역은 영어나 프랑스어 등 다른 외국어로 번역해도 언어만 다를 뿐, 같은 내용으로 번역된다.

레딧 이용자들은 구글이 회원들의 이메일이나 개인적인 메시지를 수집해 구글 번역에 활용하면서 이상한 번역 결과를 내놓는 것 아니냐고 추측하고 있다. 혹은 구글 직원이나 일반 구글 이용자들이 '수정 제안'을 눌러 악의적으로 편집할 가능성도 제기했다.

이에 마더보드 측이 구글에 괴이한 번역 결과에 대해 문의하자 구글 측은 "구글 번역 학습시 웹 상의 번역 결과 샘플들을 바탕으로 배우지만, 개인의 메시지를 갖고 배우진 않는다"며 "말도 안되는 소리를 입력하니 이상한 번역 결과가 나오는 것"이라고 답했다.

마더보드는 기계 번역 관련 컴퓨터 연구 업체 BBN 테크놀로지스의 션 콜바스 수석 과학자의 말을 인용 "구글 번역 알고리즘이 혼돈 속에서 질서를 찾는 과정에서 이상한 결과물을 내놓을 수 있다"며 "영어나 중국어와 같이 넓은 영역에서 번역 샘플을 얻을 수 있는 것과 달리 마오리어나 하와이어, 소말리아어의 경우 구글이 많은 언어로 번역된 성경과 같은 종교적인 문서들을 기계 번역에 학습시켰을 수 있다"고 설명했다.

관련기사

실제로 소말리아어와 관련된 몇몇 기괴한 번역들은 신약성서의 특정 구절과 유사하다. 게르손의 아들과 관련한 부분은 민수기 3:18, 길이가 백 규빗이요라는 문장은 출애굽기 27:18 등과 관련 있다.

구글 측은 구글 번역 학습에 성경과 같은 종교적인 문서를 활용하는지 밝히지 않았다.