구글이 1천개 언어를 이해, 생성할 수 있는 인공지능(AI) 언어 모델을 개발 중이다.
미국 IT매체 더버지는 7일 구글이 '유니버셜 스피치 모델(USM)'이라는 AI 언어 모델을 구축하고 있다고 보도했다. 외신에 따르면 USM은 문자뿐 아니라 음성까지 이해할 수 있다.
구글은 지난해 11월 세계에서 가장 많이 사용되는 1천개 언어를 이해, 생성하는 AI 모델을 만들 계획을 발표한 바 있다. 연구 중이던 USM 모델도 공개했다.
당시 USM은 300개 이상 언어에서 28억개 문장과 1천200만 시간을 웃도는 음성을 학습한 상태였다. 파라미터도 20억개에 이른다.
관련기사
- '개인정보 불법 수집' 메타·구글, 개인정보위에 행정소송2023.03.06
- 셀바스AI, 'AI 디지털교과서' 사업 본격화2023.03.06
- 한국어 질문도 찰떡같이 알아듣는 챗GPT 나왔다2023.03.06
- 마이크로소프트 "챗GPT로 로봇 조종할 수 있다"2023.03.06
현재 USM은 유튜브에 우선 적용된 상태다. 자동 자막 생성과 자동 음성 인식 기능을 지원한다. 해당 모델은 유튜브에서 영어, 중국어, 암흐하라어, 세부아노어 등을 포함해 100개 이상 언어를 자동으로 감지하고 번역한다.
구글은 USM 언어 데이터셋과 파라미터를 꾸준히 키우는 중이다. 구글 측은 "현재 USM이 300개 넘는 언어를 문제 없이 지원하고 있다"며 "보다 확장된 시스템을 구축해 최종 목표인 1천개 언어 음성을 배포하겠다"고 밝혔다.