구글이 문자를 음악으로 만드는 생성 인공지능(AI) '뮤직LM'을 개발했다.
뮤직LM은 문자를 음악으로 바꾸고, 멜로디를 다른 악기로 변환하는 등 전반적인 음악 생성 기능을 갖췄다.
구글 AI 연구팀은 뮤직LM 개발 과정을 소개한 논문을 27일(현지시간) 공개했다. 논문에 따르면 뮤직LM은 28만 시간 분량의 음악 데이터셋으로 이뤄졌다. 음질은 24kHZ(킬로헤르츠) 수준이다. 복잡한 텍스트를 입력해도 어울리는 음악을 만든다.
이용법은 간단하다. 사용자는 듣고 싶은 음악을 문자로 입력만 하면 된다. 예를 들어 사용자가 '70년대식 재즈와 어울리는 보컬로 이뤄진 음악'을 모델에 요청하면 이에 맞는 노래를 들을 수 있다.
뮤직LM은 테마 음악도 생성할 수 있다. 예를 들어 사용자가 '명상' '산책' '집중' '운동'을 순서대로 입력하면, 모델은 이를 한 콘셉트로 엮어 노래를 제공한다.
연구진은 뮤직LM으로 사람 목소리까지 시뮬레이션할 수 있다고 논문을 통해 밝혔다. 해당 시뮬레이션은 사람 음성을 멜로디에 집어넣어 노래 완성도를 확인해 준다. 미국 IT매체 더 버지 보도에 따르면 이 기능이 텍스트를 음악으로 바꾸는 것만큼 품질이 좋지는 않다.
관련기사
- "신년 인사말 '생성 AI'로 쓰세요"2023.01.20
- 생성 AI 기업, 저작권 이슈로 법적 분쟁 휘말리나2023.01.18
- 엔비디아, '단백질 생성 AI'로 의료·환경 돕는 단백질 개발2023.01.16
- "생성 AI로 만든 콘텐츠, 2년 뒤 인터넷 점령한다"2023.01.15
구글 측은 뮤직LM 모델을 서비스로 제공하지 않는다는 입장이다. 연구팀은 "표절 등이 발생할 수 있는 부분을 아직 해결하지 못했다"며 "법적 이슈를 차단하기 위해 신중한 태도를 유지하겠다"고 전했다.
구글은 지금까지 음악 생성 AI '댄스 디퓨전'을 지속적으로 연구했다. 이 모델은 고품질 음원을 만들기에는 적은 학습 데이터를 갖고 있었다.