인공신경망도 음악 익힌다…AI로 음악 본능 규명

KAIST 연구진, "음악 생성 AI, 음악 치료, 음악 인지 연구 등에 활용"

과학입력 :2024/01/16 10:22    수정: 2024/01/16 10:34

음악은 만국 공통의 언어라고 한다. 모든 문화권에서 사람들은 음악을 만들어 즐긴다. 음악적 본능은 인간에게 공통된 것일까?

KAIST(총장 이광형)는 물리학과 정하웅 교수 연구팀이 인공신경망 모델을 활용, 특별한 학습 없이도 사람 뇌에서 음악 본능이 나타날 수 있는 원리를 규명했다고 16일 밝혔다.

뇌와 인공신경망의 음악성 일러스트레이션 (논문 내용을 바탕으로 DALL·E3 AI로 생성됨) (이미지=KAIST)

민속지학적으로 구분된 거의 모든 문화에서 음악을 만들어 내고, 유사한 바자와 멜로디가 쓰이는 것으로 알려졌다. 또 사람 뇌 청각 피질엔 음악 정보처리를 담당하는 영역이 따로 있다.

연구팀은 구글이 제공하는 대규모 소리 데이터(AudioSet)를 활용, 인공신경망이 다양한 소리 데이터를 인식하도록 학습했다. 그러자 네트워크 모델에서 음악에 선택적으로 반응하는 뉴런이 발생했다.

사람의 말, 동물 소리, 환경 소리, 기계 소리 등의 다양한 소리에는 거의 반응을 보이지 않으나, 기악이나 성악 등 음악에 대해선 높은 반응을 보이는 뉴런들이 자발적으로 형성됐다.

이 인공신경망 뉴런들은 실제 뇌의 음악정보 처리 영역의 뉴런들과 유사한 성질을 보였다. 인공 뉴런은 음악을 시간적으로 잘게 나누어 재배열한 소리에 대해선 반응이 약해졌다. 자발적으로 나타난 음악 선택성 뉴런들이 음악의 시간적 구조를 부호화하고 있다는 의미라고 연구진은 설명했다.

이러한 성질은 특정 장르의 음악에만 국한된 것이 아니라, 클래식이나 팝, 락, 재즈, 전자음악 등 25개의 다양한 장르에 공통적으로 나타났다.

음악이 포함되지 않은 자연소리 인식을 학습한 인공신경망의 잠재 공간에서 음악과 비음악의 구분 (자료=KAIST)

또 네트워크에서 음악 선택성 뉴런의 활동을 억제하면 다른 자연 소리에 대한 인식 정확도가 크게 떨어졌다. 즉, 음악 정보 처리 기능이 다른 자연 소리 정보의 처리에 도움을 주며, 따라서 '음악성'이란 자연 소리를 처리하기 위한 진화적 적응에 의해 형성되는 본능일 수 있다는 설명이다.

정하웅 교수는 "이러한 결과는 다양한 문화권에서 음악 정보 처리의 공통된 기저를 형성하는데 있어 자연 소리 정보 처리를 위한 진화적 압력이 기여했을 수 있음을 시사한다"라며 "사람과 유사한 음악성을 인공적으로 구현해 음악 생성 AI, 음악 치료, 음악 인지 연구 등에 원천 모델로 활용될 수 있을 것"이라고 기대했다.

관련기사

다만 이 연구는 음악 학습에 의한 발달 과정을 고려하지 않았으며, 발달 초기의 기초적 음악 정보 처리에 대한 논의라는 한계가 있다.

한국연구재단의 지원으로 수행된 이 연구는 학술지 '네이처 커뮤니케이션즈(Nature Communications)'에 최근 실렸다. 논문 제목은 Spontaneous emergence of rudimentary music detectors in deep neural networks (심층신경망에서 음악 인지기능의 자발적 발생)이다.