인공신경망도 음악 익힌다…AI로 음악 본능 규명

음악은 만국 공통의 언어라고 한다. 모든 문화권에서 사람들은 음악을 만들어 즐긴다. 음악적 본능은 인간에게 공통된 것일까?

KAIST(총장 이광형)는 물리학과 정하웅 교수 연구팀이 인공신경망 모델을 활용, 특별한 학습 없이도 사람 뇌에서 음악 본능이 나타날 수 있는 원리를 규명했다고 16일 밝혔다.

뇌와 인공신경망의 음악성 일러스트레이션 (논문 내용을 바탕으로 DALL·E3 AI로 생성됨) (이미지=KAIST)

민속지학적으로 구분된 거의 모든 문화에서 음악을 만들어 내고, 유사한 바자와 멜로디가 쓰이는 것으로 알려졌다. 또 사람 뇌 청각 피질엔 음악 정보처리를 담당하는 영역이 따로 있다.

연구팀은 구글이 제공하는 대규모 소리 데이터(AudioSet)를 활용, 인공신경망이 다양한 소리 데이터를 인식하도록 학습했다. 그러자 네트워크 모델에서 음악에 선택적으로 반응하는 뉴런이 발생했다.

사람의 말, 동물 소리, 환경 소리, 기계 소리 등의 다양한 소리에는 거의 반응을 보이지 않으나, 기악이나 성악 등 음악에 대해선 높은 반응을 보이는 뉴런들이 자발적으로 형성됐다.

이 인공신경망 뉴런들은 실제 뇌의 음악정보 처리 영역의 뉴런들과 유사한 성질을 보였다. 인공 뉴런은 음악을 시간적으로 잘게 나누어 재배열한 소리에 대해선 반응이 약해졌다. 자발적으로 나타난 음악 선택성 뉴런들이 음악의 시간적 구조를 부호화하고 있다는 의미라고 연구진은 설명했다.

이러한 성질은 특정 장르의 음악에만 국한된 것이 아니라, 클래식이나 팝, 락, 재즈, 전자음악 등 25개의 다양한 장르에 공통적으로 나타났다.

음악이 포함되지 않은 자연소리 인식을 학습한 인공신경망의 잠재 공간에서 음악과 비음악의 구분 (자료=KAIST)

또 네트워크에서 음악 선택성 뉴런의 활동을 억제하면 다른 자연 소리에 대한 인식 정확도가 크게 떨어졌다. 즉, 음악 정보 처리 기능이 다른 자연 소리 정보의 처리에 도움을 주며, 따라서 '음악성'이란 자연 소리를 처리하기 위한 진화적 적응에 의해 형성되는 본능일 수 있다는 설명이다.

정하웅 교수는 "이러한 결과는 다양한 문화권에서 음악 정보 처리의 공통된 기저를 형성하는데 있어 자연 소리 정보 처리를 위한 진화적 압력이 기여했을 수 있음을 시사한다"라며 "사람과 유사한 음악성을 인공적으로 구현해 음악 생성 AI, 음악 치료, 음악 인지 연구 등에 원천 모델로 활용될 수 있을 것"이라고 기대했다.

인공신경망도 음악 익힌다…AI로 음악 본능 규명

관련기사

지금 뜨는 기사

이시각 헤드라인

[데이터 주권] 韓, 데이터 인프라는 '최고'...정책 방향은 '미흡'

배경훈 장관 "국가 암호체계, 양자 내성 암호로 전환"

[ZD e게임] 크래프톤, 인조이 첫 DLC 게임스컴서 공개…동남아 휴양지 느낌 '물씬'

韓 스테이블코인 규제없는데…서클, 왜 은행·거래소 만날까

ZDNet Power Center