메타, 감정 읽고 표현하는 신규 AI '스피릿LM' 공개

음성과 텍스트 교차 학습으로 두 언어의 상호관계 이해

컴퓨팅입력 :2024/10/20 09:19

메타가 음성과 텍스트를 자유롭게 오가며 감정상태까지 반영하는 신규 인공지능(AI)를 선보인다.

20일 벤처비트 등 외신에 따르면 메타는 멀티모달 언어모델 '메타 스피릿 LM'을 깃허브를 통해 출시했다.

메타스피릿LM은 '교차하는 말하기와 쓰기 언어 모델'이라는 새로운 방식이 적용된 언어모델이다. 같은 의미를 가진 텍스트와 음성 데이터를 함께 학습시켜 두 형태 언어 사이의 상호작용까지 학습시키는 것이 특징이다.

메타의 신규 언어 모델 '스피릿LM'(이미지=메타)

두 모달리티 사이의 연결을 강화하고 양측을 자연스럽게 오가는 언어 처리 능력을 강화했다. 이를 통해 텍스트 스타일을 분석하고 음성에 포함된 감정을 포착해 이를 전환하는 과정에서도 최대한 반영할 수 있다.

스피릿LM은 70억 매개변수 규모의 텍스트 데이터에 음성데이터를 연계해 학습을 거쳤으며 스피릿LM 베이스와 스피릿LM 익스프레시브 2가지 모델로 제공된다.

스피릿LM 베이스는 음성을 중심으로 데이터를 입력 받아 답변을 제공하며, 스피릿LM 익스프레시브는 추가로 음성의 높낮이 등을 인식해 화자의 감정 표현까지 인식해 제공한다.

관련기사

분노, 놀라움, 기쁨 등의 감정 상태를 감지하고 이를 답변 등에 반영할 수 있어 가상 비서, 챗봇 등에서 보다 자연스러운 의사소통과 서비스를 제공할 수 있을 전망이다.

메타 측은 "보다 자연스럽고 표현력이 풍부한 AI 모델을 개발하고 오픈소스로 제공할 계획"이라며 "이를 통해 AI 커뮤니티에서 멀티모달 AI앱에 대한 새로운 가능성을 열 수 있도록 지원할 것"이라고 밝혔다.