AI도 감정이 있다?... 기후변화 얘기할 땐 '기쁨' 줄고 '분노' 상승

컴퓨팅입력 :2025/01/21 22:07    수정: 2025/01/21 22:08

1200만 건의 SNS 데이터로 분석한 AI의 텍스트 생성 능력

중국과학기술대학교 연구진이 발표한 논문에 따르면, 대형언어모델(LLM)의 텍스트 생성 능력이 뛰어나지만 소셜미디어 상황에서의 감정 일관성과 의미적 응집성은 아직 충분히 이해되지 않은 것으로 나타났다. 연구팀은 구글의 젬마(Gemma2-27B-Instruct-Q8)와 메타의 라마(Llama3-70B-Instruct) 두 오픈소스 모델을 분석했다.

연구진은 '기후변화', '기후과학', '기후조작', '글로벌 워밍', '탄소발자국', '파리협정' 등의 키워드로 레딧에서 576만 건의 댓글과 트위터에서 7,659만 건의 트윗을 수집했다. 최종적으로 트위터 데이터 12,200건과 레딧 데이터 10,900건을 분석 대상으로 선정했다.


젬마의 분노 편향: 62% 분노 유지, 낙관은 11%만 보존

연구 결과는 젬마가 원문의 감정을 분노로 전환하는 강한 경향을 보였다. 분노를 담은 원문의 62%가 그 감정을 유지했으나, 낙관적 텍스트는 11%만이 원래의 감정을 유지했다. 예상(29%), 혐오(44%), 두려움(30%), 기쁨(39%), 슬픔(31%) 등 다른 감정들도 상당 부분 분노로 전환되었다. 다만 낙관과 놀람을 표현한 텍스트는 각각 43%와 높은 비율로 감정이 보존되어, 젬마가 특정 감정의 맥락은 잘 유지할 수 있음을 보여줬다.

라마의 균형적 감정 처리: 전 감정 영역에서 우수한 보존력

라마 모델은 젬마와 달리 분노, 예상, 두려움, 낙관, 슬픔 등 더 넓은 감정 스펙트럼에서 원래의 감정을 잘 보존했다. 특히 트위터 데이터 분석에서 원문의 감정이 부정적이든 긍정적이든 상관없이 일관된 감정 보존력을 보여줬다. 응답 태스크에서는 두 모델 모두 두려움을 제외한 모든 감정 카테고리에서 50% 이상이 예상과 낙관으로 전환되는 특징을 보였다.

감정 강도 분석: AI는 인간보다 최대 40% 약한 감정 표현

감정 강도 분석 결과, 두 모델의 텍스트는 인간 작성 텍스트보다 평균 20-40% 낮은 감정 강도를 보였다. 특히 기쁨, 낙관, 분노, 혐오, 두려움 등 모든 감정 차원에서 유의미하게 낮은 강도를 나타냈다. ANOVA 테스트 결과 트위터 데이터에서 분노(F=384.285), 예상(F=16092.479), 혐오(F=179.181) 등에서 통계적으로 유의미한 차이가 발견되었다.


의미 일관성: 젬마 0.65, 라마 0.63의 높은 유사도 기록

의미적 일관성 측면에서는 코사인 유사도 분석 결과, 트위터 플랫폼에서 젬마는 0.65, 라마는 0.63의 높은 유사도를 보였다. 레딧에서도 젬마 0.59, 라마 0.57의 유사한 수준을 기록했다. 이는 두 모델 모두 원문의 맥락을 잘 이해하고 관련성 있는 응답을 생성할 수 있음을 보여준다.

AI 감정의 원천 분석: 긍정은 긍정에서, 부정은 부정에서 비롯

젬마의 텍스트 생성에서 긍정적 감정은 주로 긍정적 원천에서 발생했다. 예를 들어 기쁨을 표현한 내용은 예상(32.04%), 기쁨(25.24%), 낙관(13.59%)에서 비롯되었다. 반면 부정적 감정을 담은 콘텐츠는 주로 부정적 원천에서 나왔는데, 분노를 표현한 내용의 61.8%가 원문의 분노에서, 13.03%가 혐오에서 기원했다.

라마의 경우 낙관과 기쁨을 제외한 대부분의 감정이 부정적 원천에서 발생했다. 응답 태스크에서는 두 모델 모두 부정적 감정을 긍정적으로 전환하는 경향을 보였는데, 예를 들어 젬마의 응답에서 분노로 시작된 텍스트의 69.55%가 긍정적 감정으로 변화했다.

연구의 한계와 미래 과제: 다국어

다매체 확장 필요성

연구진은 이번 연구가 레딧과 트위터라는 두 플랫폼으로 제한되어 있다는 한계를 지적했다. 유튜브, 인스타그램, 틱톡 등 다른 플랫폼들은 고유한 사용자 행동과 콘텐츠 구조를 가지고 있어 추가 연구가 필요하다고 밝혔다.

또한 영어로 된 기후변화 담론만을 분석 대상으로 삼았기 때문에 다양한 주제와 언어에서 AI 모델의 성능을 파악하는 데 한계가 있었다. 연구진은 향후 연구에서 다국어 데이터셋을 활용해 언어 간 의미 변화를 파악하고, AI 모델의 잠재적 편향을 더 깊이 조사할 필요가 있다고 제안했다.

공공 담론에서 AI의 영향력: 감정 조절과 여론 형성의 가능성

관련기사

연구진은 기후변화와 같은 사회적 이슈에서 AI의 감정 처리 특성이 여론 형성에 중요한 영향을 미칠 수 있다고 분석했다. 특히 호주 산불과 같은 기후 관련 사건 이후의 공공 감정 관리에서 AI의 체계적인 긍정 편향이 건설적인 응답을 제공하고 부정적 여론을 완화하는 데 도움이 될 수 있다고 보았다. 다만 젬마의 분노 증폭이나 감정 양극화 위험성에 대한 고려가 필요하다고 지적했다.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT-4o를 활용해 작성되었습니다. (☞ 관련 논문 바로가기)