부모들이 아이들을 위한 잠자리 동화를 만들 때 점점 더 AI를 활용하고 있다. 하지만 보코니 대학교(Bocconi University) 연구팀이 발표한 연구 논문에 따르면, 거대언어모델(LLM)로 만든 아동 동화에는 성별 및 문화적 편향이 내포되어 있어 장기적으로 주의가 필요하다는 지적이 나온다.

여아 동화엔 외모 묘사 55% 더 많아, 남아 동화엔 용감함 강조

연구팀이 5,531개의 AI 생성 아동 동화를 분석한 결과, 주인공이 여자아이로 설정된 경우 외모 관련 특성 묘사가 남자아이보다 55.26% 더 많이 나타나는 것으로 드러났다. 연구진은 GPT-4o, 라마3-8B(Llama3-8B), 믹스트랄 8x7B(Mixtral 8x7B) 세 가지 LLM을 사용해 다양한 사회문화적 요소를 포함한 동화를 생성하고 분석했다.

여아를 주인공으로 한 동화에서는 '머리카락', '부드러운', '상상력이 풍부한', '사랑스러운' 같은 외모와 감정적 특성을 강조하는 표현이 자주 등장했다. 반면 남아 동화에서는 '젊은', '모험적인', '영웅', '열망하는', '용감한' 등 행동력과 모험을 강조하는 묘사가 두드러졌다. 이는 전통적인 성역할 고정관념을 그대로 반영한 결과다.

비서구권 아이들 동화에는 ‘전통’과 ‘가족’ 이야기만 가득

문화적 편향은 더욱 심각했다. 연구 결과 비서구권 아이들을 대상으로 한 동화에서는 서구권 아이들 동화보다 문화유산, 전통, 가족 주제가 압도적으로 많이 등장했다. 특히 중동 지역 배경 동화의 87%에서 사막이 등장했고, '고대의', '카펫' 같은 스테레오타입적 단어들이 빈번하게 사용됐다.

아프리카계 미국인 주인공의 경우 '유산'이라는 단어가 38%의 높은 상관관계를 보였고, 아시아계는 '현명하고 고귀한' 특성으로, 라틴계는 '가족 중심적'으로 묘사되는 경향이 강했다. 반면 백인 주인공들은 마법적 배경(74.07%)에서 등장하는 경우가 많아 서구 동화 전통의 영향을 받은 것으로 분석됐다.

텍스트만으로도 편향 패턴 예측 가능해

연구팀은 AI가 생성한 동화 텍스트만을 분석해 주인공의 성별, 국적, 종교 등 사회문화적 특성을 얼마나 정확하게 예측할 수 있는지 실험했다. 이는 텍스트에 내재된 편향의 정도를 측정하기 위한 방법이었다. 그 결과 경제 수준(선진국 vs 개발도상국)은 89-90%의 높은 정확도로 예측 가능했고, 국적도 73.2%의 정확도를 보였다. 이는 AI가 특정 지역이나 문화에 대해 뚜렷하고 예측 가능한 패턴으로 묘사하고 있음을 의미한다.

종교적 편향도 발견됐다. 무신론자 주인공은 '사고하는', '탐구하는' 특성으로 묘사된 반면, 유대인 캐릭터는 '전통'(42%)과 '유산'(48%)에 중점을 둔 묘사가 압도적이었다. 이런 패턴은 AI가 학습 데이터에 내재된 사회적 편견을 그대로 재생산하고 있음을 보여준다.

부모와 전문가들이 놓치기 쉬운 미묘한 편향의 위험성

연구진이 개발한 'Biased Tales' 데이터셋 분석에 따르면, AI가 생성한 동화들은 표면적으로는 아이들에게 적합해 보인다. 독성 콘텐츠 점수는 평균 0.06으로 매우 낮았고, 어휘 습득 연령은 평균 5.86세 수준으로 적절했다. 하지만 이런 안전성 지표가 숨겨진 편향까지 걸러내지는 못한다는 점이 문제다.

연구를 주도한 도냐 루에인(Donya Rooein) 박사는 "부모들이 AI로 동화를 만들 때 명백히 해로운 내용은 쉽게 발견할 수 있지만, 미묘한 편향은 놓치기 쉽다"고 지적했다. 특히 아이들은 정체성을 형성하는 과정에서 편향된 메시지에 더욱 취약하기 때문에, 이런 내재적 편견이 장기적으로 아이들의 세계관에 영향을 미칠 수 있다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1: AI가 생성한 동화가 아이에게 미치는 영향은 얼마나 심각한가요?

A1: 연구에 따르면 AI 동화는 성별과 문화에 대한 고정관념을 강화할 수 있습니다. 특히 아이들은 정체성 형성 과정에서 이런 편향된 메시지에 더욱 취약하므로, 장기적으로 다양성에 대한 이해를 제한할 위험이 있습니다.

Q2: 부모들이 AI 동화의 편향을 어떻게 확인할 수 있나요?

A2: 동화 속 주인공의 특성 묘사를 주의 깊게 살펴보세요. 여아에게는 외모나 감정적 특성만 강조되지 않는지, 특정 문화권 아이들에게는 스테레오타입적 요소만 등장하지 않는지 확인하는 것이 중요합니다.

Q3: AI 동화 생성 서비스를 안전하게 사용하는 방법은 무엇인가요?

A3: 다양한 배경과 특성을 가진 주인공으로 여러 버전의 동화를 생성해 보고, 편향된 표현이 발견되면 프롬프트를 수정하여 더 균형 잡힌 이야기를 요청하는 것이 좋습니다. 또한 기존 출간 동화와 함께 읽어주어 다양성을 확보하세요.

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)