성중립 언어는 가능할까? 인공지능에 물었다

뉴욕대 연구진, 인공지능 활용해 언어 생활 속 성 차별 규명

과학입력 :2022/04/02 03:00

영어에선 '비즈니스맨(businessman)'이나 '대변인(spokeman)' 같이 직업을 부르는 단어에 남자를 뜻하는 'man'이 붙는 경우가 많다. 어떤 직업을 당연히 남성과 연결하는 이같은 어법은 성 역할에 대한 고정관념을 부추긴다는 우려도 나온다.  

그래서 요즘엔 의도적으로 'businessperson'이나 'spokeperson' 같은 단어로 바꿔 쓰기도 한다. 'man'이나 'woman' 대신 'person' 또는 'people'처럼 성별과 무관하게 '사람'을 뜻하는 말을 쓰는 것이다. 

달에 첫 발을 디딘 우주비행사 닐 암스트롱의 유명한 말. 'man'을 인류 전체를 나타내는 말로 쓰고 있다.

그러나 'person'처럼 성별을 드러내지 않는 표현을 쓸 때도 사람들은 여전히 이를 남자로 간주하는 경향이 있다는 연구 결과가 나왔다. 

미국 뉴욕대의 심리학과 언어학 연구진은 인공지능과 대규모 인터넷 학습 데이터를 활용, 단어들이 일상에서 어떤 방식으로 쓰이는지 분석해 이같은 결론을 얻었다. 이 연구는 1일(현지시간) 학술지 '사이언스 어드밴스(Science Advances)'에 게재됐다. 

■ 인공지능에 언어학적 의미 유사성 가르쳐

연구진은 사람들이 일상 언어 생활에서 'person', 'man', 'woman' 등의 개념을 나타내는 단어를 어떻게 사용했는지 살폈다. 이를 위해 사람들의 언어 사용 방식에 기반해 단어의 의미를 학습하는 인공지능 알고리즘을 활용했다. 인터넷에서 데이터를 수집해 연구자가 활용하게 하는 '커먼 크롤(Common Crawl)'에 저장된 6천300억 개의 단어가 학습 교재가 됐다.   

인공지능을 학습시킬 때에는 단어의 의미가 단어가 쓰이는 맥락과 연관되어 있다는 사실을 고려했다. "철수는 매일 아침 발락에 물을 끓여 차를 마신다"라는 문장에서 우리는 '발락'이란 말이 '주전자'와 비슷한 뜻이리라 추측할 수 있다. '발락'이라는 말은 처음 듣지만, 함께 쓰인 '차' '끓이다' '물' 등이 '주전자'와 함께 자주 등장하는 단어이기 때문이다. 

마찬가지로 연구진은 인공지능에 'person'이나 그와 연관된 단어들의 의미를 학습시키기 위해 이들 단어 가까이에 자주 함께 나오는 단어들을 따졌다. 이를 통해 언어적 맥락 속에서 의미의 유사도를 알 수 있다. 

(자료=Loffler)

■ 인터넷에서 사람=남자?

우선 성별을 드러내지 않는 'people'과 관련된 '개인(individual)' 같은 단어들과 남성을 나타내는 'he'나 'male' 같은 단어들 사이의 의미 유사성을 살펴보고, 이를 'people'과 여성을 나타내는 'she'나 'female' 같은 단어들 사이의 유사성과 비교했다.

그 결과, 'people'과 관련된 단어들이 여성보다는 남성을 나타내는 단어들과 더 비슷하게 쓰이는 것으로 나타났다. 이는 남성을 나타내는 단어들이 people을 나타내는 단어와 더 의미가 가까움을 보여준다. 전체적으로 봤을 때 'people'이라는 개념은 여성보다는 남성과 더 겹치는 것으로 인식된다는 말이다.           

이어 연구진은 사람의 특성을 묘사하는 주요 형용사들과 행동을 나타내는 동사들을 골라 이들의 쓰임새를 각각 남성과 여성을 나타내는 단어들과 비교했다. 사람의 특성을 묘사하는 단어로는 '외향적인(extroverted)' '분석적인(analytical)' '미신을 믿는(superstitious)' 등 수 백개를 골랐다. 동사로는 '가능하게 하다(facilitate)' '웃다(smile)' '위협하다(threaten)' 등 250개를 골랐다. 

사람의 특성이나 행동을 나타내는 단어 역시 여성보다는 남성을 나타내는 단어들과 더 의미가 비슷한 것으로 나타났다. 

■ 숨은 편향이 불공정으로 이어질 수 있어

관련기사

이 연구 논문의 공동저자로 현재 메타에서 인공지능을 연구하는 애디나 윌리엄스 메타 연구원은 "성중립적 용어를 사용할 때도 우리는 여성보다 남성을 우선순위에 둔다는 점을 확인할 수 있었다"라고 밝혔다.   

이 연구 결과는 단어의 선택과 같은 근원적 수준에서도 편향이 숨어 있을 수 있음을 보여준다. 대부분의 사회적 합의나 정책 결정이 '사람'을 근거로 삼는다는 점을 고려하면, '사람'의 개념이 남성에 치우쳐있다는 것은 여성에게 불평등한 결과로 이어질 수 있다고 연구진은 우려했다.