MIT, 가짜 뉴스 판별 새 방법 제시..."뉴스 출처도 조사"

CSAIL, 카타르 대학과 공동...2천개 이상 미디어 소스 점검

인터넷입력 :2018/10/07 10:35    수정: 2018/10/07 13:28

매사추세츠 공과 대학(MIT)과 카타르 대학이 정보 출처를 조사해 가짜뉴스 여부를 판별하는 인공지능(AI)을 개발하고 있어 이목이 집중된다.

인터넷과 스마트폰 보급, 그리고 소셜네트워크서비스(SNS) 대중화로 정보의 신빙성이 강하게 요구되는 이 때, 보다 정확한 정보와 언론의 정치 편향성 등을 확인할 수 있는 계기가 될 것으로 기대된다.

4일 MIT뉴스와 기가진에 따르면 소셜 미디어를 통해 사실과 다른 편향된 뉴스와 정치 광고가 번지고 있다. 페이스북은 SNS의 안전성을 강화하는 작업을 위해 이미 1만 명 이상의 인력을 투입했으며, 올해 말까지 이 인력을 2만 명까지 늘린다는 계획을 밝혔다. 또 유튜브와 트위터 등도 많은 인원을 해당 대책을 위해 쓰고 있다.

MIT의 컴퓨터 과학 인공지능 연구소(CSAIL)와 카타르 대학 컴퓨팅 연구소 연구원은 개별 주장뿐 아니라 뉴스 출처 자체가 가짜뉴스를 가려내는 좋은 방법이라고 생각했다. 이에 기계학습을 사용해 원본의 정확성과 정치적 중립성을 판단하는 시스템을 개발 중이다.

MIT뉴스 기사에 나온 가짜뉴스 판별 이미지.

연구팀은 2천개 이상의 미디어 소스의 편향을 사람의 힘으로 점검하고 있다. ‘미디어 편향/사실 확인(Media Bias/Fact Check, MBFC)에서 얻은 정보를 기계학습 데이터 집합에 등록, AI가 MBFC처럼 뉴스 사이트의 신뢰성과 정치적 편향을 확인할 수 있도록 프로그래밍 했다.

AI는 새로운 뉴스의 신뢰성을 높음, 보통, 낮음 세 단계로 평가하고 동시에 정치적 편향을 좌익, 우익, 중립 세 종류로 분류할 수 있다. 실제로 새로운 뉴스가 보도될 때마다 AI로 확인을 했는데, 뉴스의 신뢰성은 65%, 정치적 편향은 70% 정도의 정확도로 판단 됐다.

AI에 의해 뉴스를 면밀히 조사한 결과, 가짜뉴스는 주관적이고 감정적인 말을 많이 하는 경향이 있는 것으로 판명됐다. 또 정치적 편향 측면에서, 특히 좌익에 치우친 것은 다른 사람보다 위험/불안, 공정/상호이익과 같은 단어가 자주 등장하는 경향을 보였다.

또 이 AI 시스템은 ‘극단적’, ‘음모론’ 등의 단어를 검색할 뿐 아니라 페이지 소스에 위키피디아 등의 URL 텍스트가 존재하는지 여부도 확인한다. 복잡한 하위 디렉토리 또는 특수 문자를 사용하는 URL의 뉴스 소스는 신뢰성이 낮은 것으로 간주한다.

연구팀은 AI 개발과 동시에 1천개 이상의 뉴스 출처 신뢰성과 편견을 평가한 오픈소스 데이터 세트를 만들었다. 영어 학습된 AI가 다른 언어에도 적용될 것인가, 지역 고유의 편견을 탐구할 수 있는가 등도 검토할 예정이다.

관련기사

연구팀에 따르면 AI는 아직 개발 단계로, 정확도를 높이기 위해서는 AI를 단독 사용하는 것이 아니라 어디까지나 기존의 가짜뉴스 체크와 함께 사용하는 것이 가장 효과적이다. 사람들이 문제에 대해 생각하는 것을 도와주고, 지금까지 없었던 관점을 탐구하는 데 도움을 주는 목적이다.

CSAIL 박사 연구원에서 논문의 수석 저자인 라미 배리 씨는 “약 150 건의 기사가 있으면 그 뉴스 소스를 신뢰할 수 있는지 여부를 확인할 수 있다”며 “기사를 게시하는 웹 사이트뿐만 아니라, 뉴스 소스를 분석하면 기사가 확산되기 전 새로운 가짜 뉴스가 태어나는 것을 방지 할 수 있다”고 말했다.