IBM, 최대 규모 유방암 사진 활용한 'AI 진단 모델' 개발

구글·MIT보다 10배 이상 많은 X레이 사진 활용

컴퓨팅입력 :2020/03/12 16:58

IBM이 기존 구글·메사추세츠공과대학(MIT)보다 최소 10배 더 많은 데이터를 학습시킨 유방암 판별 머신러닝 모델을 도출했다.

11일(현지시간) 미국 지디넷에 따르면, IBM은 사상 최대 규모의 데이터를 동원한 유방암 판별 머신러닝 모델을 개발했다.

첫 유방암 판별에 머신러닝 알고리즘 접목은 아니다. MIT와 구글이 작년과 올해초 관련 성과를 발표했다.

IBM 연구팀이 활용한 데이터는 최소 60만개 이상이다. 반면 지난해 6월 MIT 연구팀은 유방암 관련 데이터 약 6만개를 활용했다. 구글 딥마인드도 올해 1월 유방암 판별 알고리즘 모델 개발 당시 2만8천여개 유방암 관련 데이터를 동원했다.

IBM 연구팀이 역대급 정보량을 동원한 유방암 판별 머신러닝 알고리즘을 도출했다.(사진=지디넷 캡쳐)

유방 X선 촬영술인 맘모그램은 보통 유방암 검사 초기에 사용한다. 그러나 방사선사가 그동안의 경험을 바탕으로 감과 자신의 시각에 의존해 맘모그램 상 암을 판별하기 때문에 신뢰성이 의심될 수 있다.

해럴 연구원은 "현재 사람 전문가가 맘모그램 사진으로 진단을 내릴 때 암 세포 단계, 존재 여부 등을 잘못 진달할 수 있다"며 "이같은 방식으로는 환자에게 엄청난 불안감을 안겨주기 때문에 지양돼야 한다"고 설명했다.

IBM은 세이지 바이오네트워크, 카이저 퍼머넌트 워싱턴 헬스 연구소, 워싱턴대학교 의학대학 등과 협력했다.

IBM 연구팀이 수집한 60만장의 비식별 맘모그램 사진에 카이저 퍼머넌트 연구소, 스웨덴 카롤린스카 연구소가 보유한 각각 수만개의 판별 정보를 결합해 데이터셋을 구축했다. 이때 카롤린스카 연구소는 780명의 유방암 환자를 포함한 6만8천명 여성에 대한 판별 정보를, 카이저 퍼머넌트 연구소는 941명의 유방암 환자를 포함한 여성 8만5천500여명의 판별 정보를 제공했다.

관련기사

이 과정을 통해 연구팀은 각각의 주석이 달린 맘모그램 정보 수십만개를 만들어냈다. 사진 각 부분마다 암 여부를 판별한 라벨을 부착한 정보 꾸러미라고 할 수 있다. 연구팀은 이 정보 집합체를 머신러닝 알고리즘에 학습시켰다.

IBM 스테판 해럴 연구원은 "이번 우리 연구팀의 성과는 기존에 가장 발전된 유방암 판별 알고리즘에 역대급으로 큰 규모의 데이터셋을 접목한 것"이라며 "이번 연구를 시작으로 미래에는 더 많은 일들을 해낼 수 있을 것"이라고 말했다.