기계학습이 암 진단-치료에도 활용된다

MIT, 10만8천 건 데이터 추출해 분석

인터넷입력 :2017/02/20 09:14    수정: 2017/02/20 09:26

대량의 데이터에서 반복 학습 패턴을 찾아내는 기계학습이 의료 분야에도 활용되기 시작했다.

기계학습을 통한 정확한 치료가 가능해지고, 초기 암 환자를 찾아내는 데에도 도움이 될 것으로 기대가 모인다.

미국 매사추세츠공과대학(MIT)이 기계학습을 활용해 암을 비롯한 각종 질병을 치료하는 연구를 진행하고 있다고 학교 공식 사이트 MIT뉴스가 20일 전했다. 특히 이번 연구는 암 진단을 받은 교수가 이끌고 있어 더 관심을 끌고 있다.

이번 연구를 주도하고 있는 레지나 바지레이 교수(전기공학및컴퓨터과학과)는 2014년 유방암 진단을 받았다. 그는 자신의 질병 치료에 도움이 되는 정보를 찾으려 했지만 데이터와 경험을 바탕으로 한 신뢰할 수 있는 정보를 찾는 것이 쉽지 않았다. 그러다보니 어쩔 수 없이 추측에 의지할 수밖에 없었다.

이런 경험을 통해 의료 분야에 생각만큼 정확한 정보가 많지 않다는 사실을 깨달은 바지레이 교수는 기계학습 쪽으로 눈을 돌렸다.

기계학습은 컴퓨터 과학에서는 일반화된 기술이지만, 의료분야에서는 아직 제대로 도입되지 않았다. 의사는 환자를 진찰해 얻은 정보를 수동으로 쓰고, 기초적인 통계 분석을 바탕으로 상관관계를 조사한다. 하지만 바지레이 교수의 말에 따르면 이런 방법은 원시적인 방법에 지나지 않는다.

미국 임상종양학회에 따르면 미국에서는 매년 170만 명이 암 진단을 받는다. 이는 임상 시험에 등록돼 있는 것은 전체의 3% 수준 밖에 안 된다. 즉 현재의 의학 연구는 몇 %의 환자에서 얻은 데이터에만 의존하고 있는 상태다. 이에 바지레이 교수는 암치료를 받은 나머지 97%의 환자 치료에 대한 정보를 분석할 필요가 있다는 입장이다.

바지레이 교수는 세상에 나오지 않은 의료 정보에서 새로운 치료 방법이나 더 나은 의료 행위의 가능성이 묻혀 있다고 생각하고 실험실 학생들과 함께 의료 데이터 발굴 작업을 벌이고 있다. 우선 매사추세츠 종합병원의 유방 종양학 의사와 협력해 암 치료에 관한 기계학습 작업에 임하고 있다.

바지레이 교수 연구팀은 10만8천 건의 암치료에 관한 병리학 보고서에서 자연 언어 처리 도구를 사용해 임상 정보를 추출, 데이터 베이스로 만들고 있다. 또 데이터 베이스 작성의 정확도는 98%로 매우 높고, 인력으로는 할 수 없을 정도의 엄청난 양 작업을 컴퓨터를 활용해 효율적으로 실시하고 있다. 또한 데이터 베이스화 한 정보를 기계학습 시키고, 기계학습으로 추론 가능한 신경 모델을 만들려는 시도를 하고 있다.

관련기사

또한 바지레이 교수는 기계학습을 예방 의학에 응용하는 것도 시도하고 있다. 인간의 눈으로는 해독하기 어려운 정보가 많이 들어있는 맘모 그래피(유방암 진단기기)에 딥러닝 기술을 적용해 유방암으로 이어질 미묘한 징후를 찾아내고자 하는 것이다. 의사의 눈으로도 확인할 수 없는 초기 유방암 환자를 발견하고 암 재발이 쉬운 환자를 예측하는 데 도움이 될 것으로 기대하고 있다.

바지레이 교수는 의사와 생물학자에 데이터 과학자가 협력할 수 있는 많은 기계학습 등 다양한 데이터 분석 기술을 제공함으로써 의료를 발전시켜 많은 환자들이 혜택을 받게될 것으로 여기고 있다.