"생성 AI가 암 연구에 획기적 발전 일으킨다"

다프네 콜러 스팬포드대학교 컴퓨터공학과 겸임교수

컴퓨팅입력 :2023/10/26 10:00

인공지능(AI) 선구자 다프네 콜러 스탠포드대학교 교수가 생성 AI로 암 연구에 혁신적 발전이 일어날 것이라고 전망했다.

25일(현지시간) 미국 지디넷에 따르면, 다프네 콜러 교수는 인간중심AI연구소에서 주최한 '생성 AI의 새로운 지평: 과학, 창의성, 사회' 세미나에서 "오픈AI의 달리, 챗GPT 등의 생성 AI가 암 연구인 종양학의 획기적 발전에 중요한 도구가 될 것"이라고 밝혔다.

그는 생명과학 AI 회사 '인시트로'의 공동창립자이자 최고경영자(CEO)다. 스탠포드대학교 컴퓨터공학과 겸임교수기도 하다.

인시트로에 의하면, 생성 AI는 조직 이미지의 '딥 페이크'를 생성해 유전자 분석을 통해 채굴할 수 있는 샘플 크기를 크게 확장하는 데 사용된다.

그는 이날 암에 대한 새로운 약물 표적을 개발할 수 있는 2단계 과정을 설명했다. 첫단계로 인시트로의 머신러닝 AI 기술은 생체검사에서 생성된 조직학 이미지인 암 조직 이미지를 분석할 수 있다. 그는 "일반적으로 수십억개의 픽셀 이미지를 인간 병리학자는 세 개의 숫자로 요약한다"며 "그 안에 사용되지 않는 훨씬 더 많은 정보가 있다"고 말했다.

그는 "머신러닝을 사용함으로써 컴퓨터가 조직병리학의 언어를 실제로 학습할 것이고, 이를 통해 기계가 암 환자의 유전적 변화를 90~95% 정확도로 예측할 수 있다"며 "기본적으로 슬라이드를 보면 이 환자가 다른 환자에 비해 유전적 돌연변이를 갖고 있다고 말할 수 있는데, 이는 임상의가 실제로 할 수 없는 일"이라고 설명했다.

약물 표적을 찾으려면 실제로 수집되는 것보다 훨씬 더 많은 조직 샘플이 필요하다. 수천개 수준이다. 인시트로는 생성 AI를 사용해 조직 이미지의 '딥페이크'를 만들었다고 콜러 교수는 밝혔다. 그는 "영화배우의 이미지를 생성하는 대신 병리학 슬라이드의 이미지를 생성하는 것"이라고 말했다.

그는 조직 샘플을 수백에서 수천으로 늘리면 'ATAC-seq' 분석이라 불리는 스탠포드에서 개발한 특수 도구를 사용해 훨씬 더 큰 샘플을 분석할 수 있다고 했다. 그의 팀은 400개의 암 조직 이미지 샘플을 1만여개로 늘릴 수 있었다고 한다. 이런 규모는 더 적은 수의 표본으로 불가능했던 질문을 할 수 있게 한다.

콜러 교수는 "이제 기본적으로 어떤 유전자의 개방성 또는 폐쇄성, 즉 어떤 유전자의 활동이 생존과 가장 밀접히 연관되는지 같은 질문을 던질 수 있다"며 "이는 환자가 서른명이었다면 불가능했을 질문"이라고 말했다.

예를 들어 ATAC-seq를 사용해 삼중 음성 유방암에 대한 수천 개의 팁페이크 이미지를 분석함으로써 이전에 알려지지 않은 약물 표적 후보로서 유전적 변화를 밝혀낼 수 있다. 콜러 교수는 "이런 표적 중 일부는 삼중 음성 유방암에선 새로운 것이지만, 다른 암과도 관련돼 있다"며 "그것은 그들이 하는 인과적 역할에 대한 확신을 주며, 잠재적으로 정말 흥미로운 신약 표적이 될 것"이라고 강조했다.

그는 "생물학에서 생성 AI의 전체 프로그램이 인간의 두뇌로 도저히 이해할 수 없는 수준의 복잡성을 다루고 있다"고 설명했다.

그는 "이 영역을 다루려면 먼저 전례없는 충실도와 규모, 다양한 생물학적 세분성 수준으로 매우 많은 양의 데이터를 수집한 다음 현재의 기계가 사람보다 훨씬 더 잘하는 일을 하게 하면 된다"며 "이런 데이터의 미묘한 패턴을 이해하고, 인간 질병의 이질성과 복잡성을 재정의하는데 도움을 주며 임상에서 효과있는 치료법을 탄생시킬 수 있는 개입 허브를 식별하는 것"이라고 강조했다.

콜러 교수는 강연을 마무리하면서 과학의 발전 방향을 언급했다.

그는 "1800년대 원소주기율표가 밝혀진 화학을 생각해보고, 1900년대초반 에너지와 물질, 공간과 시간을 연결한 물리학을 생각해보라"며 "1990년대 데이터, 머신러닝, AI 분야와, 전례없는 정확도로 생물학을 측정할 수 있는 정량적 생물학이란 두 분야에서 비슷한 발견이 폭발적으로 증가했다"고 말했다.

관련기사

그는 "이제 이 두 분야가 합쳐져 디지털 생물학이란 새 분야를 탄생시키고 있다"며 "디지털을 통해 전례없는 규모로 충실하게 생물학을 디지털 방식으로 읽고, 머신러닝과 AI 같은 도구를 사용해 우리가 보는 것을 해석한 다음 SRISPR 및 조합 화학 등의 기술로 생물학을 작성하는 능력"이라고 설명했다.

그는 "이 새로운 분야가 인류 건강뿐 아니라 환경, 에너지, 바이오소재, 지속 가능한 농업, 세상을 더 나은 곳으로 만드는데 도움을 주는 기타 여러 분야에 막대한 영향을 미칠 것"이라고 덧붙였다.