단백질은 3차원 구조로 다양한 모양을 형성한다. 이것을 단백질 접힘(protein folding)이라고 한다. 단백질 접힘은 생명의 신비를 파헤치는 데 가장 중요한 관문으로 통한다. 수 많은 질병이나 유전자의 비밀을 밝혀내는 열쇠다. 그 동안 많은 과학자들이 이 문제를 풀기 위해 수 많은 과학자들이 도전장을 던진건 그 때문이다.
지난 2016년 알파고로 바둑을 정복했던 구글 자회사 딥마인드가 이번엔 인공지능(AI)을 이용해 단백질 접힘 문제를 높은 정확도로 풀어내는 데 성공했다.
아미노산 관계 대신 최종 구조 예측 방식 사용
네이처는 30일(현지시간) 딥마인드의 AI ‘알파폴드’가 단백질 구조예측 대회인 CASP에서 주어진 과제 3분의 2에서 인간 과학자 수준의 정확도를 보였다고 전했다. CASP는 이날 100여 팀이 참가한 대회 결과를 공식 발표했다.
2018년 CASP에 처음 참가해 60% 수준의 정확도를 보였던 알파폴드는 이번 대회에선 90%에 육박하는 결과를 나타냈다.
2016년 바둑계에 충격을 안겨줬던 알파고는 ‘딥러닝’을 활용해 난제를 풀어냈다. 단백질 구조 분석에 도전장을 던진 알파폴드의 무기도 딥러닝이었다.
네이처에 따르면 알파폴드는 문제를 해결하기 위해 크게 두 가지 단계를 거쳤다.
우선 구조 및 유전자 정보를 활용해 단백질 내의 아미노산 간의 거리를 예측했다. 그런 다음 이 정보를 활용해 단백질의 모양에 대한 ‘합의된 모델’을 도출하는 방식으로 접근했다.
하지만 이 방법만으론 원하는 결과를 얻을 수 없었다.
결국 딥마인드는 단백질 접힘 방식을 결정하는 물리적, 기하하적 제약 요소들에 대한 추가 정보를 통합한 AI 망을 개발하는 방식으로 문제를 풀어나갔다.
딥마인드 AI망의 문제풀이 방식도 독특했다. 아미노산 간의 관계를 예측하는 대신 타깃이 된 단백질 서열의 최종 구조를 예측했다. 딥마인드 측은 “훨씬 더 복잡한 시스템이다”고 강조했다.
알파폴드의 이런 성과가 갖는 의미는 크다. 단백질 구조를 빠르게 예측할 경우 신약개발이나 유전병 치료 등에서 엄청난 도움을 받을 수 있기 때문이다.
단백질 염기서열을 알아내기 위해 그 동안 많은 과학자들이 도전장을 던졌다. 1950년대에는 엑스선을 주로 활용했다. 최근 10년 동안은 극저온 전자현미경이 많이 사용되고 있다.
1980년대와 1990년대 들어 컴퓨터를 활용해 단백질 구조를 예측하는 시도들이 조금씩 등장했다. 하지만 그 동안의 성과는 미미했다.
이런 상황에서 알파폴드가 뛰어난 성과를 보여주면서 단백질 구조 분석에 새로운 전기를 맞게 됐다.
딥마인드 "생물학자 뭘 원하는지 알게됐다…알파폴드 더 개선"
이번에 열린 CASP는 수 개월 동안 열렸다. 약 100개 가량의 단백질을 배포한 뒤 수 주 내에 구조를 예측하는 방식으로 진행됐다.
제출된 구조 분석은 과학자들이 실험을 통해 입증한 ‘모범 답안’과 얼마나 일치하는지 판정했다.
이 과정에서 알파폴드는 놀랄 정도로 높은 정확도를 보였다. 특히 전체 과제의 3분의 2 정도는 실험결과와 거의 일치했다.
데미스 하사비스 딥마인드 최고경영자(CEO)는 과학자들이 유용하게 사용할 수 있는 수준까지 알파폴드를 개선하겠다고 밝혔다. 그는 “이제 생물학자들이 어떤 것을 원하는지 이해했다”고 강조했다.
관련기사
- '알파고' 딥마인드, AI로 단백질 비밀도 풀었다2020.12.01
- 구글 딥마인드 "의사보다 유방암 오판율 낮은 AI모델 개발"2020.01.02
- 딥마인드 게임 AI, FPS 게임에서도 사람 뛰어넘었다2019.05.31
- [김익현의 미디어 읽기] 알파고 4년…AI에 봄이 오는 신호였다2020.01.29
알파고로 미지의 바둑 세계를 정복했던 딥마인드. 이번엔 ‘알파폴드’로 ‘단백질 접힘(protein folding)’이란 또 다른 난제를 풀어냈다.
과연 딥마인드는 ‘접혀 있던’ 단백질의 비밀을 활짝 펼칠 수 있을까? 이 질문에 “예”라고 대답할 수 있을 경우엔 코로나19 같은 인류의 재난을 막아내는 데도 큰 힘이 될 것 같다. 아직은 성급한 기대이긴 하지만.