AI가 단백질과 약물의 궁합을 예측해 신약 개발 판도를 바꾼다

신약 하나를 개발하는 데 평균 10년 이상, 수조 원의 비용이 든다. 그 긴 여정의 출발점은 수천 개의 약물 후보 중 단 하나의 '궁합 맞는 분자'를 찾아내는 일이다. 바이트댄스(ByteDance)가 개발한 AI 기반 신약 개발 툴킷 '펠리스(Felis)'가 이 난제에 정면으로 도전장을 내밀었다. 43개 단백질 표적과 859개 리간드(약물 후보 물질)를 대상으로 한 대규모 벤치마크에서 기존 최고 수준의 방법론과 동등한 성능을 입증하며, 신약 개발의 새로운 가능성을 제시했다.

약값이 비싼 이유, 단백질-약물 궁합 맞추기가 너무 어렵기 때문

신약 개발 과정에서 가장 중요한 단계 중 하나는 약물 후보 물질이 질병을 일으키는 단백질에 얼마나 잘 결합하는지를 예측하는 것이다. 마치 자물쇠와 열쇠의 관계처럼, 약물 분자가 표적 단백질에 딱 맞아야 효과를 발휘할 수 있다. 그런데 이 '궁합'을 실험실에서 일일이 확인하려면 막대한 비용과 시간이 든다. 수천 개의 후보 중 실제로 효과가 있는 것은 극소수에 불과하다.

이 문제를 해결하기 위해 컴퓨터 시뮬레이션을 활용한 '자유 에너지 섭동(FEP)' 방법이 등장했다. 이 방법은 물리학 법칙에 기반해 약물과 단백질의 결합력을 계산한다. 그중에서도 '상대 결합 자유 에너지(RBFE)' 방식은 구조가 비슷한 약물들 간의 결합력 차이를 비교하는 데 효과적이어서 현재 제약 업계에서 널리 쓰인다. 실제로 대규모 벤치마크 연구에서 RBFE는 약 1 kcal/mol의 정확도를 달성했는데, 이는 실험 오차 범위인 0.67 kcal/mol에 근접한 수준이다.

하지만 RBFE에는 치명적인 한계가 있다. 구조가 비슷한 약물들끼리만 비교할 수 있다는 점이다. 완전히 새로운 구조의 약물, 즉 '스캐폴드 호핑(scaffold hopping)'이 필요한 경우에는 적용하기 어렵다. 이는 마치 같은 브랜드의 자동차 모델들 간 성능 비교는 가능하지만, 자동차와 비행기를 비교하기는 어려운 것과 같다.

펠리스의 혁신, 구조 제약 없이 모든 약물 후보를 독립 평가

펠리스가 채택한 '절대 결합 자유 에너지(ABFE)' 방식은 이러한 구조적 제약에서 자유롭다. 각 약물 후보를 독립적으로 평가하기 때문에, 구조가 전혀 다른 약물들도 동일한 기준으로 비교할 수 있다. 이는 초기 신약 발굴 단계에서 특히 유용하다. 수천 개의 다양한 구조를 가진 화합물 라이브러리를 스크리닝할 때, 구조적 유사성에 구애받지 않고 가장 유망한 후보를 골라낼 수 있기 때문이다.

ABFE의 작동 원리는 다음과 같다. 먼저 약물 분자가 물속에 녹아 있는 상태에서 '사라지는' 과정의 에너지 변화를 계산한다. 그다음 단백질 결합 부위에서 약물이 '나타나는' 과정의 에너지 변화를 계산한다. 이 두 값의 차이가 바로 결합 자유 에너지다. 이 과정에서 '연금술적 변환(alchemical transformation)'이라는 기법을 사용하는데, 실제로는 불가능한 분자의 점진적 소멸과 생성을 컴퓨터 시뮬레이션으로 구현한다.

그러나 ABFE는 이론적으로는 우수하지만 실용화에 어려움이 있었다. 계산량이 너무 많고, 복잡한 설정이 필요하며, 대규모 검증 데이터가 부족했다. 예를 들어 슈뢰딩거(Schrödinger)사의 FEP+ ABFE는 단 8개 단백질 표적에서만 검증됐는데, 이는 RBFE 벤치마크에 비해 현저히 적은 규모다.

859개 약물 후보로 검증, RBFE와 동등한 성능 입증

펠리스 연구팀은 이러한 한계를 극복하기 위해 완전 자동화된 파이프라인을 구축했다. 사용자가 단백질 구조와 약물 분자 정보만 입력하면, 시스템 준비부터 시뮬레이션 실행, 결과 분석까지 모든 과정이 자동으로 진행된다. 특히 '보레쉬 스타일 구속(Boresch-style restraints)'이라는 기법을 사용해 약물 분자가 시뮬레이션 중 단백질 결합 부위에서 이탈하는 것을 방지한다. 이는 마치 약물 분자에 보이지 않는 스프링을 연결해 적절한 위치에 머물게 하는 것과 같다.

연구팀은 펠리스를 43개 단백질 표적과 859개 리간드로 구성된 대규모 데이터셋으로 테스트했다. 이는 기존 ABFE 벤치마크 중 가장 큰 규모다. 중요한 점은 모든 예측이 '제로샷(zero-shot)' 방식으로 수행됐다는 것이다. 즉, 각 시스템에 맞춘 특별한 조정 없이, 사전에 학습된 힘장(force field) 파라미터만으로 예측했다. 이는 실제 신약 개발 환경에서 새로운 표적에 즉시 적용 가능함을 의미한다.

펠리스는 이 테스트에서 최신 RBFE 방법과 비슷한 순위 예측 성능을 보였다. 약물 후보들의 결합력 순위를 얼마나 정확하게 맞추는지를 측정하는 '켄달 타우(Kendall's tau)' 지표에서 양호한 결과를 얻었다. 또한 계산 수렴성도 우수했는데, 이는 시뮬레이션 시간을 충분히 주면 안정적인 결과를 얻을 수 있음을 의미한다.

KRAS(G12D) 같은 난제도 돌파, 고전하 약물 예측 성공

연구팀은 더 어려운 테스트로 KRAS(G12D) 단백질 데이터셋을 선택했다. KRAS는 암 발생과 관련된 중요한 표적인데, 특히 G12D 변이는 치료가 어렵기로 악명 높다. 이 데이터셋의 약물 후보들은 크기가 크고 전하량이 높아서, 열역학적 샘플링이 매우 까다롭다. 마치 큰 짐을 좁은 문으로 옮기는 것처럼, 시뮬레이션에서 이러한 분자들의 움직임을 정확히 추적하기 어렵다.

그럼에도 펠리스는 이 도전적인 데이터셋에서도 안정적인 수렴성과 순위 예측 성능을 보였다. 이는 펠리스가 단순히 쉬운 경우에만 작동하는 것이 아니라, 실제 신약 개발에서 마주칠 수 있는 복잡한 상황에도 대응할 수 있음을 시사한다. 연구팀은 이 모든 예측을 역시 제로샷 방식으로 수행했으며, 힘장 파라미터나 연금술적 스케줄을 시스템별로 조정하지 않았다.

펠리스는 단백질에는 AMBER ff14SB 힘장을, 약물과 보조인자에는 바이트댄스가 이전에 개발한 데이터 기반 분자역학 힘장인 바이트FF(ByteFF)를 사용했다. 바이트FF는 더 광범위한 양자화학 데이터셋으로 학습돼 화학 공간의 커버리지가 향상됐다. 비결합 파라미터(전하 및 반데르발스 상호작용)는 GAFF2와 동일하게 유지하면서, 결합 파라미터만 개선한 것이 특징이다.

신약 개발의 패러다임 전환 가능성, 실험실에서 컴퓨터로

펠리스의 등장은 신약 개발 워크플로우에 중요한 변화를 예고한다. 기존에는 구조가 비슷한 약물들을 최적화하는 '리드 최적화(lead optimization)' 단계에서만 계산 방법이 주로 쓰였다. 그러나 ABFE가 실용화되면, 초기 '히트 발굴(hit discovery)' 단계부터 컴퓨터 시뮬레이션을 활용할 수 있는 길이 열릴 수 있다. 이는 실험실에서 수천 개의 화합물을 일일이 테스트하는 대신, 컴퓨터로 먼저 유망한 후보를 추려낸 뒤 소수만 실험하는 방식으로 전환할 수 있다는 희망을 준다.

현재 신약 하나를 개발하는 데 평균 10년 이상, 수조 원의 비용이 든다. 만약 초기 단계에서 실패할 후보를 미리 걸러낼 수 있다면, 이 비용과 시간을 크게 단축할 수 있다는 긍정적인 전망이 나온다. 물론 이는 아직 연구 단계의 가능성이며, 실제 임상 적용까지는 추가 검증이 필요하다.

펠리스는 오픈소스로 공개돼 누구나 사용할 수 있다. 이는 대형 제약사뿐 아니라 자원이 부족한 중소 바이오텍 기업이나 학계 연구자들도 최신 계산 도구를 활용할 수 있게 한다. 또한 자동화된 파이프라인 덕분에 전문적인 계산화학 지식이 없어도 사용할 수 있어, 접근성이 크게 향상됐다. 향후 펠리스는 더 다양한 단백질 표적과 약물 화학 공간으로 검증 범위를 확대하고, 기계학습 기반 힘장과의 결합, 더 효율적인 샘플링 알고리즘 도입 등을 통해 계산 속도와 정확도를 더욱 개선해 나갈 것으로 기대된다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. ABFE와 RBFE의 차이는 무엇이며, 왜 ABFE가 더 유용한가요?

A. RBFE는 구조가 비슷한 두 약물의 결합력 차이를 비교하는 방식으로, 같은 계열의 약물 최적화에 유용합니다. 반면 ABFE는 각 약물을 독립적으로 평가해 구조가 전혀 다른 약물들도 비교할 수 있어, 초기 신약 발굴 단계에서 더 넓은 화학 공간을 탐색할 수 있습니다.

Q2. 펠리스가 신약 개발에 어떤 희망을 줄 수 있나요?

A. 펠리스는 컴퓨터 시뮬레이션으로 수천 개의 약물 후보 중 유망한 것만 미리 선별해, 실험실 테스트 횟수를 줄일 수 있는 가능성을 제시합니다. 아직 연구 단계이지만, 신약 개발의 초기 단계를 크게 효율화할 수 있다는 기대를 모으고 있습니다.

Q3. 제로샷 예측이란 무엇이며 왜 중요한가요?

A. 제로샷 예측은 새로운 시스템에 대해 별도의 조정 없이 즉시 예측하는 것을 의미합니다. 이는 실제 신약 개발에서 아직 연구되지 않은 새로운 표적 단백질에 바로 적용할 수 있어, 시간과 전문 인력이 부족한 환경에서도 활용 가능하다는 장점이 있습니다.

기사에 인용된 논문 원문은 arXiv에서 확인할 수 있다.