차세대 유전자 가위, AI로 안전하게 설계한다

연세대, 차세대 유전자 가위 '프라임 편집기' 효율 향상 원리 규명···AI 설계 모델 개발

과학입력 :2023/04/29 00:00    수정: 2023/04/29 20:47

차세대 유전자 가위 기술인 '프라임 편집기'를 정밀하고 안전하게 설계하는 인공지능(AI) 모델을 국내 연구진이 개발했다. 빅데이터 분석을 통해 프라임 편집의 효율이 결정되는 원리를 밝히고, 이를 바탕으로 편집 효율과 오류 위험성을 예측하는 AI 모델을 제시했다.

연세대학교 의과학과 김형범 교수 연구팀의 이 연구는 과학기술정보통신부 기초연구사업(리더연구 및 선도연구센터) 등의 지원으로 수행됐으며, 학술지 '셀(Cell)'에 29일(현지시간) 게재됐다.

프라임 편집기는 원하는 유전자 부위를 절단할뿐 아니라 절단 부위에 새로운 유전 정보를 넣어 교정할 수 있는 유전자 편집 기술이다. 돌연변이에 의해 변화된 DNA 염기서열을 수정할 수도 있다. 유전자 절단만 가능한 크리스퍼-카스9(CRISPR-Cas9)에 비해 진일보한 방식이다.

DNA 이중가닥을 완전히 자르지 않고 한 가닥만 자르기 때문에 기존 유전자 가위보다 안전하다.

크리스퍼 카스9 유전자 가위와 차세대 유전자 가위인 프라임 편집기의 유전자 교정 비교 (자료=과기정통부, 연세대)

하지만 새로운 유전정보를 포함하는 등 기존 유전자 가위보다 구조적으로 복잡하고 경우의 수도 다양하기 때문에, 정밀하고 안전한 유전자 가위 설계에 어려움이 있다. 또 이 기술을 임상 연구와 치료 목적으로 사용하려면 어떤 조건에서 오류 없이 최적의 유전자 교정이 일어나는지 정확히 파악해야 하므로 대규모 실험데이터 확보와 분석이 필수적이다.

연구팀은 2020년부터 프라임 편집기 데이터를 33만개 이상 확보, 각각의 프라임 편집기 효율을 실험적으로 측정했다. 이는 그동안 학계에 보고된 측정 데이터 중 가장 큰 규모이다.

연구팀은 측정 데이터를 분석해  프라임 편집기의 성능을 결정하는 주요 기전과 그 영향을 밝혔다. 프라임 편집 가이드 RNA의 주 구성요소인 '역전사 주형(RT template)'과 '프라이머 결합 부위(PBS)'의 길이가 어느 범위에서 높은 효율을 보이는지 찾아내는 등 프라임 편집 효율성 제고에 필요한 요소들을 찾았다.

프라임 편집 효율의 대량 측정 방법 및 효율을 결정하는 원리 규명. (A) 프라임 편집 효율을 대량으로 측정하기 위해, 유전자 가위 정보를 담고 있는 바이러스를 세포에 감염시킨 후 유전자 교정을 세포 안에서 유도했다. 각 유전자 가위에 고유한 바코드 정보가 함께 들어있기 때문에 각각의 유전자 가위에 대한 효율 분석이 가능했다. (B) 대량의 유전자 가위 효율 정보를 분석한 결과, 가이드 RNA의 일부 서열의 길이 등 다양한 요소들이 프라임 편집 효율을 결정하는데 중요한 영향을 미친다는 사실을 밝혀냈다. (자료=과기정통부, 연세대)

이에 따라 프라임 편집기를 설계할 때마다 매번 수 십~수 백개 이상의  편집기를 실험해봐야 하는 불편을 덜고, 빠르고 정확하게 프라임 편집기를 설계할 수 있다.

또 연구팀은 분석한 데이터로 인공지능을 학습시켜 교정을 원하는 유전자 서열정보 등을 입력하면 활용 가능한 프라임 편집기의 효율을 예측하는 모델을 만들었다. 하나의 유전자 교정에 대해 수 천개 이상의 프라임 편집기를 비교할 수 있다.

관련기사

이 모델은 프라임 편집기의 정밀성 및 안전성에 대해 세계 최고 수준의  예측 성능을 보인다고 연구진은 밝혔다. 세계 연구자들이 모델을 활용할 수 있도록 인터넷에 공개했다.

김형범 교수는 "지금까지 밝혀진 프라임 편집기의 모든 요소를 반영한 가장 뛰어난 예측 모델"이라며 "이제 프라임 편집기를 이용한 유전자 교정을 손쉽게 활용하게 되었다"라고 밝혔다.