구글 딥마인드가 유전자 정보를 예측하는 인공지능(AI) 모델을 공개했다. DNA 글자 100만 개를 한 번에 분석할 수 있는 등 기존 모델과 차별화된 기능을 갖췄다.
딥마인드는 26일 공식 블로그를 통해 AI 기반 DNA 서열 분석 모델 '알파지놈(AlphaGenome)'을 연구용 API 형태로 공개했다고 밝혔다. 누구나 비상업적으로 해당 모델을 이용할 수 있다.
알파지놈은 DNA 글자 100만 개를 읽고 각 염기 수준에서 정밀하게 예측할 수 있다. 긴 서열을 높은 해상도로 분석할 수 있어 멀리 떨어진 유전자 조절 영역까지 해석할 수 있다. 딥마인드가 해당 모델에 컨볼루션과 트랜스포머 구조를 탑재해 가능한 기능이다.

또 유전자가 언제, 어디서, 얼마나 작동하는지 나타내는 다양한 조절 정보를 예측할 수 있다. 변이 서열과 원래 서열의 차이를 빠르게 비교해 유전 변이가 미치는 영향을 1초 안에 평가하는 기능도 갖췄다.
RNA가 잘리는 접합부까지 직접 예측할 수 있어, 스플라이싱 오류로 생기는 희귀 질환 분석에도 활용 가능하다.

딥마인드는 이 모델이 24개 예측 과제 중 22개에서 기존 최고 모델보다 높은 성능을 기록했다고 밝혔다. 조절 효과 예측 과제에서는 26개 중 24개에서 최상위 성능을 보였다고 설명했다.
이 모델은 기존 '엔포머(Enformer)' 기반으로 작동한다. 이용자는 단백질 코딩 영역에 특화된 '알파미스센스(AlphaMissense)'와 모델을 함께 사용할 수 있다. 이에 유전체 98%를 차지하는 비코딩 영역까지 분석할 수 있어 희귀 질환 연구에 활용 가능하다.
모델 학습에는 ENCODE, GTEx, FANTOM5 등 대규모 유전체 데이터가 사용됐다. 사람과 생쥐의 다양한 조직과 세포 데이터도 포함됐다.
관련기사
- "지메일만 있으면 돼"…구글, '제미나이 CLI' 에이전트 공개2025.06.25
- "AI·데이터 누구나 쉽게"…스노우플레이크, AI 에이전트 전략 강화2025.06.24
- 크라우드웍스, '기업용 AI 역량 진단 서비스' 출시2025.06.26
- [Q&AI] 서울 지하철 5호선 방화 사건 총 정리2025.06.25
딥마인드는 "알파지놈은 유전자 조절 과정을 전반적으로 이해할 수 있도록 학습됐다"며 "연구자들은 자신만의 데이터에 맞게 모델을 조정해 사용할 수 있다"고 설명했다.
미국 메모리얼 슬로언 케터링 암센터 케일럽 라로우 박사는 "긴 문맥, 염기 단위 정밀도, 다양한 유전체 분석을 한 번에 처리할 수 있는 첫 모델"이라며 "복잡한 유전 정보의 활용 가능성을 넓혀줄 것"이라고 말했다.