한국전자통신연구원(ETRI, 원장 김명준)은 유전체 분석을 더욱 더 빠르게 할 수 있는 컴퓨팅 시스템 기술을 개발했다고 23일 밝혔다. 개인별 건강정보를 예측하거나 전염병 진단, 치료제 등을 개발하는 데 도움을 줄 전망이다.
ETRI는 유전체 분석에 특화한 메모리 중심 컴퓨팅 시스템을 개발했다. 이 기술은 기존 대비 28% 성능 향상을 이뤘다. 기존에 서비스 소요 시간이 10개월 가량 걸렸다면 이를 약 7개월로 단축할 수 있는 셈이다.
사람의 유전 정보를 해독하는 유전체 분석을 활용하면 개인별 질병 위험도, 영양과 운동 상호작용 등을 알 수 있다. 하지만 아직 분석 서비스를 대중화하기에는 검사 단가가 비싸고 처리하기 위한 데이터 양도 커서 분석과 저장에 많은 비용이 든다.
ETRI는 유전체를 분석하는 차세대 염기서열분석(NGS)에 특화한 메모리 중심 컴퓨팅 HW 및 SW 기술을 개발했다. 인간 DNA는 30억 개 염기들의 서열로 이뤄져 있다. 차세대 염기서열 분석을 사용하면 인간 DNA를 수십~수백 배수로 읽어 들여 분석하기 때문에 이동하고 저장해야 하는 데이터양이 매우 크다.
현재 유전체 분석은 주로 메모리를 제한적으로 사용하되 연산을 많이 하는 프로세서 중심 컴퓨팅 기술을 주로 쓴다. 하지만, 유전체 분석처럼 대용량 데이터를 처리할 때는 구조적으로 병목 현상이 일어나는 경우가 많아 데이터 처리에 시간과 노력이 많이 든다. 반면, ETRI의 메모리 중심 컴퓨팅 기술은 대규모 메모리를 활용해 병목 현상을 극복했다.
먼저, 연구진이 자체 개발한 MOCA라는 HW장치로 대규모 메모리를 시스템에 장착할 수 있게 만들었다. 데이터 처리 중간 과정에서 하드디스크나 SSD 등을 활용할 필요가 없게 만든 것이 핵심이다. 또, 연구진은 유전체 분석 과정 중 가장 오랜 시간이 걸리는 염기 서열 정렬 단계를 대규모 메모리를 활용해 2배 이상 빠르게 처리할 수 있는 SW도 개발해 분석 효율을 높였다.
ETRI는 GC녹십자지놈과 협력해 기술 성능도 검증했다. 그 결과, 기존 시스템에 연구진이 개발한 HW를 적용하면 전체 분석 성능을 16% 높일 수 있고 HW와 SW를 동시에 적용하면 28%까지 성능을 향상할 수 있음을 확인했다.
이 기술은 암 발병률, 태아의 장애 유무 등을 미리 알아보거나 전염병 변이 파악, 치료제 개발 등을 하기 위한 시스템에 적용할 수 있다. 분석 기관이나 제약회사는 서비스 개발비, 진단 시간을 낮추고 병원 등은 환자 맞춤형 협진 체계를 구축, 국민 건강 증진과 사회적 부담을 줄이는 데 도움이 될 전망이다.
연구진의 기술이 적용된 제품은 작년과 올해 미국에서 열린 SC(Supercomputing Conference) 전시회에서도 서버업체와 표준 솔루션 그룹들에게도 많은 관심을 받았다고 ETRI는 설명했다. ETRI 데이터중심컴퓨팅시스템연구실 김강호 실장은 “이번 기술이 국내 제약 분석 시장 및 산업에 새로운 촉진제가 됐으면 좋겠다"면서 "다양한 바이오 응용 시장 활성화 및 고용 효과가 클 것으로 예상한다"고 말했다.
향후 연구진은 내년부터 2단계로 시작하는 '메모리 중심 차세대 컴퓨팅 시스템 구조 연구'과제에서 시스템을 고도화하고 의료기관을 확대해 유전체 분석 정확도를 높이는 한편, 암이나 당뇨병 등 다른 질병에도 적용 범위를 확대할 계획이다.
이번 연구는 과학기술정보통신부 '메모리 중심 차세대 컴퓨팅 시스템 구조 연구' 과제 일환으로 진행됐다. 공동연구기관으로 KTNF, 테라텍, 컴퓨팅산업협회가 참여했고, 서강대학교와 클래스액트가 위탁연구로 도움을 줬다. 연구진은 성과와 관련해 국제전기전자공학회(IEEE)가 발간하는 세계적 학술지를 비롯해 논문 26편, 국내외 특허 12건 출원, 기술이전 2건을 진행했다.