생명공학의 새 시대 연「게놈 프로젝트」를 주도하는 오픈 소스 HPC

일반입력 :2006/12/01 15:55

이향선

인간 게놈 지도가 발표되면서 생명공학은 새로운 도약의 시대를 맞게 되었다. 이에 따라 유전자 정보의 산업화가 가속되고 있으며, 이 유전자 정보의 근간인 생명정보학에 대한 연구도 활발히 진행되고 있다. 이 생명정보의 연구에는 HPC(High Performance Computing)가 필요하며, 오픈 소스가 그 핵심 역할을 톡톡히 해내고 있다. 현대의 바이오 기술은 수천 년의 역사를 가진 전통적인 발효나 식물 육종의 기술과 구별해 유전자 조작을 중심으로 하는 새로운 기술이다. 이를 의학적으로 유용한 기술과 소재를 개발하는 것이 바이오 산업이며, 이 산업의 연구 결과물은 호환성•정확성•안정성이 요구된다. 따라서 현재와 같은 속도 경쟁시대에는 BT와 IT의 접목이 필수이다.BT에 가장 적절하게 접목되는 오픈 소스생명정보 분석시스템을 구축하여 게놈 프로젝트를 자체 수행하고 있는 한국폴리텍 바이오대학의 바이오 생명정보과의 추동원 교수는 “생물학적 각종 자료에 대한 체계적인 데이터베이스 구축과 다양한 생물학 정보 분석용 소프트웨어를 활용해 핵산과 아미노산 서열로부터 유용한 정보를 찾아내는데 IT가 중요한 역할을 한다.”고 말했다.이 대학의 생명정보 분석시스템은 게놈지도를 발표했던 미국의 셀레라 사와 일본 교토대학 화학연구소를 모델로 1년간의 철저한 조사과정을 거쳐 2006년 초 시스템 개발과 장비 도입이 완료되었다. 이 시스템은 생명 정보 분석을 위한 대용량 서버와 핵산과 단백질 서열 분석을 통한 유용한 정보를 얻기 위해 사용되는 워크스테이션, 목적 유전자를 단시간에 증폭시킬 수 장치인 PCR이 하나의 인프라로 연결돼 있다. 즉 BT와 IT가 융합된 시스템으로 주된 IT 기술에 오픈 소스가 적용되었다.생명정보분석 소프트웨어의 핵심은 BLAST(Basic Local Alignment Search Tool)로 생물정보에서 핵산의 구성 성분의 데이터베이스와 단백질 데이터베이스의 신속한 검색을 통해 상호 연관성을 비교하거나 DNA의 유사성을 탐지하는데 필요하다. 이 툴은 리눅스와 호환성이 뛰어나며, 다른 플랫폼과 비교해 결과 추출 속도가 빠르다고 한다.또한 유전체간의 상동성(기능이나 외관이 다를지라도, 그 발생 또는 그들의 계통발생적 기원)이 동일한 관계를 가지는 구조)을 분석하기 위해서는 유전체 서열의 핵산과 단백질 수준에서 비교 생물 정보를 효과적으로 확인할 수 있는 데이터가 생성된다. 이때 검색에 사용할 BLAST 데이터베이스로 MySQL이 이용된다. 그리고 결과를 일목요연하게 도표나 그래픽으로 볼 수 있게 웹 기반으로 제공할 수 있는 브라우징 인터페이스도 공개SW 기반이다. 추 교수는 “유전자 하나를 구성하는 염기는 수십만 개에 이른다. 때문에 기존 방식으로는 대용량 결과물을 추출하기가 어렵다. PC나 단일 서버 환경에서 운용할 경우 1개월 이상 소요된다. 염기서열 분석은 속도가 요구된다. 그것이 미생물의 산업적 이용의 성공을 좌우한다”며, 이런 문제를 해결하기 위해 리눅스 기반의 고성능 컴퓨터(HPC) 시스템을 구축하게 됐다고 밝혔다. 또한 게놈 프로젝트 수행을 위한 분석과 데이터베이스 구축을 위해 생물정보분석 전문 벤처기업인 스몰소프트가 개발한 8개의 유전정보분석 패키지를 구입했다. 해외 솔루션으로 시스템을 구축할 경우 30억원 이상이 소요되겠지만 국산 제품으로 시스템을 구성해 구축 비용을 크게 절감시킬 수 있었다고 강조했다. 게놈프로젝트 확장의 기틀 마련이번에 구축된 시스템은 타 연구기관의 시스템에 견주어 고성능과 안정성이 높다고 추교수는 자신한다. 이를 계기로 바이오대학은 자체 또는 위탁으로 게놈 프로젝트를 수행할 수 있는 하드웨어와 소프트웨어 인프라를 마련, 게놈 프로젝트 전반에 대한 학생 교육과 전문 인력을 배출할 수 있는 환경이 조성됐다고 한다. 또한 연구 결과물을 3-4일 이내에 추출할 수 있어 바이오대학은 산학연 제휴를 확대해 여러 기관에서 이 시스템을 이용할 수 있도록 문호를 개방했다. 현재 10여 개 기업체가 이를 이용하고 있다. 추 교수는 이를 바탕으로 앞으로 진핵 또는 원핵 생물에 대한 게놈 프로젝트를 수행하고 국내외의 게놈 프로젝트 또는 생명 정보관련 프로젝트에 주도적으로 참여할 계획이다. 또한 국내외 게놈 프로젝트를 수행하는 업체 또는 기관과의 제휴를 통한 대용량 분석 시스템을 지원하고 농수산물 또는 그 가공품의 생산 이력관리 시스템을 추가로 구축할 것이라고 말했다. 한국소프트웨어진흥원의 유영민 원장은 “오픈 소스가 차세대 첨단 산업인 BT 분야에서도 성공적으로 도입되어 이제 오픈 소스는 첨단 분야에서 주요한 인프라를 구성하는 기술로 자리 잡아갈 것이다”고 강조했다.@