클라우드 쓰기 힘든 유전자 분석, 해법은

바이오기업 마크로젠, 최신 IT소비 모델로 '일석이조' 효과

컴퓨팅입력 :2020/09/24 14:06    수정: 2020/09/24 16:36

유전자와 유전체 분석은 현대 의학분야에서 필수 영역으로 자리잡고 있다. 국내에도 여러 유전체 분석 전문기업이 새로운 질병에 대응하는 최첨단 정밀 의학 기술을 개발하며 두드러진 성과를 보이고 있다. 문제는 유전자 분석 연구의 토대인 IT시스템 고도화다. 클라우드를 쓰기 힘든 특성을 갖고 있어, IT시스템을 직접 보유해 수년 전 구축한 노후 장비로 최신 분석 업무를 수행하기 때문이다. 

2000년 한국바이오 벤처기업 최초로 코스닥에 상장한 유전체 분석 전문기업 마크로젠은 최근 유전체 분석 시스템의 하드웨어를 구독형 IT딜리버리 모델로 업그레이드해 주목받고 있다.

마크로젠은 새로 도입한 최신 유전체 분석 시스템을 지원하는 컴퓨팅 환경을 구축하면서  휴렛팩커드엔터프라이즈(HPE)의 구독형 딜리버리 모델 ‘그린레이크’ 서비스를 활용했다. HPE 그린레이크는 하드웨어를 고객사에 공급하면서, 사용량에 따라 비용을 과금하는 서비스다. HPE는 그린레이크 이용자에게 필요분과 여유분을 공급하고,  갑자기 증가하는 자원 수요에 빠르게 대응하게 한다. 이용자는 시스템 장비를 회사 내부에서 운영해 보안정책을 유지하면서도, 퍼블릭 클라우드처럼 비즈니스 민첩성과 효율성의 혜택을 누릴 수 있다.

신선호 마크로젠 전산부 부서장

신선호 마크로젠 전산부 부서장은 “마크로젠에서 가동하는 주요 시스템은 NovaSeq 6000, HiSeq X-Ten 등 최첨단 유전체 분석 장비이며, IT팀은 해당 장비에서 생성된 데이터를 저장하기 위한 스토리지와 유전자해독(bioinformatics) 분석을 위한 컴퓨팅 환경을 최적화하려 했다”며 ”특히 비즈니스 및 연구 환경에 따라 시스템 가동률의 변동폭이 크고, 이에 따라 민첩하고 유연한 IT 환경을 마련해야하는 과제를 안고 있었다”고 시스템 업그레이드 배경을 설명했다.

그는 “IT 자산화를 통해 시스템 사용이 1년 중 약 3개월에 집중돼 있는 것을 발견했다”며 “시스템 가동률의 변동폭에 대한 사전 대비 및 시스템 증설을 민첩하게 진행해야하는데 반해, 가동률이 낮은 시기에 오버프로비저닝에 따른 비용을 최소화해야하는 서로 상충되는 과제를 동시에 해결해야하는 어려움이 있었다”고 덧붙였다.

마크로젠은 1997년 설립된 이래 153개국 1만8천여 고객을 보유하고 있다. 유전체 정보, 의료정보, 생활 의료정보 통합 빅데이터 등으로 정밀의학 분야를 선도한다는 비전을 갖고 있다. 마크로젠의 유전체 분석 역량은 글로벌 5위 수준이다. 매일 방대한 양의 데이터를 분석해야 하는데, 빅데이터의 효율적인 저장과 분석 최적화는 사업 성패를 가르는 중요 요소다.

마크로젠에 의하면, 다양한 의료 데이터 분석 작업은 주로 1년 중 연말 전후 3개월에 집중되는 경향을 보인다.  분석 작업이 집중되는 기간동안 시스템 자원 활용을 극대화하면서도, 상대적으로 적은 작업을 수행하는 기간의 자원 가동 효율성을 높이고자 했다.

신선호 부서장은 “HPE 그린레이크 서비스는 시스템 사용량에 따른 과금 체계를 제공하는 IT 소비 모델로, 시스템 가동률에 따라 빠른 용량 증설이 가능하며, 반대로 사용률이 낮은 경우 용량을 다시 낮출 수 있는 유연한 IT 구매 환경을 제공한다”며 “계약 기간 동안 약정된 기준 단가에 따라 구매가 가능해 새로운 시스템 발주 및 설치에 요구되는 소요시간을 대폭 줄일 수 있었다”고 밝혔다.

또 “해당 솔루션에 HPE 데이터센터케어(Datacenter Care)란 전담 지원팀의 유지보수 서비스가 기본 포함돼, 장애 감지 시스템인 IRS를 통하 장애 모니터링 및 지원을 실시간으로 받을 수 있었다”며 “나아가 그린레이크 구매 시 기본 제공되는 소비 분석 포털(Consumption Analytics Portal)을 활용해 실시간으로 사용량에 따른 비용을 확인할 수 있어서, 직관적이고 투명한 관리를 할 수 있다”고 덧붙였다.

오늘날 IT 소비 모델의 큰 흐름은 클라우드 활용이다. 특히 퍼블릭 클라우드 채택이 다양한 산업에서 빠르게 확산되고 있다. 특별이벤트 등 특정 기간 동안 폭증하는 작업을 수행할 때 퍼블릭 클라우드의 이용 가치가 커진다. 그런 와중에 마크로젠은 퍼블릭 클라우드 대신 하드웨어를 사내에 구비하는 전략을 유지했다.

이에 신선호 부서장은 “대부문의  의료 연구 데이터는 기밀, 보안 등의 정보기 때문에 퍼블릭 클라우드 대신 온프레미스 환경에 그대로 유지해야 한다”며 “해당 시스템을 HPE 그린레이크 서비스를 통해 클라우드와 같은 환경으로 조성함으로써, 퍼블릭 클라우드의 장점과 온프레미스 환경의 장점을 동시에 누릴 수 있는 최적의 환경을 마련했다”고 설명했다..

유전체 분석은 연구용과 임상 시험용 등 여러 측면에서 사용된다. 특히 임상 시험 데이터의 경우 개인정보 수준의 민감성을 갖기 때문에 퍼블릭 클라우드 같은 외부 설비에 저장할 수 없다. 이같은 보안 문제에 유전체 분석 기업은 시스템 효율성 확보에 어려움을 겪게 된다. 마크로젠이 HPE 그린레이크를 선택한 결정적 이유 중 하나다.

또 다른 이유도 있다. 바로 유전체 분석 업무의 가동시간이다.

신 부서장은 “순간적으로 많은 IT인프라를 써서 단기간에 많은 데이터를 한번만 뽑아내는 게 클라우드의 강점이지만, 유전체 분석은 24시간 돌아가는 시스템”이라며 “클라우드를 쓰게 되면 너무 많은 비용을 유발해 감당하기 어렵다”고 말했다.

그는 “24시간 내내 시스템을 돌려야 고객에게 적기에 결과를 전달할 수 있기 때문에 기밀성 측면 외에도 비용 문제가 매우 크다”며 “클라우드는 장비를 켜놓기만 해도 돈이 나가는 것이므로, 비용 싸움에서 온프레미스 환경을 이길 수 없다”고 덧붙였다.

HPE 그린레이크는 IT 인프라를 순환경제로 접근해 수명주기를 관리한다.

HPE 그린레이크를 활용한 마크로젠 내부의 만족도는 매우 높다. 사용량 기반 과금, 빠른 증설, 장애 자동 대응, 투명한 자원 관리 등이 높은 만족도를 보이게 한 이유로 꼽힌다.

신 부서장은 “쓰면 쓸수록 잘한 선택이라  느낀다”며 “특히, 기본 서비스인 데이터센터케어로 HPE의 전담팀이 장애를 자동으로 포착해서 마크로젠에 알려줌으로써 전산부의 업무부담이 확 줄어든 게 가장 마음에 든다”고 말했다.

그는 “서버들이 인프라 부서별로 할당되어 있는 상황인데, 소비 분석 포털을 통해 한 눈에 부서별 사용 현황과 비용을 확인하고 비교할 수 있다”며 “또한, 원하는 방식으로 보고서를 생성해서 뽑아볼 수 있고, 메일링을 걸어 놓으면 지정된 날짜에 보고서 파일이 특정 수신인에게 자등으로 전달되므로 내부 보고를 수월하게 할 수 있다는 점도 큰 장점”이라고 덧붙였다.

마크로젠은 단순 유전체 분석뿐 아니라 빅데이터를 구축해 사람의 질병을 예측, 예방하고, 그에 맞춰 정밀한 의료를 제공하겠다는 목표를 실현하려 달려가고 있다. 2009년 세계 5번째 인간 게놈분석을 완료하고, 한국인 표준 유전체 지도를 완성한 성과가 그 시작이었다.

관련기사

마크로젠은 2009년 세계에서 네번째 개인 유전체 분석 결과이자, 최초의 북방계 아시아인 유전체 분석 결과를 내놨었다. 2016년 기존 국제 표준 유전체의 한계를 극복하고 미래 정밀의학에 적용 가능한 아시아인 표준 유전체를 구축하는 연구 성과를 달성하기도 했다. 2009년부터 북방계 아시아인을 중심으로 하는 ‘아시안 10,000 게놈 프로젝트’를 추진해 왔으며, 최근에 아시아 19개국이 아시아인 10만 명의 유전체 정보를 분석하는 ‘게놈 아시아 100K 이니셔티브’에 주도적으로 참여했다. 2019년 동북아시아 사상 최대 규모의 참조 유전체 DB인 ‘유전체의학(Genome Medicine)'을 발표하고, 게놈 아시아 100K 연구 성과가 네이처 표지논문으로 채택됐다.

신선호 부서장은 “블록체인 기반 데이터 공유 및 유통 기술, 다양한 임상실험을 연이어 성공시키며 획득한 특허와 국내외 활발한 업무협약 체결을 통해 전 사업영역에 있어 견고한 성장세를 그리고 있다”며 “마크로젠은 앞으로도 지속적인 연구와 국제협력을 통한 사업 성장을 통해 45억 아시아인을 위한 정밀의학 실현에 앞장설 계획"이라고 말했다.