세계 최대 규모 인간 유전 정보를 담은 '1000 게놈 프로젝트' 결과물이 클라우드 컴퓨팅 서비스를 통해 공개됐다.
29일(현지시간) 미국 지디넷에 따르면, 아마존웹서비스(AWS)와 미국 국립보건원(NIH)는 완성된 '1000 게놈 프로젝트‘ 결과를 일반에 공개했다.
이 발표는 백악관이 개최한 빅데이터 서밋에서 이뤄졌다. 이로써 세계 최대 규모의 인간 유전정보가 클라우드 환경으로 제공되게 됐다.
AWS가 공개한 정보의 용량만 200테라바이트에 달하며, 1천700명으로부터 수집된 DNA 시퀀스를 바탕으로 산출된 결과다.
이 프로젝트는 인간 게놈 목록을 작성하기 위해 75개 기업과 조직들이 참여한 국제 연구기관에서 수행됐다. 2008년 1월 영국, 미국, 중국이 합작해 다양한 인종으로 구성된 인간 1천명의 유전체를 해독하는 프로젝트다.
많은 사람의 유전체를 한꺼번에 해석해 변이체학의 기초로 삼기 위해 시작됐다. 이 프로젝트는 향후 26개 인종으로 인간 2천600명의 유전체 정보를 포함할 계획이다. NIH는 AWS에 샘플을 계속 추가한다.
관련기사
- 인간 DNA를 이미지 데이터로 환산한 용량은?2012.03.30
- 인류가 축적한 정보량과 인간 DNA 비교하니2012.03.30
- 인체 단백질 비밀, 한국 클라우드가 푼다2012.03.30
- KT 클라우드, 개인 유전체 분석 작업에 활용2012.03.30
발표문에서 NIH의 프로그램 디렉터인 리사 D. 브룩스 박사는 “AWS 데이터는 시간을 절약해줄 것이다”라며 “1000 게놈 프로젝트는 그전까지 정부 서버에서 다운로드 받거나, 디스크에 담겼었다”라며 클라우드를 통해 공개한 이유를 설명했다.
AWS의 게놈 데이터는 아마존 S3와 엘라스틱 블록스토어에 저장된다. 이 데이터는 아마존 EC2와 엘라스틱 맵리듀스 서비스를 이용해 응용할 수 있다. 아마존은 “공개 데이터의 접속은 무료지만, 연구자들이 컴퓨팅 자원을 사용할 때는 사용료를 지불해야 한다”고 밝혔다.