세계 최대 그리드 LHC,「빅뱅의 비밀」푼다

일반입력 :2005/11/28 10:43

Steve Ranger

우주의 암흑 물질, 다차원, 빅뱅(Big Bang)에 따른 조건이 무엇이었을지 세계 최대 컴퓨터 그리드(grid)의 도움으로 궁금증이 풀릴 것으로 보인다. LHC 컴퓨팅 그리드 프로젝트가 풀어가는 해답의 길을 좇아가보자. 스위스 제네바 근교에 위치한 유럽 입자 물리 연구소(CERN)에 건설중인 강입자 가속기(Large Hadron Collider; LHC)는 지구상에서 가장 큰 과학 장비로, 매년 이 장비가 쏟아내는 15페타바이트(petabytes)의 데이터를 처리하기 위해선 엄청난 성능의 컴퓨팅이 필요하게 될 것이다.LHC는 양성자와 이온을 서로 충돌시키며, 이를 통해 과학자들이 물질의 구조를 이해하는 데 도움을 줄 것이다.LHC 컴퓨팅 그리드 프로젝트 본격 가동새로운 형태의 입자를 발견하려면 실험에서 생성될 엄청난 양의 데이터를 통계적으로 분석해야만 가능한데, 바로 이런 것이 LHC 컴퓨팅 그리드 프로젝트가 하고 있는 일이다.LHC는 2007년이나 돼야 가동에 들어가게 되지만 그리드에서는 이미 작업이 시작됐다. 영국은 이 그리드의 최대 기여 국가 중 하나이다.전세계 150개의 그리드 사이트 중 18개가 영국에 있다. 영국 내에서 이뤄지는 작업의 상당 부분은 잉글랜드 옥스포드셔에 위치한 러더포드 애플튼 연구소(Rutherford Appleton Laboratory; RAL)에서 이루어지고 있다.RAL의 CCLRC(Council for the Central Laboratory of the Research Councils) 이-사이언스 센터(e-Science Centre)의 부소장인 존 고든은 필요한 처리 규모 때문에 그리드가 최상의 방법이라고 설명하며 "컴퓨팅은 수년에 걸쳐 계획됐다. 우리는 오랜 시간에 걸쳐 분산 컴퓨팅을 고려해왔다"고 말했다.그는 "세계 전역에 데이터를 뿌리고 다시 그 결과를 수집하는 대형 분산 컴퓨팅은 문제가 크다는 걸 알기 때문에 CERN에서 모든 컴퓨팅을 다할 순 없을 것이다. LHC 컴퓨팅 그리드 프로젝트는 실제 동작중인 세계 최대의 그리드"라고 말했다.이 그리드는 4-티어(tier) 모델을 사용할 것이다. 데이터는 '티어-0' 센터인 CERN에서 테이프에 저장된다. 거기에서 데이터는 처리되기 위해 저장 공간과 처리 능력을 갖고 있는 티어-1 사이트로 분산된다. 이 사이트에서는 데이터를 가공해 특정 작업을 수행할 수 있는 티어-2에서 이용할 수 있도록 한다. 그리고 나서 과학자 개개인은 로컬 클러스터나 각자의 PC 같은 티어-3 사이트로부터 데이터를 액세스할 수 있다.RAL은 티어-2 사이트를 운영하는 랑카스터(Lancaster) 대학, 에딘버러(Edinburgh) 대학, 임페리얼 공대(Imperial College)와 함께 영국의 티어-1 사이트를 호스팅하고 있다.2007년이 돼야 실제 데이터가 오가게지만 과학자들은 이미 시뮬레이션에 많은 처리 능력을 사용하고 있다. 고든은 "과학자들은 자신들이 찾고 있는 것이 무엇인지 알 필요가 있으며, 따라서 시뮬레이션을 많이 진행하고 있다"고 말했다.오픈소스 형태의 그리드로 데이터 송수신쉽게 구할 수 있는 일반 컴퓨터 하드웨어와 오픈소스 소프트웨어는 비용 절감을 위해 사용되고 있다. 고든은 "전세계적인 그리드이기 때문에 우리 모두는 오픈소스를 고려하고 있다"며 "모든 그리드 관련 내용은 오픈소스 형태로 진행되며, 그렇게 하는 건 당연하다. 그리드는 표준 프로토콜을 사용해야 하며, 그리드는 관리 도메인을 가로지른다"고 말했다.네트워크 대역폭도 중요한 사항이 될 것이다. 현재 CERN에서는 그리드 전용으로 2Gbps를 연결해두고 있다. RAL이 사용하는 대역폭도 동일하며 RAL이 쓰는 인터넷 트래픽을 제외하고 나머지 모두를 사용하고 있다. 현재 계획은 사이트들 간에 전용 광통신 네트워크를 구축하는 것이다.고든은 "우리가 염두해 두고 있는 것은 티어-1 사이트 간의 사설 광통신망을 만드는 것"이라고 말했다.고든에 따르면, 실험에서 생성될 엄청난 양의 파일을 관리하는 것이 연구팀이 해결해야할 또다른 문제라고 한다. 고든은 "파일 수백만 개가 결과로 나올 것이고 그걸 어떻게 조작할 것인지 그리고 데이터 관리는 어디서 할 것인지가 문제이다. 즉 데이터 관리가 핵심"이라고 말했다.하지만 이런 흥미로운 기술은 다 접어두고서라도 이런 작업을 나눠 맡기 위해 다른 조직들을 설득하는 게 훨씬 더 큰 일이 될 것이다. 고든은 "설득한다는 것이 상당 부분은 사회적인 일이다. 모두 다함께 서로의 컴퓨터를 연결함으로서 이점이 있음을 설득한다고 하자. 그건 협력의 문제이다. 런던에 있는 사람이 전세계에 퍼져있는 컴퓨터를 사용하는 게 아니다. 많은 사람들이 동일한 문제에 대해 함께 작업하는 것이다"라고 말했다.@