SK텔레콤이 오픈스택을 주목하는 이유

일반입력 :2014/12/23 10:58

데이터센터는 IT인프라를 담아두기 위한 그릇이다. 하지만 최근엔 데이터센터 자체를 거대한 컴퓨터로 바라보는 시각이 많다. 데이터센터 안에 있는 자원들이 단순히 연결되는 게 아니고 서로 통합돼 거대한 컴퓨터 역할을 하게 되면, 복잡성을 줄일 수 있다는 것이다.

관련 업계는 이같은 흐름을 웨어하우스 스케일 컴퓨터(Warehouse-scale Computer: WSC)라고 표현하기 시작했다.

데이터센터가 하나의 거대한 컴퓨터라면 핵심 기술은 무엇이 될까? 최근들어 오픈소스 기반 클라우드 플랫폼인 오픈스택에 대한 관심이 고조되는 분위기다. 유명 업체들의 오픈스택 생태계 참여가 급물살을 타는 양상이다. 데이터센터에서 오픈스택이 갖는 위상이 상승하고 있음을 보여준다. SK텔레콤도 최근 오픈스택을 주목하는 회사 중 하나다.

최근 SK텔레콤이 개최한 T오픈랩 개발자포럼에서 SK텔레콤 IT기술원 김진철 매니저는 오픈스택이 데이터센터를 하나의 거대한 컴퓨터로 만들어줄 핵심 소프트웨어로 자리잡고 있다고 강조했다.

오픈스택은 오픈소스 클라우드 컴퓨팅 플랫폼을 만들기 위한 시도로 시작됐다. 여러 기업들이 생태계에 뛰어들며 140여 개국의 1만7천 여명 개발자와 엔지니어들이 참여하고 있는 글로벌 프로젝트로 성장했다.

김진철 매니저는 오픈스택이 단순히 오픈소스 클라우드 플랫폼을 넘어 최근에는 데이터센터 전반의 워크로드를 커버하는 SW 인프라스트럭처로 발전하고 있다고 설명했다. 오픈스택의 특성이 WSC를 구현할 때 발생하는 기술적인 문제를 풀어줄 수 있다는 것이었다.

■ 확장성 있는 데이터센터 자원 관리

운영체제 커널이 하는 핵심 역할은 자원 관리다. 오픈스택은 데이터센터 자원을 가상화해 확장성을 갖도록 관리할 수 있게 해준다는 게 김 매니저의 설명이다.

오픈스택이 인프라 자원을 관리하는 방식은 계층적 자원 스케줄링으로 요약된다. 서버 한대에선 리눅스 스케줄러가 자원을 관리하지만 서버가 여러개로 랙을 이루게 되면 별도의 '노바'(Nova) 스케줄러가 리눅스 스케줄러와 함께 가상머신 관리를 하는 구조다.

서버 랙이 모인 클러스터 환경에선 오픈스택에 있는 '히트'(Heat) 오케스트레이터를 통해 자원을 관리한다. 오픈스택에서 컴퓨팅 부분을 담당하는 '노바', 스토리지 기능인 스위프트(Swift)에도 이같은 기능이 추가됐다. 이렇게 오픈스택은 데이터센터 전반에 걸쳐 계층적 자원 스케줄링이 가능한 구조를 갖추고 있다는게 김 매니저 설명이다.

김진철 매니저가 계층적 자원 스케줄링이 중요하다고 언급 한 것은 성능 및 안정성과 직결되기 때문이다.

“실제 가상환경에서 3계층 웹플랫폼을 프로비저닝한다고 했을 때, 로드밸런서, 웹서버, 데이터베이스가 각각 하나의 호스트에 올라간다면 3대 중 한 대라도 장애가 발생했을 때 웹 플랫폼은 동작할 수 없게 됩니다. 하지만 웹 플랫폼 자체를 스케줄링해서 노드에 프로비저닝 할 때 이 프로비저닝 하려는 가상머신이 웹 플랫폼이라고 인지하고 로드밸런스를 서로 다른 노드에 배치시키고 웹 서버도 서로 다른 노드에 배치시키면 장애에 강한 형태로 운영될 수 있습니다.”

오픈스택 세계에선 이같은 작업은 안티어피너티 (Anti-Affinity) 스케줄링으로 불리운다. 자동화된 스케줄링이라고 할 수 있다.

■ 분산된 가상 라우터 도입으로 네트워크 확장성 확보

김진철 매니저는 또 최신 오픈스택 버전 '주노'에서부터 디스트리뷰티드 버추얼 라우터(Distributed virtual Router)가 도입되면서 웨어하우스 스케일 컴퓨터에서 요구되는 네트워크 확장성을 오픈스택이 만족시키게 됐다고 설명했다.

디스트리뷰티드 버추얼 라우터가 도입되지 않은 주노 이전 버전의 경우 서로 다른 곳에 있는 가상 머신 끼리 통신하기 위해선 반드시 뉴트론(Neutron) 네트워크 노드를 거쳐야 했다. 그리고 뉴트론 네트워크 노드는 병목지점이라는 지적을 받아왔다.

그러나 주노부터는 뉴트론 네트워크 노드에 있던 L3에이전트(라우터 역할을 했던) 자체를 컴퓨팅 노드에 분산시키면서 컴퓨터 노드에 있는 오픈V스위치가 라우터 역할을 같이 하게돼 부하가 분산되고 네트워크가 훨씬 확장성 있는 구조로 바뀌게 됐다는 설명이다.

■ 지능적인 데이터센터 운영을 위한 데이터 분석

김진철 매니저는 “자원관리를 위해 데이터를 수집하고 분석해서 보다 지능적인 운영을 할 수 있게 해주는 서비스를 제공한다는 점에서 충분히 오픈스택이 코어로써 역할을 수행할 것이라고 본다”고 강조했다.

거대한 데이터센터가 하나의 컴퓨터처럼 동작하게 하려면, 각 서버 요소들이 뿜어내고 있는 로그데이터나 운영 데이터를 아주 효과적으로 처리하지 않으면 불가능하기 때문에 지능적 운영이 필요하다는 게 그의 설명이다.

전통적인 데이터센터 구조에서 네트워크가 트리구조로 구성돼 있을 때 네트워크 계층을 올라가면 올라갈 수록 패킷양이 많아지고 분석해야 하는 데이터가 많아진다.

WSC에서 가장 많이 쓰이는 '팻트리토폴로지(Fat tree topology)'에선 백본으로 갈 수록 수렴되는 데이터의 양이 기하급수적으로 증가하게 된다. 데이터센터를 지능적으로 운영하기 위해서도 빅데이터 처리가 필요할 수 밖에 없는 상황이다.

관련기사

오픈스택은 이런 운영데이터를 수집하기 위해 실로미터(Ceilometer)라는 소프트웨어를 제공하고 실로미터 자체도 이벤트버스를 통한 확장성 있는 구조를 채택해서 오퍼레이션 인텔리전스에 대한 요구사항을 충족하고 있다.

김진철 매니저는 마지막으로 “웨어하우스 스케일 컴퓨터 시대에 오픈스택은 리눅스와 같은 오픈소스 오퍼레이팅 시스템 커널로써 역할을 하게 될 것이고 이런 시대를 준비하기 위해 오픈스택 역량을 갖추는 것이 IT종사자들에게 점점 중요한 이슈가 될 것”이라고 말했다.