40G 랙스위치, 데이터센터 풍경 바꾼다

일반입력 :2012/07/27 08:25    수정: 2012/07/27 08:33

데이터센터 톱오브랙스위치(TOR, 이하 랙스위치) 시장에 40기가비트(Gb) 이더넷 스위치가 연이어 출시되고 있다. 막 피어나려 하는 40G 스위치 시장 승자에 관심이 모이고 있다. 데이터센터 전체로 보면 랙스위치가 큰 의미로 보이지 않는다. 하지만 랙스위치는 데이터센터 풍경 전체를 바꾸고 있는 IT 인프라 세계의 중심에 서있다.

최근 외신에 따르면, IBM은 40G 이더넷 랙스위치 제품을 새로 출시했다. 이에 더불어 포스10을 인수해 올해부터 본격적으로 시장에 뛰어든 델 역시 랙스위치 중심의 네트워크 사업을 노리고 있다.

IBM, 델 등은 서버로 시작한 회사. 이전까지 네트워크 전문업체들과 협력했지만, 이 관계는 IBM의 블레이드네트웍스, 델의 포스10 인수 후 급변하고 있다.

HP에 이어 IBM, 델 등 서버업체의 시장 진입과 함게 네트워크 장비 시장은 미래를 알 수 없는 상황이다. 여기에 랙스위치 영역은 멜라녹스, 인텔 등 네트워크 인터페이스 카드(NIC), 통신 프로세서를 생산해온 업체들까지 스위치 사업을 강화하면서 더 치열한 경쟁 양상을 보이고 있다.

■IBM, 시스코, 40G 랙스위치 시동

IBM이 내놓은 랙스위치 G8316은 40G이더넷을 지원하는 스위치다. 엣지 네트워크에서도 10G로 만족하지 못하는 고객들을 공략지점으로 한다.

G8316 스위치는 16개 40G 포트를 보유한다. 각 포트당 레이턴시는 1마이크로초 미만이다. 1U섀시는 1초에 9억6천만 패킷을 처리할 수 있다. 이 스위치는 논블로킹 스위치 스루풋이 1.28Tbps다.

IBM은 이 스위치의 ASIC은 공개하지 않았다. 하지만 랙스위치 시장에서 혜성처럼 등장해 저지연시간(Low Latancy) 스위치 돌풍을 일으킨 아리스타네트웍스와 유사한 ASIC을 사용하는 것으로 추정된다. 아리스타의 랙스위치는 브로드컴에서 생산하는 트리덴트+ ASIC을 사용한다.

트리덴트+ ASIC은 프로세서 안정성이나 기능은 부족하지만, 패킷 처리 속도에 집중한다. 이로 인해 기존 스토어 앤드 포워드(Store Ans Forword) 방식 대신 컷 스루(Cut Throw) 방식의 스위칭을 가능하게 한다. 가격도 매우 저렴해 장비 가격이 대폭 낮아진다.

스토어앤드포워드 스위칭은 패킷이 들어올 때 저장하고 데이터 CRC를 검증한 뒤 통과시킨다. 저장과 판독, 판정, 통과 순의 프로세스가 각 데이터마다 이뤄지게 된다. 트래픽 안정성은 보장할 수 있지만, 이 절차를 반복하는 과정에서 처리용량을 초과해 장비 전체가 불통상태에 빠진다.

컷스루 스위칭은 들어오는 데이터의 목적지만 파악하고 바로 통과시킨다. 데이터 크기가 아무리 크더라도 판독과 판정 절차가 없기 때문에 속도가 획기적으로 빨라지며, 나노초 단위기 때문에 울트라로레이턴시(ULL)라 부를 정도다. 컷스루 스위칭은 데이터 처리 속도에만 집중하게 하는 이점을 제공한다. 때문에 아무리 ASIC 품질이 나쁘다 해도 크게 문제 되지 않는다.

아리스타는 이 컷스루스위칭을 이용한 로레이턴시 스위치로 돌풍을 일으켰는데, 2010년 IBM 역시 브로드컴의 트리덴트+ ASIC을 적용한 랙스위치 GS8264를 출시했었다.

랙스위치에 많이 사용되고 있는 옵티컬 케이블이 활용되며 40G QSFP+포트SK 10G SFP+ 포트 모두를 혼용할 수 있다.

40G 이더넷 스위치에 대해 시스코는 지난 5월부터 넥서스 7000과 5000 시리즈의 40G모듈을 내놨다.

■수직-수평, 랙스위치의 진화

데이터센터의 구성요소 중 가장 투자가 집중되는 부분은 서버와 스토리지다. 애플리케이션과 데이터가 자리하는 영역이기 때문이다. 이들을 연결하는 네트워크 역시 중요하다.

데이터센터 네트워크는 수직방향과 수평방향으로 흐른다. 랙스위치는 서버의 스위치를 모아 상위계층으로 올리는 곳에 위치한다. 아랫단의 스위치를 하나로 모아 백본 네트워크로 전달하는 역할을 한다. 랙 상단에 있기 때문에 TOR이라 불린다.

그동안 데이터센터 랙 하나에 장착되는 서버들은 1G~10G 랙스위치를 사용해왔다. 여러 스위치를 모으는 역할이므로 더 큰 스루풋 성능이 요구된다. 서버 스위치가 1G에서 10G 중심으로 흐르면 랙스위치의 대역폭 역시 더 커져야 한다.

이전까지 네트워크는 남북 방향의 통신만 소화하면 됐다. 하지만 하나의 서비스라도 여러 서버 애플리케이션을 결합해내는 구조로 가면서 서버와 서버 간 통신 즉 수평 방향의 통신이 더 많아졌다. 랙스위치는 기존 하위 서버 통신뿐 아니라 서버-서버 간 통신도 감당해야 한다. 랙스위치의 용량이 더 커져야 하는 또 다른 이유다.

IT인프라가 점차 대형화 되면서 TOR에서 발전한 형태가 나오게 된다. 서버랙 열의 한켠에 대형의 집선 스위치 랙을 따로 두는 형태다. 때문에 엔드오브랙(EOR)이라 부른다.

EOR스위치는 각 서버의 스위치를 한 곳에 집중하는 대형 랙스위치다. 시스코의 넥서스7000이 EOR의 일종이며, 델의 포스10 장비 중 대형 제품이 EOR로서 넥서스7000과 비교된다.

■“40G? 지금 그게 문제인가?”

40G 네트워크가 확산되는 또다른 이유는 서버와 스토리지 사이의 통신 방식이다. 과거 외장형 스토리지는 파이버채널(FC) SAN 방식의 통신 방법을 사용했다. 하지만 서버가 늘면 스토리지와 서버를 연결하는 케이블은 3개씩 늘어난다.

여기에 NAS, iSCSI, FCoE 활용이 늘어나면서 하나의 이더넷 케이블이 감당해야 하는 트래픽은 더 늘었다.

더 큰 문제는 가상화다. 서버 가상화를 인해 물리적인 컴퓨팅 인프라는 경계가 사라진 지 오래다. 가상의 서버(VM)가 어느 하드웨어에 자리잡고 있는지도 확실치 않다. 더는 서버 랙의 열이 의미없어지는 상황. 결과적으로 TOR이든 EOR이든 전과 같은 유형의 스위치 아키텍처로 대응하기 어려워졌다.

그러면서 네트워크 장비업체들은 기존의 스위치 아키텍처를 대대적으로 바꾸게 된다. 그것이 네트워크 패브릭 구조다. 랙스위치에 담겨있던 각종 제어기능을 대형 컨트롤러에 집약하고, 랙스위치 자체는 컨트롤러에 모든 트래픽을 보내는 역할만 한다. 이렇게 되면 수직, 수평 트래픽 모두가 중앙 컨트롤러 한곳에서 처리된다.

시스코 넥서스의 유니파이드 패브릭, 브로케이드 VCS 패브릭, 주니퍼네트웍스의 큐패브릭이 이런 형태다. 또한, 최근 이슈화되는 오픈플로와 소프트웨어정의네트워크(SDN)는 앞선 패브릭 구조를 오픈소스 기반으로 만드는 작업이다.

이같은 변화에 대응하기 위해 네트워크 입장에서 가장 쉬운 방법은 대역폭을 늘리는 것이다. 1G-10G-40G-100G로 대폭 확대하는 식으로 길을 넓히면 될 거라 보기 때문이다.

그럼에도 최근 네트워크업체들의 고민은 따로 있다. 바이트수가 큰 데이터를 소화하는 것보다, 작은 크기의 데이터가 한번에 쉼없이 몰려오는 경우다. 카카오톡, 라인 등 메신저 애플리케이션, 혹은 빅데이터 분석 시스템처럼 매우 작은 크기지만 양과 쿼리 횟수가 엄청나게 많은 상황이다.

이렇게 되면 대역폭 확충만으로 버티기 어렵다. 데이터센터 아키텍처 전반을 수정해야 해법을 찾을 수 있다. 데이터 분할에 대한 고민과, 로레이턴시 스위치의 부상, 패브릭 등은 기업들이 겪는 대규모 데이터센터의 현재와 맞닿아 있다.

시스코는 IBM과 같은 기업들의 네트워크 제품은 클라우드 환경과 빅데이터 처리에서 명확한 대안을 내놓지 못한다고 지적한다. 랙스위치 대역폭 확대보다, 스위칭 방식을 바꾸지 않은 상태로 접근하고 있다는 것이다.

관련기사

시스코코리아 관계자는 “IBM이나 델에 비해 시스코, 주니퍼, 브로케이드 정도가 데이터센터에서 벌어지는 네트워크 이슈를 다 수용해서 가고 있다”라며 “여기에 멜라녹스, 아리스타가 기존과 다른 로레이턴시 랙스위치로 접근하고 있으며, 인텔도 하반기부터 이 시장에 뛰어든다”라고 말했다.

이 관계자는 “수만대 규모의 서버 환경에서 기존의 TOR 구조를 유지하면 랙스위치만 수천대가 필요하다”라며 “때문에 클라우드 컴퓨팅에서 TOR을 없애고 플러그앤플러그로 가거나 블레이드 서버를 쓰겠다는 게 현재 추세”라고 설명했다.