5G시대 시작과 함께 산업 전반에서 인공지능(AI), 빅데이터 등 데이터 기반 클라우드 기술은 4차 산업혁명 시대 경쟁 우위를 점하기 위한 필수적인 기술로 자리 잡고 있다.
더불어 코로나19로 인해 비대면이 화두로 떠오르자 공공과 금융, 교육, 제조, 통신 등 다양한 산업군에서 클라우드 도입에 적극 나서는 추세다. 이제 클라우드 서비스는 디지털 혁신을 위한 기본 인프라로 자리매김하고 있다.
전 방위에서 급증하는 클라우드 서비스 수요와 함께 자연스럽게 기하급수적으로 늘어나는 데이터 트래픽과 지연시간(레이턴시) 단축은 클라우드 기업에서 해결해야 할 가장 큰 도전이 됐다.
네이버 클라우드는 이러한 도전을 프로그래머블반도체(FPGA)를 활용한 스마트네트워크인터페이스카드(스마트닉, SmartNIC)로 극복에 나섰다.
현재 네이버클라우드의 신경수 엔지니어는 FPGA와 스마트닉을 통해 기존 보다 최대 20배 이상 트래픽의 감당할 수 있으며 레이턴시 역시 2~3배 가까이 단축할 수 있을 것이라고 밝혔다.
신경수 엔지니어는 “국내에서 네이버클라우드만 FPGA가 적용된 서버를 제공하고 있는 것으로 알고 있다”며 “아마존웹서비스(AWS), 마이크로소프트 등 글로벌 선두기업의 서비스를 국내 고객사에도 제공하기 위해 최선을 다하겠다”고 말했다.
다음은 신경수 엔지니어와의 일문일답.
Q. 먼저 FPGA에 대해 소개 부탁한다.
FPGA는 프로그램이 가능한 비메모리 반도체의 일종이다. 기존에 소프트웨어로 처리하던 일부 기능을 입력해 엣지 환경에서 빠르게 처리할 수 있다. 일반적인 주문형 반도체(ASIC)와 달리 언제든 알고리즘 수정 또는 스펙으로 인한 업데이트가 가능한 것이 특징이다.
클라우드 서비스는 고객의 산업 특성이나 서비스 환경에 따라 업데이트나 기능 추가에 대한 요구사항이 많다. 한 달에만 몇백 건 이상의 요청이 온다. 그런 요구에 맞춰 서비스를 제공하기 위해 선택하게 됐다.
FPGA는 어떤 프로그램을 입력하느냐에 따라 다양한 분야에 활용할 수 있다. 우리는 우선적으로 네트워크 가상화 가속을 위해 사용하고 있는 중이다.
마이크로소프트의 경우 비디오 트랜스코딩이나 빙의 검색 기능에 FPGA를 도입해 속도와 효율을 높였다. 바이두는 데이터베이스와 쿼리 부분에 적용하기도 했다.
Q.FPGA를 활용한 스마트닉은 무엇인가?
스마트닉은 FPGA가 적용된 네트워크 인터페이스 카드다. 5G 시대가 되면서 지연시간을 최소화하는 것이 중요해지고 있다. 서버에서 대규모 패킷을 서버에 저장하고 관련 소프트웨어로 처리하려면 많은 과정을 거쳐야 하는 만큼 지연시간이 발생한다.
스마트닉은 이러한 과정을 없애고 하드웨어에서 바로 처리해 지연시간을 줄인다. 내부 테스트 결과에 따르면 128바이트 기준 스몰패킷의 경우 20~25배 정도 스루풋(PPS)를 증대할 수 있다.
한 번에 서버가 처리할 수 있는 데이터 트래픽의 양도 끌어올릴 수 있다. 기존 서버의 경우 트래픽 용량이 10G~40G 정도다. 반면 스마트닉을 활용하면 100~200G 수준까지 끌어올릴 수 있다.
트래픽양이 늘어난 만큼 10~20대 서버로 분산하지 않아도 안정적인 서비스와 응답시간을 제공할 수 있는 것이다. 또한 기존 서버의 경우 분산 구조라도 일부 서버로 트래픽이 몰려 효율이 떨어질 수 있다는 점에서 안정성도 더욱 높다고 할 수 있다.
더불어 상대적으로 적은 서버를 활용하는 만큼 같은 성능 대비 비용 절감과 파워 세이빙 효과도 볼 수 있다.
Q. 현재 스마트닉을 사용 중인 사례가 있는 지 궁금하다.
네이버 클라우드에서 제공하는 서비스는 클래식과 가상프라이빗클라우드(VPC)로 나뉜다. 이중 VPC에는 모두 스마트닉이 탑재돼 있다. 금용 관련 기업은 모두 VPC를 사용하고 최근 민간 클라우드에도 제공 중이다.
Q. 해외 클라우드 기업도 관련 서비스를 사용 중인가?
주요 클라우드 기업은 이미 적극적으로 활용 중이다. 마이크로소프트는 2011년부터 스마트닉 개발을 진행하고 애저에 도입하고 있다.
아마존웹서비스(AWS)는 자체 설계한 니트로 카드를 지난 2019년 발표하고, 별도 전용 인스턴스를 공개했다. AWS 발표에 따르면 이전 인스턴스 대비 3배 이상 높은 성능을 제공한다.
Q. 네이버 클라우드만의 차별화된 서비스가 있다면?
고객이 원하는 상품에 빠르게 대응할 수 있다는 점에서 가장 차별화가 된다고 본다.
솔직히 말해 AWS나 마이크로소프트 등 선두 기업이 주도하는 트렌드를 앞서거나 새로운 방향을 제시하긴 어렵다. 대신 트렌드를 따라서 기술력을 축적하며 고객사가 원하는 기능이나 요구사항을 바로 만들어 제공한다는 점에선 차별화가 된다고 본다.
서비스 운영도 지원한다. 개발을 담당한 개발자가 운영을 더욱 잘할 수 있을 뿐 아니라 고객사에 해당 서비스 관련 인력이 충분하지 않은 경우가 많기 때문이다. 고객사에서 문제가 있다고 연락을 주기 전에 먼저 문제를 파악하고 즉각적으로 처리하려 하고 있다.
Q. 스마트닉을 적용하며 어려웠던 부분도 있었을 것 같다.
국내에 관련 프로젝트 사례와 인력을 찾을 수 없다는 점이 가장 컸다.
FPGA를 설계하려면 소프트웨어와 하드웨어를 결합하는 기술이 요구된다. 하지만 국내에선 둘 중 한 분야만 집중에서 가르치고 배우기 때문에 적합한 인재를 찾기 어려웠다.
FPGA는 수천 대 이상의 서버에 설치될 것이기 때문에 이를 중앙에서 처리하기 위한 소프트웨어를 비롯해 설치 후 서버에서 문제가 발생했을 때 바로 감지하고 문제를 해결할 수 있는 방안도 마련했어야 했다.
국내는 우리가 첫 사례이기 때문에 하드웨어 제작부터 운영을 위한 소프트웨어까지 모두 우리가 직접 만들어야 했다. 특히 수많은 하드웨어 장비에서 패킷 디버깅 플로우를 찾아내는 것은 쉬운 작업이 아니었다.
Q. 앞으로의 목표가 있다면?
네트워크 가상화를 위한 스마트닉에 이어서 FPGA를 활용한 컴퓨팅 가상화도 고려하고 있다. 컴퓨팅 가상화 서비스를 사용했을 때 물리적 장비와 구분가지 않는 수준의 성능을 제공하는 것을 1차 목표로 삼고 있다.
국내에 FPGA 개발자가 많지 않은 만큼 관련 개발자를 양성할 수 있는 상품을 만들어 보는 것도 고민 중이다. 사용자가 직접 원하는 기능이나 서비스를 설계하고 구축할 수 있는 가상화된 FPGA 환경을 제공하는 것이다. AWS 등에서 아마존 EC2 F1 인스턴스 서비스와 같은 FaaS(FPGA as a Servic)라는 이름으로 상품을 제공하고 있다.
이런 서비스를 고민한 것은 점점 반도체 개발 인력이 줄어들고 있기 때문이다. 이러한 원인은 반도체 제작의 경우 일반적으로 경험하기 힘들기 때문이라고 본다. 그래서 가상화 서비스가 제공되면 학교나 교육기관에서 보다 쉽게 반도체를 배울 수 있고 진입 장벽을 낮출 수 있지 않을까 생각한다.
관련기사
- 농협은행, 은행권 최초 퍼블릭 클라우드 도입2020.10.30
- 네이버클라우드, 메디오피아테크와 연성대·군산대 LMS 구축 지원2020.10.20
- 네이버클라우드, 함께 클 'SaaS 기업' 육성 프로그램 진행2020.10.16
- 포티투마루 “네이버 클라우드 협업툴로 업무 혁신”2020.01.29
또한 반도체에 관심이 있는 학생이나 구직자라면 기존 제조업 외에도 세계적으로 급성장하고 있는 클라우드에도 관심을 가질 수 있을 것으로 기대한다.
네이버클라우드는 FPGA를 비롯해 고객에게 더 큰 가치를 제공하기 위해 다양한 기술을 내재화 하고 확장성을 높여 나가고 있다. 앞으로도 고객사게 필요로 하는 기능을 제공할 수 있도록 최선을 다하겠다.