우리나라에서 가장 많은 뉴스 소비가 일어나는 네이버. 네이버는 뉴스를 ▲뉴스 ▲연예 ▲스포츠 등 크게 세 분야로 나눠 서비스하고 있다. 각 분야마다 시간 별로 비슷한 트래픽 패턴을 보이고 있지만, 트래픽 스파이크가 나타날 땐 제각각이다. 갑작스럽게 치솟는 트래픽을 네이버는 어떻게 감당할까? 네이버가 자사 개발자 컨퍼런스인 데뷰 2020에서 뉴스 기사 서비스를 지탱하는 기술을 공개했다.
네이버 데뷰 두 번째 날인 26일, 오경식 네이버 미디어 테크 리더는 네이버 뉴스 운영 플랫폼인 '미디어 원'을 공개했다.
오경식 리더는 먼저 뉴스 서비스 트래픽 추이에 관해 설명했다. 그는 "평일 기준, 출근 시간이라고 할 수 있는 8시 정도에 트래픽이 상승한 후 점점 낮아지다가 퇴근시간 후에는 살짝 오르는 모습을 볼 수 있다"며 "그러나 각 분야마다 트래픽이 비정상적으로 튀는 스파이크 시점이 있다. 뉴스나 연예 분야의 경우 정치인이나 연예인 관련 큰 이슈가 있었을 때나 월드컵 경기 전후로 평시 대비 네 배에서 여덟 배 까지 상승한다"고 설명했다.
오 리더는 "동일한 트래픽이 발생한다고 하면 문제가 없지만, 스파이크 트래픽이 발생하면 물리적인 장비를 셋팅하는 작업 등이 필요할 수 있는데 빠르게 대응할 수 없으니 기술적으로 대비를 하거나 개선해야 할 점을 고민했다"며 "안정적인 운영을 위해 서비스 변화가 필요한 시점이라 생각했다"고 말했다.
뉴스와 연예, 스포츠 각각 서비스는 다르지만 외부 언론사로부터 기사를 전달받아 빠르고 안정적으로 전달하는게 주 역할이라는 목적을 이루기 위해서다.
그러나 언어, 프로그래밍, 아키텍처 등이 뉴스와 연예, 스포츠 분야별로 다르기 때문에 서비스 성능이나 안정성, 품질 기준이 다르고, 예상을 해서 대응하는 데 한계가 있었다.
네이버는 서비스 특성에 기반한 공통적 특징을 도출해 시스템 아키텍처를 재설계 하기로 했다. 평시 트래픽 추이와 피크 트래픽 시점이 다르기 때문에, 공용 풀 개념에 적합한 컨테이너가 필요했던 것이다.
오 리더는 "작년 말부터 미디어 원 플랫폼을 통해 뉴스, 연예, 스포츠 모두 하나의 플랫폼을 사용하고 있다"며 "특정 분야에 트래픽이 몰렸을 때도 문제가 없다"고 말했다.
네이버는 추후 지능형 사전 오토스케일링을 사용해 엄청난 트래픽이 유입되는 것을 미리 대비해 새로운 메트릭을 정의하고자 한다.
관련기사
- 네이버클라우드, AI컨텍센터 솔루션 '클로바 Ai콜' 출시2020.11.26
- 네이버 딥러닝 기반 이미지 변환 기술 어디까지 왔나?2020.11.26
- 문 대통령 만난 네이버·카카오…AI 기술로 국가 경쟁력↑2020.11.25
- 네이버, 라인·야후재팬 힘받아 일본 검색 시장 재도전2020.11.25
예를 들어 뉴스 속보 기사가 많아지는 것을 먼저 판단하거나, 연예 분야의 경우 인기 예능이나 드라마 종료 이후, 스포츠의 경우 주요 경기 중간이나 종료 이후를 대비해 미리 스케일아웃을 할 수 있다.
오 리더는 "지능형 사전 오토스케일링으로 트래픽이 실제 발생하기 전 사전 오토스케일아웃을 할 수 있다"며 "추후 머신 러닝을 통해 트래픽 예측과 결합해 고도화해 추가 리소스를 절감하거나 서비스 안정성 증가를 기대할 수 있다"고 설명했다.