최근 AI옵스(AIOps)라는 용어가 심심치 않게 들린다. 이는 ‘Artificial Intelligence for IT Operations’의 약어로 2014년 가트너 보고서에 처음 등장했다.
인공지능(AI)과 오퍼레이션(Operation)을 합성한 용어로 IT운영을 위한 AI를 뜻한다. 빅데이터와 기계학습(ML) 기술을 활용해 데이터를 분석하고 여기에 AI기술을 더해 운영에 적용함으로써 해결책을 제시하거나 방향을 제시한다는 것이다.
데이터센터가 가상화되고 고도화되면서 인프라가 증대되고 있다. 하지만 이를 효율적으로 운영하는 데에는 많은 어려움이 존재한다.
일례로 가상서버와 가상 네트워크를 구성해 운영하다 보면 확인이 쉽지 않다. 공유 리소스는 최적으로 구성됐는지, 집적도를 너무 높여 성능이 떨어졌는지 파악하기 어렵기 때문이다.
애플리케이션에 대한 플로우 정보들과 서비스의 흐름이 반드시 하드웨어의 성능만으로 보장되는 것도 아니다.
관리자 몇몇이 모여서 애플리케이션 분석과 인프라 운영에 대한 정책 그리고 네트워크와 시스템 리소스에 대한 상관관계를 분석하고, 적절한 판단을 내리기는 거의 불가능에 가깝다.
최근에는 AI 및 기계학습(ML) 기술을 이용해 애플리케이션을 실시간으로 분석하고 적용하고 있다.
사용율 곡선(Utilization Curve)을 워크로드 관점에서 봤을 때 애플리케이션의 레이턴시와 사용률 곡선은 상기 그래프와 같다. 특정 사용률까지 애플리케이션 레이턴시 증가율이 매우 낮게 진행되다가 특정 시점에 급격하게 늘어나는 것을 알 수 있다.
여기서 설명하는 특정 시점 바로 이전의 상태가 리소스 운영의 최적 상태라고 할 수 있다. 이를 원하는 상태(Desired State)라고 한다.
AI옵스는 각종 HW와 VM의 리소스를 통해 애플리케이션이 적절히 동작하는데 최적의 상태로 구성되어 있는지를 분석하고 더 나아가 애플리케이션 플로우 모니터링을 통해 애플리케이션 간 상관관계(ADM)를 분석한다.
이를 운영자 또는 관리자의 의도(Intend)와 비교하여 적절히 동작하고 있는지 또는 이상 동작하고 있지 않은지 등을 파악해 내며, 이를 기반으로 어떻게 조치해야 하는지도 알려준다.
관련 시장을 선도하고 있는 기업들은 IT운영환경을 최적의 환경으로 구성하고 운영할 수 있도록 다양한 방법을 제공하고 있다.
시스코는 네트워크 인사이트와 시스코 워크로드 최적화 매니저(CWOM), 테트레이션 애너리틱스와 같은 솔루션을 출시했다. 이 솔루션은 오랜 기간 시스코가 시장과 데이터센터에서 수집한 빅데이터를 기반으로 하며 AI/ML기술을 이용하여 실시간 분석 및 데이터센터 자동화를 가능하도록 한다.
에스넷시스템은 현재 개발 중인 오션(OCEAN 4.5)의 로드맵에 기존의 오토메이션과 오케스트레이션 기능 외에도 AI옵스 아키텍처를 반영하여 개발 중이다.
그동안 차세대 데이터센터 구축이나 클라우드 환경 구축 등 수많은 사업 등을 진행하며 AI옵스에 대한 고객들의 강력한 요구를 통감해왔다.
하지만 실제 입찰제안요청서(RFP)를 만들고, 사업화하는 과정에서 AI옵스까지 고민하여 적용된 사례는 많지 않다. 대부분의 사업이 서비스와 인프라 구축에 포커싱되어있기 때문이다.
관련기사
- 에스넷시스템, 200억원 규모 전환사채 발행2020.11.19
- 에스넷시스템, 120억원 규모 공군 IT 인프라 고도화 사업 수주2020.08.19
- 서울시, 4배 빠른 공공 와이파이 무료로 제공2020.10.26
- 에스넷시스템, 클라우드 인프라 구축 '클라우드 러너' 출시2020.05.18
하지만 가상화 환경이 점차 커지고 복잡해지면서 인프라 효율화나 적절한 투자를 통한 최적의 환경 구성도 점차 어려워질 것이다.
때문에 AI옵스가 시장에 주요 사업분야로 자리 잡게 될 것은 시간문제이다. IT에 종사하고 있다면 누구든 관심 있게 들여다봐야 할 이슈이며 우리의 역량을 집중해야 할 새로운 주요 기술 중 하나임이 틀림없을 것이다.
*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.