아마존웹서비스(AWS), 마이크로소프트(MS), 구글 등 클라우드 기업의 경쟁이 심화되면서 단순히 가상환경으로 워크로드를 이전하는 것을 넘어 클라우드 환경에서 모든 워크로드를 처리하는 통합 업무환경을 제공하는 것에 집중하고 있다.
특히 자율주행, 실시간 위험분석, 예측모델 계산 등 인공지능(AI)과 기계학습(ML)을 활용한 서비스 경쟁이 치열해지고 있다.
마케팅 방식 역시 워크로드를 클라우드 환경에 이전하면서 발생하는 비용절감 효과 등을 알리는 대신 AI와 ML을 활용한 업무 자동화, 개발속도 향상, 신규 비즈니스 기회 창출, 기업문화 혁신을 강조하는 방향으로 전환했다.
AI와 ML은 4차 산업혁명 시대의 핵심 기술로 주목받는 만큼 이를 통해 각 클라우드 기업의 기술력을 알릴 수 있을 뿐 아니라 기존에 할 수 없었던 차별화된 서비스를 제공할 수 있기 때문이다.
대표적으로 AWS는 지난 2일부터 4일까지 진행한 AWS 리인벤트 2019현장에서 3시간에 걸쳐 진행된 앤디 재시 CEO의 기조강연에서 3분의 1에 달하는 1시간을 ML 관련 내용을 소개하며 중요하게 다뤘다.
특히 각 클라우드 기업은 기존 AI 전문 기업을 비롯해 비전문기업도 ML활용할 수 있는 서비스를 제공하며 ML 저변 확장에 나서고 있다. 현재 ML은 일부 전문가들만 사용할 수 있을 정도로 진입장벽이 높기 때문이다.
조사에 따르면 기업들 중 60%는 기업 의사결정에 ML을 활용할 필요가 있다고 생각하고 있지만, 실제 사용하고 있는 기업은 28%에 불과한 것으로 나타났다.
■ 텐서플로-TPU 등 기술력 내세운 구글
구글은 알파고를 공개하며 전세계에 AI의 능력을 알리며 AI 시장의 문을 열었다. 또한 현재 세계에서 가장 인기 있는 ML 프레임워크 중 하나인 텐서플로를 오픈소스로 공개하는 등 AI와 ML 분야를 주도하고 있다.
텐서플로는 AI 전문 개발자가 직업 ML 모델을 개발하고 배포할 수 있도록 지원하는 프레임워크다. 높은 성능과 확장성이 강점으로 세계에서 가장 높은 점유율을 가지고 있다.
구글은 AI 기술이 필요한 기업에서 더 쉽게 텐서플로를 쓸 수 있도록 '텐서플로 엔터프라이즈'라는 이름의 기업용 매니지드서비스를 지난달 출시하기도 했다.
이 기업은 텐서플로 등 전문 AI 기업을 위한 서비스뿐 아니라 '빅쿼리'와 '오토ML' 등 AI 관련 전문역량이 부족한 기업을 위한 서비스도 제공한다.
빅쿼리는 AI 기반의 기업용 분석 데이터웨어하우스다. 업체가 보유한 방대한 데이터를 빠르게 분석해 가치 있는 정보를 찾는데 특화된 서비스다. 이미 국내에서도 넷마블, 쏘카, 와이더플래닛 등이 활용하고 있다.
오토ML은 데이터만 넣으면 결과값을 바탕으로 적합한 AI모델을 찾아주는 솔루션이다. AI와 ML 역량이 부족한 기업도 이를 활용해 손쉽게 서비스에 활용할 수 있을 정도로 낮은 진입 장벽이 특징이다.
구글은 막대한 연산 처리를 위한 장비와 많은 시간이 소요되는 AI, ML의 특성에 맞춰 보다 빠르고 정확하게 연산할 수 있는 AI 전용 하드웨어 개발도 강하게 드라이브하고 있다. 텐서프로세싱유닛(TPU)가 대표 사례다.
TPU는 텐서플로 라이브러리로 작성된 코드의 실행과 연산에 최적화한 마이크로 칩으로 이를 활용해 기존 하드웨어 인프라에 비해 높은 AI 연산 성능을 자랑한다.
구글은 TPU를 클라우드 환경에서 서비스의 자원으로 제공하는 클라우드TPU를 서비스 중이다.
■ AWS, 세분화된 AI 서비스 지원
글로벌 클라우드 시장에서 가장 큰 점유율을 확보한 AWS도 AI와 ML 관련 서비스를 대거 선보이고 있다.
AWS는 직접 ML 모델을 제작해 사용하는 AI 전문 기업을 비롯해 관련 역량이 부족한 업체를 3단계로 나눠 모두 지원한다는 방침이다.
AWS의 AI 서비스 핵심은 세이지메이커다. 세이지 메이커는 기업이 ML로 신규 비즈니스를 창출하거나 비용을 절감할 수 있도록 학습 모델 생성과 훈련, 서비스 배포와 운영 등을 전반적인 ML 관련 지원 기능을 제공하는 플랫폼이다.
이 플랫폼은 AI 전문기업부터 AI를 처음 접하는 기업 모두를 포괄하기 위해 개발됐으며 원하는 기능만 사용할 수 있도록 세분화됐다.
주요 기능으로는 ML 모델을 구축한 경험이 없는 업체를 위해 자동으로 ML 모델을 구축하는 세이지메이커 오토파일럿을 비롯해 ML 개발 단계를 지원하기 위한 통합 개발환경을 세이지메이커 스튜디오, 클라우드 환경에서 GPU 기반 컴퓨팅 파워를 지원하는 아마존 엘라스틱 인퍼런스 등이 있다.
이 밖에도 효율적인 기계학습을 진행할 수 있도록 훈련 과정 추적 및 관리를 지원하는 세이지메이커 익스페리먼트, 불투명한 기계학습 훈련 과정을 추적해 훈련 과정을 최적화하거나 훈련 중 발생하는 문제를 경고하는 세이지메이커 디버거도 제공된다.
미리 ML을 적용해 고객사는 이를 사용하기만 하면 되는 서비스도 공개됐다. 켄드라는 방대한 비정형 데이터에서 필요한 정보를 쉽게 찾을 수 있도록 지원하는 엔터프라이즈 검색 서비스이며 코드그루는 소스코드를 자동으로 검토하고 분석해 버그나 오류를 메모리나 CPU 사용률이 높은 코드라인을 찾아 수정 또는 개선할 수 있는 방안을 제시하는 서비스다.
또한 온라인 결제사기, 가짜 계정 생성 등 사기성 온라인 활동을 식별하고 제한하는 프라우드 디텍터도 선보였다.
AWS는 AI 전문 기업을 위해 텐서플로를 비롯해 파이토치, MXNet 등 각 ML 프레임워크에 최적화된 하드웨어 인프라를 제공한다.
CPU, GPU, 메모리 등 모든 하드웨어가 각 프레임워크의 특성에 맞춰 최적화되어 기존 하드웨어 인프라에 비해 20% 성능 향상을 지원하는 것이 특징이다.
■ 오피스365와 접목한 MS의 애저 ML
MS 역시 기존 개발자가 아니더라도 Ml을 사용할 수 있도록 필요한 코딩 작업을 최소화하는 방안을 제공하는 등 편의성을 강조한 애저ML을 제공 중이다.
ML 모델 개발 플랫폼인 애저 ML 스튜디오는 AI 개발에 주로 사용하는 파이썬 또는 R 코드 등의 프로그래밍 언어를 사용할 수 있을 뿐 아니라 순서도를 그리듯 드래그앤 드롭으로 데이터를 연결하는 것 만으로도 간단하게 ML모델을 구축할 수 있는 디자이너 기능도 지원한다.
개발자가 복잡한 머신 비전과 학습 알고리즘을 직접 개발하지 않고도 사전에 마련된 ML/AI API를 제공하는 프로젝트 옥스포드(Project Oxford)와 ML 모델을 쉽게 관리하고 서비스 품질을 유지할 수 있도록 돕는 'ML옵스(MLOps)' 등도 제공하고 있다.
이 밖에도 MS는 클라우드 생산성 앱인 마이크로소프트365와 오피스 365 등에 AI 기술을 더해 업무에 적합한 디자인과 이미지를 자동으로 추천하는 등 업무 향상을 위한 서비스를 제공한다.
또한 MS는 엔비디아와 함께 애저 GPU 가속 슈퍼컴퓨터 NDv2를 공개했다. NDv2는 AI와 고성능 컴퓨팅(HPC) 앱을 처리하도록 설계돼 구글의 AI 언어모델인 버트(BERT)를 약 3시간 만에 학습을 마치는 등 높은 성능을 보유하고 있다.
NDv2는 현재 프리뷰 버전으로 이용 가능하며 8개의 엔비디아 V100 GPU를 사용하는 하나의 인스턴스를 클러스터링해 다양한 워크로드 수요에 맞게 확장할 수 있다.
관련기사
- MS, AI 신뢰 위해 블록체인 적용2019.12.15
- AWS, ‘세이지메이커 스튜디오’로 ML 문턱 낮췄다2019.12.15
- 구글클라우드, 텐서플로 매니지드서비스 출시2019.12.15
- "구글이 만든 텐서플로, AWS 위에서 쓰면 성능 더 좋아진다"2019.12.15
이 밖에도 HPE는 ML 모델 구축부터 배포까지 모든 과정을 통합 지원하는 HPE ML 옵스를 출시했으며 IBM도 왓슨을 활용해 헬스케어를 비롯해 챗봇 등에 도입하며 저변을 확대하고 있다.
AWS의 윤석찬 수석 테크 에반젤리스트는 "클라우드 기업이 AI와 ML에 주목하는 것은 클라우드가 주는 장점이 똑같이 적용되기 때문이다. AI로 클라우드에 쌓인 빅데이터를 활용해 분석하고 더 좋은 제품과 서비스를 만드는 데까지 기여할 수 있는 수단이다. 특히 ML은 소비자와 비즈니스를 위한 가치를 제공하는 새로운 역량을 제시할 수 있는 길을 열어주는 힘을 가지고 있다"며 "하지만 ML을 대규모로 운영하기 위해 해결해야하는 문제가 있는 만큼 이를 AWS가 해결하기 위해 세이지메이커 등 다양한 도구를 제공하고 있는 것이다"라고 설명했다.