클라우드는 왜 'AI 전쟁'의 핵심 변수가 됐나

모든 서비스와 제품에 인공지능(AI)이 접목되고 있다. 이런 추세라면, ’AI 에브리웨어’ 시대도 머지 않아 보인다. AI에 대한 관심이 커지면서, 클라우드컴퓨팅이 새삼 주목받고 있다. 클라우드가 AI 구현에 필수적인 머신러닝 툴을 이용할 수는 플랫폼이 됐기 때문이다.

글로벌 클라우드 빅3 업체인 아마존웹서비스(AWS), 마이크로소프트(MS), 구글은 경쟁적으로 AI 기능을 제공하고 있다. 최근 클라우드 업체들은 일반 개발자들도 누구나 쉽게 머신러닝 기술을 자신의 애플리케이션에 적용할 수 있도록 지원하는데 집중하고 있다. 예컨대 AWS를 이용하면, 아마존 에코에 적용된 AI 음성인식 애플리케이션프로그래밍인터페이스(API)를 가져다 자신의 앱에 적용할 수 있다.

지금까지 AI 기술들은 관련 박사학위자를 영입하지 않으면 구현하기 어려웠다. 클라우드가 AI 대중화를 이끌고 있는 셈이다. AI를 서비스에 적용하고 싶은 기업들 입장에선 어느 클라우드 업체가 더 뛰어난 성능의 머신러닝 API를 제공하느냐도 클라우드를 선택하는 데 중요한 요인이 됐다.

이에, 지디넷코리아는 오는 12일 서울 잠실 롯데호텔 3층 크리스탈볼룸에서 ‘제14회 ACC’ 행사를 개최하고, 지능형 컴퓨팅 기술 발전과 기업의 실질적인 성과로 연결된 혁신 및 지속 가능한 성장 사례를 함께 공유할 예정이다. (☞ ACC 행사 페이지 바로가기)

이날 아마존, MS, 구글 3개 업체의 클라우드 기반 머신러닝 기술도 소개될 예정이다. MS 김환태 수석이 ‘지금 바로 업무에 적용할 수 있는 예측 모델 개발 및 데이터 분석 방안’을, AWS 정우진 이사가 ‘아마존의 AI 혁신과 아마존 AI 서비스’에 대해, 구글 조대협 기술리더가 ‘머신러닝 시스템 아키텍쳐에 대한 접근’이란 주제로 발표한다.

■AWS “에코 같은 음성서비스 만들고 싶다면 오라”

AWS의 머신러닝 공세는 지난해 말부터 시작됐다. 앤디 재시는 AWS 최고경영자(CEO)는 지난 12월 30일(현지시간) 미국 라스베이거스에서 열린 리인벤트 컨퍼런스에서 “AWS 고객들은 아마존 제품과 서비스에 적용돼 있는 AI 기술을 이용할 수 있다”고 발표했다.

이날 AWS는 이미지 인식, 문자-음성 전환, 자연어 인식 등 3개 머신러닝 API를 공개했다. ‘아마존 리코그니션(Amazon Rekognition)은 이미지 인식과 분석 서비스를 제공한다. 이 기능을 이용하면 사진 속 객체를 실시간으로 분석할 수 있다. 사람 얼굴 인식도 가능하다. 아마존 폴리(Amazon Polly)는 글을 말로 바꿔주는 기능을 제공한다. 글이 입력되면 mp3파일로 만들어 재생해 준다. 폴리는 24개의 언어를 구사할 수 있다. 또 47개의 다른 목소리로 표현할 수 있다. 아마존 렉스(Amazon Lex)는 자동 음성인식과 자연어 인식 기능을 제공한다. 렉스를 이용하면, 아마존 알렉사 같은 서비스 제작이 가능해진다.

아마존이 AWS에 3가지 AI툴을 추가했다. 그중 하나인 이미지 인식 기능

최근엔 AWS가 번역 API도 제공할 계획이라는 소식도 나왔다. 외신에 따르면 AWS는 오는 11월 열릴 올해 리인벤트 컨퍼런스를 앞두고 출시될 예정이다. AWS 번역 서비스는 회사의 최신 AI 역량 강화 일환으로 클라우드 시장에서 이 분야에 앞서고 있는 경쟁사와 맞붙을 무기가 될 전망이다. 퍼블릭클라우드 서비스 시장 1위는 AWS지만 마이크로소프트(MS)와 구글이 이미 제공하는 번역서비스를 AWS는 제공하지 않고 있었다.

■MS 애저 “머신러닝 API도 맞춤형으로 진화”

MS는 클라우드 서비스 애저에서 코그니티브 서비스라는 이름으로 머신러닝 API를 제공하고 있다. 지난 2015년 처음 서비스를 시작해 현재 29개의 API를 내놨다. MS에 따르면 약 56만8천명의 전세계 개발자가 사용중이다.

MS는 머신러닝 모델을 맞춤형으로 학습시킬 수 있는 방식으로 서비스를 진화시키고 있다. 지난 5월 열린 연례 개발자 컨퍼런스에서 MS는 기존 머신러닝 API의 한계를 뛰어넘을 수 있는 커스텀 비전(사진 인식)과 커스텀 스피치(음성인식)를 소개했다. 기존 비전 및 스피치 API가 미리 학습된 모델을 제공했다면, 커스텀 비전과 커스텀 스피치 API는 사용자가 목적에 따라 적합한 데이터를 입력해 학습시킬 수 있다.

스피치 API를 활용하면, 특정 분야의 전문용어를 보다 잘 인식할 수 있다. 예컨대 주식 정보 챗봇을 만들려면 머신러닝 모델이 전문 용어를 많이 알아야 한다. 일반적인 스피치 API를 썼을 때 일부 용어를 이해하지 못할 수도 있기 때문에 별도의 학습이 필요하다. 이럴 때 스피치 API를 이용하면 된다. 또 영어를 쓰더라도 이탈리아 사람처럼 액센트가 있는 경우, 아주 시끄러운 곳에서 음성을 인식해야 하는 경우, 또 아이들이 말하는 방식에 대해서도 학습시킬 수 있다.

지난달 13일 서울 양재동 엘타워에서 개최된 MS빌드투어 행사에서 MS 본사 에반젤리스트(기술전도사)인 맷 벨로조(Mat Velloso) 수석 개발자는 MS가 지원하는 코그니티브 서비스를 소개하며 “개발자들은 머신러닝을 전문으로 할 필요가 없다”며 “단지 (어떤 서비스를 만들 수 있을지) 상상력을 발휘하면 된다”고 강조했다.

■구글 “영상 검색, 일자리 검색 등 독특한 기능 제공"

구글은 지난 6월 열린 개발자컨퍼런스 I/O에서 클라우드 기반 지능형 비디오 분석 API를 퍼블릭베터버전으로 공개했다. 비디오인텔리전스 API를 활용하면, 영상 속 객체가 무엇인지 또 어떤 행동을 하고 있는지 탐지할 수 있다. 이렇게 되면 영상 안 콘텐츠 검색이 가능해진다. 구글 포토에서 이용할 수 있는 사진 검색 기능을 영상으로 확장한 것이다.