마이크로소프트(MS)와 아마존이 클라우드 사업과 인공지능(AI) 기술 분야 협력 범위를 확대했다. MS와 아마존의 클라우드 사업조직 아마존웹서비스(AWS)가 각자 주력했던 딥러닝 프레임워크의 호환성을 제공하는 오픈소스 라이브러리 '글루온(Gluon)'을 선보인 것이다.
MS와 AWS는 지난 8월말 경쟁 영역인 퍼블릭클라우드 사업에서 협력 사례를 내놨다. MS가 애저 클라우드에서 돌아가는 웹버전 개발도구 '비주얼스튜디오팀서비스(VSTS)용 AWS툴스'를 소개했다. 비주얼스튜디오에 익숙한 개발자가 이걸로 여러 AWS 클라우드 기반 서비스를 사용할 수 있게 됐다. [☞관련기사]
같은 시점에 MS 코타나(Cortana)와 아마존 알렉사(Alexa)가 서로의 플랫폼에서 동작하도록 상호 연동하는 내용의 제휴도 이뤄졌다. 사용자가 알렉사 탑재 기기에서 코타나를, 코타나 탑재 기기에서 알렉사를 불러내 명령을 내릴 수 있게 된다는 내용이었다. [☞관련기사]
최근 MS와 아마존의 3번째 협력 소식이 들려 왔다. MS와 AWS가 지난 12일 각자 공식 블로그를 통해 글루온 프로젝트를 소개했다.
글루온은 AI 애플리케이션 개발자에게 쉽고 빠른 머신러닝 모델을 만들도록 돕는 딥러닝 인터페이스 또는 라이브러리다. 미리 제작, 최적화된 인공신경망 구성요소 모음을 사용해 머신러닝 모델을 정의할 포괄적 API를 제공한다. 이걸 사용시 머신러닝 초보 개발자는 다른 데이터구조를 다루는 것처럼 익숙하게 머신러닝 모델을 정의, 조작할 수 있다. 경험많은 데이터과학자와 연구자는 학습 속도 희생 없이 완전히 새로운 모델 아키텍처를 만들 때 빠르게 프로토타입을 제작하고 동적인 인공신경망 그래프를 활용할 수 있다.
발표 시점부터 아파치 MX넷 프레임워크에서 글루온 라이브러리를 사용할 수 있고, 향후 MS의 코그니티브툴킷에서도 지원할 예정이다. [☞깃허브 프로젝트]
이걸 왜 만들었을까.
딥러닝을 비롯, 인공신경망을 사용하는 머신러닝 기술은 학습데이터, 모델, 알고리즘, 이 3가지 주요 구성요소로 이뤄진다. 신경망은 데이터로 구성된 일련의 입력값, 그에 연결된 출력값, 이를 연결하는 계층과 가중치를 포함한 그래프다. 학습을 진행하는 동안 알고리즘은 신경망 출력값의 오류를 기반으로 가중치를 조절한다. 이 과정이 신경망의 학습방식이다. 며칠이 걸릴 만큼 많은 메모리와 연산 성능을 요하는 과정이다.
그간 학습 시간을 줄이기 위해 카페2, 코그니티브툴킷(옛 CNTK), 텐서플로, 아파치 MX넷 등 다양한 딥러닝 프레임워크가 만들어졌다. 프레임워크는 모델 최적화를 돕는다. 하지만 그 과정조차 만만치 않다. 개발자는 처음에 정형화한 신경망 그래프를 정의한 다음 그걸 멈춰놓고 가중치를 조정해가는 식의 추가 작업을 해야 한다. 그런데 이렇게 최적화한 신경망은 디버그하거나 다른 프로젝트를 위해 코드를 재사용하기 어렵다.
회사측 설명에 따르면 AWS는 그간 아파치 MX넷(MXnet) 프레임워크를 활용하면서 이런 신경망 정의 및 학습 방식을 개선하기 위한 아이디어를 실험해 왔고, MX넷 오픈소스 프로젝트에 동참하고 있는 MS 역시 그런 아이디어에 관심을 갖고 있었다. 이처럼 초보자가 신경망을 다룰 때 접하는 복잡성, 경험많은 연구자가 최적화에 들여야 하는 시간 부담을 줄여 주기 위한 기술로 나온 게 글루온이다. [☞AWS 발표원문]
관련기사
- AI 프레임워크 상호변환 쉬워지나2017.10.16
- 알렉사-코타나 동맹의 2가지 관전 포인트2017.10.16
- MS-아마존, AI 음성비서 상호 연동한다2017.10.16
- MS, 딥러닝 툴킷 새버전 오픈소스로 공개2017.10.16
MS는 글루온이 유연성을 희생할 필요 없이 개발자가 쓰기 쉬운 인터페이스, 확장성 뛰어난 학습, 효율적인 모델 평가를 지원한다고 주장했다. 또 아파치 MX넷 현재 버전, 코그니티브툴킷 차기 버전에 사용될 수 있고, 향후 모든 애저 클라우드서비스, 툴, 인프라에서 지원될 예정이라고 밝혔다. 개발자는 이걸로 고수준 프로그래밍 모델, 친숙한 툴과 플랫폼을 사용해 새로운 AI 혁신 속도를 앞당길 수 있을 것이라고 강조했다. [☞MS 발표원문]
MS는 앞서 발표한 '오픈 뉴럴 네트워크 익스체인지(ONNX)'와 결합시 개방형 AI 생태계를 만드는 또다른 일부분이 될 것이라고 덧붙였다. ONNX는 지난달부터 MS와 페이스북이 공동으로 신경망 그래프 표준 데이터 포맷을 개발한다며 추진한 오픈소스 프로젝트다. [☞관련기사]