"결국 데이터가 인공지능(AI)·머신러닝(ML) 시스템의 성능을 좌우한다. 도메인에 최적화된 데이터는 더 양질의 데이터고, 이런 데이터는 머신러닝 비전문가들이 더 잘 알고 있을 것이다. 누구나 자신의 데이터를 활용해 머신러닝 시스템을 만들 수 있어야 하는 이유다."
구글클라우드 김정훈 데이터분석 스페셜리스트는 지디넷코리아가 지난 7일 온라인으로 개최한 'ACC+ 2021' 컨퍼런스에서 "구글은 누구나 손쉽게 사용할 수 있는 AI의 대중화를 AI·ML 서비스의 미션으로 추구하고 있다"며 이같이 말했다.
올해 개발자 컨퍼런스 구글I/O를 통해 공개된 '버텍스AI'는 구글이 AI 대중화를 실현시키기 위해 야심차게 내놓은 서비스다. 그는 버텍스 AI를 "누구나 쉽게 머신러닝을 위한 다양한 작업을 수행할 수 있게 만든 서비스로, AI 대중화에 기여할 수 있는 구글의 차세대 AI·ML통합 서비스"라고 소개했다.
그의 설명에 따르면 버텍스AI는 사용자의 데이터 보유 여부, 모델 코드 개발 가능 여부에 따라 다양한 옵션을 제공하고 있다.
머신러닝 서비스를 개발하기 위해 활용할 수 있는 자신만의 데이터가 없다면 구글에서 제공하는 사전 정의된 모델을 사용하면 된다. 이미지, 비디오, 스피치, 자연여처리, 번역 등 다양한 영역에서 사전 정의된 모델을 애플리케이션 프로그래밍 인터페이스(API) 형태로 제공한다.
자신만의 데이터가 있다면 버텍스AI의 데이터 셋 기능을 활용할 수 있다. 이미지,테이블 텍스트, 비디오 등 다양한 데이터 타입을 지원한다.
오토ML 기능을 이용하면 코딩 없이 잘 알려진 최신 모델을 기반으로 서비스 개발이 가능하다. 자신만의 좀 더 정확한 모델과 상세분석을 원할 때는 커스텀 모델 기능을 활용하면 된다. 모델이 개발되면 버텍스 엔드포인트로 배포하고 바로 서비스할 수 있다.
그는 "지금까지 살펴본 버텍스AI 기능들은 커스텀 트레이닝만 빼면 모두 코딩이 필요 없다"며 "누구나 쉽게 이 기능들을 이용해 AI·ML 서비스를 개발할 수 있다"고 강조했다.
모델 배포 후 지속적인 모니터링, 재작업, 자동화된 관리에도 버텍스AI를 이용할 수 있다.
그는 "모델 배포는 AI·ML 서비스 개발의 끝이 아니라 새로운 시작에 불과하다"며 "개발된 모델이 현재에는 좋은 모델일지 모르지만 데이터 변형에 잘 대응할 수 있는지는 아무도 알 수 없다"며 일명 ML옵스의 중요성을 강조했다.
관련기사
- 구글클라우드 "한국 제조업체 39%만 AI 활용”2021.07.28
- 구글, 관리형 AI 서비스 '버텍스AI' 출시2021.05.20
- 구글 I/O 개막…진화한 AI 쏟아냈다2021.05.19
- 사표 냈던 구글 AI 연구팀 책임자, 애플로 옮겼다2021.05.04
머신러닝은 확률에 의존하는 비결정적인 기술이다. 개발과정에서 무수한 반복작업이 필요하다. 이런 반복작업의 생산성을 향상시키기 위해 파이프라인 시스템을 구축해야 한다. 데브옵스의 지속적인 통합배포(CI/CD)시스템에서는 소프트웨어 결과물을 배포하지만, ML옵스는 모델을 생성하기 위한 파이프라인을 배포해야 하는 것이다.
그는 "버텍스AI를 활용하면 ML옵스 기술에 기반한 머신러닝 파이프라인 시스템을 추가적인 구축·운영 없이 구글클라우드 서비스로 이용할 수 있다"며 버텍스 AI가 모델 배포부터 ML옵스까지 지원하는 통합 서비스임을 재차 강조했다.