삼성전자가 빅스비에 구글 클라우드 쓴 이유는?

빅데이터 저장 및 분석 위한 전문 서비스 주효

컴퓨팅입력 :2020/02/19 18:12

“클라우드에서 중요한 것은 안정성 더불어 확장성과 비용이다. 이러한 장점을 살리기 위해 빅스비의 음성인식서비스(ASR)를 구글 클라우드로 이관했다”

삼성전자 AI서버개발 그룹장 겸 무선사업부 장수백 상무는 19일 구글 클라우드가 개최한 미디어 브리핑에서 삼성전자의 빅스비의 ASR을 구글 클라우드 플랫폼(GCP)으로 이전한 이유와 함께 주로 사용한 GCP 기능을 소개했다.

삼성전자 AI서버개발 그룹장 겸 무선사업부 장수백 상무.

장수백 상무가 소개한 삼성전자가 주목하고 주로 사용한 GCP의 서비스는 클라우드 스패너, 빅쿼리, 클라우드펑션, 데이터플로우다.

이 서비스는 모두 빅데이터와 관련된 것이 특징이다. 결국 삼성전자가 구글 클라우드를 선택한 이유는 데이터 관리와 관련이 있는 것으로 풀이된다.

빅스비 같은 인공지능(AI) 기반 서비스는 AI 학습을 위해 방대한 양의 데이터가 필요하다. 또한 영상, 음성 등 정제되지 않은 상태로 쌓인 빅데이터를 AI가 이해할 수 있도록 다시 정제하고 표준화하는 과정도 거쳐야 한다. 하지만 이런 수집 및 정제 과정은 상당히 많은 시간과 비용이 소모된다.

그래서 대규모 데이터 저장공간과 방대한 데이터를 효율적으로 분석하기 위한 외부의 전문 서비스가 필요하다. 이에 구글이 가장 적합했다는 것이다.

실제로 구글은 실시간 대규모 데이터 분석 서비스인 빅쿼리를 비롯해 글로벌 규모의 분산 데이터베이스(DB)인 스패너 등 다양한 데이터 관련 서비스를 제공하고 있다.

또한 구글은 AI 개발 프레임워크인 텐서플로를 개발하고 배포하고 있고 AI전용 프로세서인 TPU를 직접 개발해 서비스하는 등 세계적으로 AI 기술을 선도하고 있는 기업이다. 그만큼 풍부한 AI 개발 노하우를 보유하고 여러 관련 서비스를 제공하고 있다는 것도 주요 이유 중 하나다.

삼성전자에서 활용한 클라우드 스패너는 관계형 DB구조와 비관계형 수평적 확장의 이점을 결합한 글로벌 분산형 데이터베이스 서비스다. 지역별 서버에 따라 나눠져 있는 DB가 동일한 데이터를 유지하면서 검색 지연시간을 줄인 것이 특징이다.

삼성전자는 클라우드 서비스를 활용해 세계 5개 지역에 위치한 서버를 업데이트 과정에서 발생하는 시간차 문제를 최소화했다.

빅쿼리는 방대한 양의 데이터를 실시간으로 분석하는 빅데이터 분석 서비스다. 초당 수십억 단위 행(rows) 데이터를 다룰 수 있으며 수조 단위 레코드, 테라바이트(TB)규모까지 확장되는 데이터 탐색, 분석과 애플리케이션 프로토타이핑을 수행한다.

또한 SQL가 비슷한 언어를 사용해 기존 데이터 관리자도 어렵지 않게 활용할 수 있다는 점도 호평 받고 있다.

삼성전자는 매일 쌓이는 수백 테라바이트(TB) 규모의 로그 데이터를 실시간으로 분석해 사용자의 패턴을 파악한다. 또한 서비스 분석에 동의 한 사용자에 한해 한달, 1년 단위의 더욱 큰 규모의 데이터도 주기적으로 분석해 보다 세밀한 분석 정보를 확보 중이다.

클라우드 펑션은 특정 작업을 수행하기 위한 함수를 서비스형태로 제공하는 기능이다. 구조가 간단하고 사용하기 쉬워 단순 배포 작업 등 실행 시간이 짧고 단순한 로직을 처리하면 종료되는 일회성 작업 수행에 효과적이다.

삼성전자는 빅스 내 마켓플레이스에 일반개발자가 앱을 만들어 마켓플레이스에 등록하는 과정에서 메타데이터 검증 및 적용 속도를 높이기 위해 클라우드 펑션을 사용하는 것을 고려 중이다.

클라우드 데이터 플로우는 완전 관리형 스트리밍 분석 서비스로 여러 데이터를 쉽게 가공하고 규격화 할 수 있도록 돕는다.

관련기사

삼성전자는 클라우드 데이터 플로우를 활용해 빅데이터를 분석하고 데이터셋을 제작하고 있다. 데이터셋은 AI가 학습할 수 있도록 가공하고 규격화된 데이터 그룹을 말한다.

장수백 상무는 “구글 클라우드의 장점을 활용하고 위해 빅스비의 다른 부분도 이전할 계획”이라며 “한국 사용자에게 빠르고 안정성 있는 서비스를 제공할 수 있도록 한국 리전을 적극 활용하겠다”고 전했다.