구글클라우드의 생성AI 플랫폼인 '버텍스AI'가 사용가능한 대규모언어모델(LLM)에 메타의 '라마2' 및 '코드라마', 앤스로픽의 '클로드2' 등을 추가했다. AI 가속기인 클라우드TPU 최신 버전을 출시하는 한편, 엔비디아 H100 GPU 인스턴스도 출시했다.
구글클라우드는 29일(현지시간) 미국 샌프란시스코에서 개최한 연계 컨퍼런스 '구글클라우드 넥스트 23'에서 AI 인프라, 버텍스AI 등의 업데이트를 발표했다.
구글클라우드는 AI 가속기인 '클라우드 TPU v5e'를 출시한다고 밝혔다. 클라우드 TPU v5e는 대규모 AI 훈련과 추론을 모두 실행할 수 있다. 수만개 칩으로 확장가능하도록 최적화됐다. 이전 세대와 비교해 달러당 학습 성능인 최대 2배, 달러당 추론 성능은 최대 2.5배 향상됐다.
자체 가속기와 함께 생성 AI 인프라의 표준으로 자리잡고 있는 엔비디아 H100 GPU 기반의 인스턴스도 출시한다. 엔비디아 젠슨 황 CEO를 무대에 올려 긴밀한 관계를 과시하는 한편, 'H100 A3 VM'을 다음달 출시한다고 밝혔다. 이전세대인 A2에 비해 3배 나은 교육 성과를 달성할 수 있다고 강조했다.
구글쿠버네티스엔진(GKE)은 미션크리티컬한 AI 및 ML 워크로드에 필요한 멀티클러스터 수평 확장을 지원하게 됐다. 자동확장, 작업 부하조정, 자동 업그레이드 등을 클라우드TPU v5e에서 사용할 수 있다.
생성 AI 구축 플랫폼인 '버텍스AI'도 업그레이드됐다. 구글클라우드에 따르면, 지난 4월부터 7월까지 생성AI 고객 프로젝트 수가 150배 증가했다고 한다. 이용자는 버텍스AI의 '모델가든'에서 100여개 기본 모델에 접근하고 자신에 맞게 최적화할 수 있다.
그동안 오픈소스 지원 확장을 약속해온 것을 어느정도 지켰다. 메타의 라마2와 코드라마, 테크놀로지이노베이티브인스티튜트의 팔콘 LLM을 정식으로 지원한다. 앤스로픽의 클로드2도 미리보기로 지원한다고 밝혔다. 라마2의 경우 버텍스AI의 어댑터튜닝과 RLHF를 이용할 수 있다.
생성 AI 개발 주기 전반에 사용가능한 도구체인인 '버텍스AI 생성AI 스튜디오'도 공개됐다. 이 도구는 엔터프라이즈급 제어 기능을 갖춘 도구로 텍스트 임베딩 API, RLHF 등의 도구를 제공한다.
PaLM2, 이메진, 코디(Codey) 등도 업데이트됐다. PaLM2는 3만2천 컨텍스트를 처리할 수 있게 됐다. PaLM2와 코디는 어댑터 조정을 사용할 수 있다. 100개의 예제로 LLM 성능을 향상시킬 수 있다고 회사측은 설명했다. 이메진은 스타일튜닝이란 새 튜닝방법을 도입해 적은 양의 참조 이미지를 사용해 특정 브랜드 지침이나 기타 창의적 요구사항에 맞는 이미지를 생성하도록 한다.
버텍스AI에 그라운딩 서비스가 추가됐다. 버텍스AI 기반 모델, 검색 및 대화 전반에 걸쳐 작동하는 서비스다. 엔터프라이즈 데이터 응답을 기반으로 더 정확한 응답을 제공할 수 있게 된다.
구글클라우드는 이와 함께 데이터 제품군의 업데이트도 공개했다.
새롭게 공개된 빅쿼리 스튜디오는 데이터 엔지니어링, 분석, 예측 분석 등을 위한 단일 인터페이스다. 버텍스AI 기반 모델에 대한 통합을 제공해 클라우드 간 분석, 거버넌스, 보안 데이터 공유 등을 제어하게 한다.
포스트그레SQL 기반인 알로이DB는 생성 AI 관련 기능을 추가했다. 알로이DB AI는 표준 포스트그레SQL보다 10배 빠른 고성능 벡터 쿼리를 제공하고, 생성 AI 앱을 쉽게 구축할 수 있는 통합 기능 세트를 제공한다. 알로이DB 옴니를 사용하면 멀티 클라우드에서 이용가능하다.
생성 AI 생태계도 확장됐다. 도큐사인, SAP, 워크데이 등이 구글클라우드 생태계에 합류했다.
관련기사
- 구글클라우드, '듀엣AI' 출시…1인당 월 30달러2023.08.30
- 메타와 마이크로소프트, 생성 AI 경쟁 지도 또 바뀐다2023.07.21
- 구글클라우드, 2분기 연속 흑자2023.07.26
- 구글클라우드, 생성 AI 기반 보안 서비스 공개2023.04.25
토마스 쿠리안 구글클라우드 최고경영자(CEO)는 "우리의 AI 최적화 인프라는 생성 AI 모델을 교육하고 제공하기 위한 최고의 선택"이라며 "AI21, 앤스로픽, 코히어, 재스퍼, 모자익ML, 레플릿, 런웨이, 타입페이스 등 AI 유니콘 70% 이상이 구글클라우드 고객"이라고 강조했다.
그는 "모든 기업, 정부, 사용자가 생성 AI와 선도적인 클라우드 기술의 혜택을 누리도록 돕는 새로운 방법을 발표하게 돼 자랑스럽다"고 덧붙였다.