구글이 인공지능(AI) 에이전트 추론 경쟁력을 높이기 위해 새 칩을 공개했다.
구글클라우드는 22일(현지시간) 미국 라스베이거스에서 열리는 '구글클라우드 넥스트 2026'를 앞두고 진행한 미디어 브리핑에서 학습용 8세대 '텐서처리장치(TPU) 8t'와 추론용 'TPU8i'를 동시에 출시한다고 밝혔다.
이번 발표 핵심은 AI 학습과 추론을 분리한 점이다. AI 에이전트 확산으로 실제 업무를 수행하는 추론 중요성이 커지면서 칩 구조도 목적별로 최적화한 것이다.
학습용 8t는 연산 처리량을 극대화한 구조로 이뤄졌다. 전 세대 대비 성능이 3배 향상됐다. 대규모 데이터에서 패턴을 학습하는 데 초점을 맞춘 설계다.
추론용 8i는 지연 시간을 줄이고 동시 처리 능력을 강화했다. 전 세대 대비 성능은 80% 올랐으며, 온칩 집단 연산 지연은 최대 5배 감소했다. 온칩 집단 연산은 칩 내부에서 데이터 결합과 분산 처리를 즉시 수행하는 기술이다. 이를 통해 AI 에이전트가 더 복잡한 작업을 빠르고 적은 에너지로 처리할 수 있다.
구글클라우드는 2015년 1세대 TPU 공개 후 2~3년 주기로 신제품을 내놨다. 챗GPT 등장 이후에는 매년 출시 주기를 앞당기며 개발 속도를 높이고 있다.
이번 8세대 TPU는 연내 정식 출시될 예정이다. 구글클라우드는 엔비디아 GPU 공급 부족 상황을 기회로 삼아 AI 인프라 시장 점유율을 확대하겠다는 전략을 밝혔다.
관련기사
- 구글클라우드 CEO "AI가 업무하는 시대…'지능 통합' 필수"2026.04.22
- 구글클라우드 "AI 하이퍼컴퓨터, 수백만 에이전트 동시 구동"2026.04.22
- 넷앱, 구글과 손잡고 폐쇄망 AI 인프라 공략…공공·국방 시장 정조준2026.04.22
- 구글클라우드가 그린 '제미나이 엔터프라이즈' 시대2026.04.22
이 외에도 구글클라우드는 자체 모델 '제미나이'를 포함한 풀스택 전략을 강조했다. 칩과 모델 서비스 보안을 통합해 기업용 AI 에이전트 환경을 구축하겠다는 구상이다.
구글클라우드는 "이번 칩 시리즈는 AI 에이전트가 더 복잡한 문제를 더 적은 에너지로 더 빠르게 해결할 수 있게 돕는다"고 밝혔다.











