구글이 머신러닝과 텐서플로 구동을 위한 새 전용 프로세서 '클라우드TPU'를 공개했다. 1년전 선보인 '텐서프로세싱유닛(TPU)'의 2세대 기술이다. 그 이름처럼 인공지능(AI) 소프트웨어를 클라우드에서 구현할 수 있도록 제공될 예정이다.
구글은 17일(현지시간) 미국서 진행중인 구글I/O 컨퍼런스 현장에서 클라우드TPU를 선보였다. 이는 연산성능 45테라플롭스(TFLOPS)짜리 칩 4개를 얹어 180TFLOPS 성능을 내는 모듈로 만들어졌다. 모듈 하나당 64기가바이트(GB) 메모리 대역폭을 지원한다.
클라우드TPU는 지난해 5월 18일 구글I/O에서 공개된 TPU의 계보를 잇는 프로세서다. TPU는 구글의 '텐서플로(TensorFlow)' 프레임워크 구동 효율을 높인 맞춤설계형 ASIC이었다. TPU 공개 당시 구글은 이를 자사 데이터센터에 장착, 실제 서비스 정확도 개선에 활용 중이라고 밝혔다.
1세대 TPU가 모든 머신러닝 연산을 도맡는 건 아니었다. TPU는 학습된 모델을 사용한 추론 연산, 즉 이미지나 언어 등의 인식에 사용됐다. 머신러닝 연산은 학습과 추론, 2가지로 나뉜다. 학습에 수반되는 '모델 대상 패턴매칭' 연산은 TPU가 아니라 CPU 및 GPU의 역할이었다.
관련기사
- 딥러닝 기반 안티바이러스, 어떻게 태어났나2017.05.18
- "당뇨병성 망막증 진단…AI, 의사 수준 됐다"2017.05.18
- 구글 "AI 기술 텐서플로, 학습속도 수 십배 향상"2017.05.18
- 구글 인공지능 "뉴스 제목도 잘 뽑네"2017.05.18
2세대인 클라우드TPU는 머신러닝 연산 과정에서 나머지 역할도 맡을 수 있다. 추론뿐아니라 학습 연산에도 괜찮은 성능을 낼 수 있게 됐다는 얘기다. 구글은 이 프로세서 모듈 카드 64개를 고속 인터커넥트로 연결해 11.5페타플롭스(PFLOPS)짜리 'TPU 팟(pod)'을 만들었다고 설명했다. 1PFLOPS는 부동소수점연산을 1초에 10의 15승 번 해낼 수 있는 성능이다.
구글은 자사 클라우드 서비스형인프라(IaaS)를 통해, 연내 개발자들이 클라우드TPU 기술을 써볼 수 있게 할 방침이다. 개발자들이 구글컴퓨트엔진(GCE)의 클라우드 가상머신(VM) 형태로 인텔CPU 및 , 엔비디아 GPU와 함께 클라우드TPU를 사용할 수 있게 내놓을 예정이다.