TPU v2

Questo documento descrive l'architettura e le configurazioni supportate di Cloud TPU v2.

Architettura di sistema

I dettagli dell'architettura e le caratteristiche di prestazioni di TPU v2 sono disponibili in A Domain Specific Supercomputer for Training Deep Neural Networks.

Configurazioni

Una sezione TPU v2 è composta da 512 chip interconnessi con link ad alta velocità riconfigurabili. Per creare una sezione TPU v2, utilizza il flag --accelerator-type nel comando di creazione della TPU (gcloud compute tpus tpu-vm). Specifica il tipo di acceleratore specificando la versione di TPU e il numero di core TPU. Ad esempio, per una singola TPU v2, utilizza --accelerator-type=v2-8. Per un seme v2 con 128 TensorCore, utilizza --accelerator-type=v2-128.

Il seguente comando mostra come creare una sezione TPU v2 con 128 TensorCore:

  $ gcloud compute tpus tpu-vm create tpu-name \
    --zone=us-central1-a \
    --accelerator-type=v2-128 \
    --version=tpu-ubuntu2204-base

Per saperne di più sulla gestione delle TPU, consulta Gestire le TPU. Per ulteriori informazioni sull'architettura di sistema TPU di Cloud TPU, consulta Architettura di sistema.

Nella tabella seguente sono elencati i tipi di TPU v2 supportati:

Versione TPU Fine del supporto
v2-8 (Data di fine non ancora impostata)
v2-32 (Data di fine non ancora impostata)
v2-128 (Data di fine non ancora impostata)
v2-256 (Data di fine non ancora impostata)
v2-512 (Data di fine non ancora impostata)