Quote Cloud TPU

Questo documento elenca le quote che si applicano a Cloud TPU. Per informazioni sui prezzi di Cloud TPU, consulta la pagina Prezzi di Cloud TPU.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Per maggiori informazioni, consulta la panoramica di Cloud Quotas. .

Quota TPU

Le quote TPU sono limiti al numero di core Cloud TPU che puoi utilizzare con un progettoGoogle Cloud . Ogni versione della TPU è associata a una propria quota. Inoltre, ogni quota della versione di Cloud TPU è suddivisa in quota on demand e quota prerilasciabile (o spot).

Quando crei risorse Cloud TPU, per impostazione predefinita crei risorse on demand. Puoi creare risorse preemptible utilizzando il parametro --spot quando crei risorse con il comando gcloud. Per saperne di più, consulta Gestire le risorse TPU.

Quote Cloud TPU predefinite

Le tabelle seguenti mostrano i valori predefiniti per la quota on demand e preemptive per ogni zona disponibile. Questi valori specificano il numero massimo di core TPU che puoi utilizzare nel tuo progetto.

Quote preemptible

Versione TPU Quota predefinita (numero di core) Nome quota
v6e 1536 core Core TPU v6e prerilasciabili per progetto e per zona
v5p 768 core Core TPU v5p prerilasciabili per progetto e per zona
v5e 1536 core Core pod TPU v5 Lite prerilasciabili per progetto e per zona
v4 0 core Core pod TPU v4 prerilasciabili per progetto e per zona
v3 pod 32 core Core pod TPU v3 prerilasciabili per progetto e per zona
v3 120 core Core TPU v3 prerilasciabili per progetto e per zona
v2 pod 32 core Core pod TPU v2 prerilasciabili per progetto per zona
v2 120 core Core TPU v2 prerilasciabili per progetto e per zona

Quote on demand

Versione TPU Quota predefinita (numero di core) Nome quota
v6e 512 core Core TPU v6e per progetto e per zona
v5p 128 core Core TPU v5p per progetto e per zona
v5e 512 core Core pod TPU v5 Lite per progetto e per zona
v4 0 core Core pod TPU v4 per progetto e per zona
v3 pod 32 core Core pod TPU v3 per progetto e per zona
v3 40 core Core TPU v3 per progetto e per zona
v2 pod 32 core Core pod TPU v2 per progetto per zona
v2 40 core Core TPU v2 per progetto e per zona

Visualizzare e richiedere quota aggiuntiva

Puoi visualizzare la quota allocata per il tuo progetto Google Cloud nella pagina Quote della Google Cloud console.

Puoi richiedere una quota di Cloud TPU aggiuntiva dalla pagina Quote. Trova la quota che vuoi aumentare, fai clic sui tre puntini verticali e scegli Modifica quota. Per ulteriori informazioni, consulta Richiedere un aggiustamento delle quote. Se richiedi una quota inferiore alla soglia di approvazione automatica, la tua richiesta verrà approvata automaticamente.

Quote preemptible

Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e prerilasciabili per progetto e per zona
v5p Tutte le zone: 0 core Core TPU v5p prerilasciabili per progetto e per zona
v5e
  • us-east5-b: 800 core
  • us-west4-a: 1600 core
  • us-west4-b: 3968 core
  • us-west1-c: 576 core
  • us-central1-a: 3264 core
  • europe-west4-a: 4032 core
Core pod TPU v5 Lite prerilasciabili per progetto e per zona
v4 Tutte le zone: 0 core Core pod TPU v4 prerilasciabili per progetto e per zona
v3 pod
  • europe-west4-a: 512 core
  • us-east1-d: 320 core
Core pod TPU v3 prerilasciabili per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 prerilasciabili per progetto e per zona
v2 pod
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core pod TPU v2 prerilasciabili per progetto per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core TPU v2 prerilasciabili per progetto e per zona

Quote on demand

Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e per progetto e per zona
v5p us-east5-a: 64 core Core TPU v5p per progetto e per zona
v5e Tutte le zone: 64 core Core pod TPU v5 Lite per progetto e per zona
v4 Tutte le zone: 0 core Core pod TPU v4 per progetto e per zona
v3 pod
  • europe-west4-a: 128 core
  • us-east1-d: 64 core
Core pod TPU v3 per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 per progetto e per zona
v2 pod
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core pod TPU v2 per progetto per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core TPU v2 per progetto e per zona

Riceverai un'email che ti comunicherà se la tua richiesta di quota è stata approvata o rifiutata. Gli aumenti delle quote di servizioGoogle Cloud avvengono gradualmente. Ciò potrebbe comportare implementazioni continue in diverse regioni o risorse. Durante l'implementazione, il valore della quota visualizzato nella Google Cloud console o nell'API Cloud Quotas non rifletterà il nuovo valore della quota aumentato fino al completamento dell'implementazione. Per maggiori informazioni, consulta Visualizzare i rollout in corso.