Opzioni di consumo di Cloud TPU
Questo documento fornisce una descrizione delle opzioni di consumo supportate per Cloud TPU. Le opzioni di consumo sono i metodi utilizzati per richiedere capacità. Quando scegli un'opzione di consumo, considera i seguenti fattori:
- Con quale rapidità hai bisogno della capacità
- Per quanto tempo ti serve la capacità
- Se hai bisogno della capacità per un periodo di tempo fisso o flessibile
- Se la tua capacità può essere interrotta
- Prezzi
Se utilizzi le API Cloud TPU, per ogni metodo di consumo hai bisogno di una quota on demand o prerilasciabile per il numero di core Cloud TPU che vuoi utilizzare. Esistono quote on demand e prerilasciabili predefinite diverse per ogni versione di TPU. Per maggiori informazioni, consulta Quote di Cloud TPU.
Se utilizzi le TPU con Google Kubernetes Engine (GKE), utilizzi la quota dell'API Compute Engine, che è una quota diversa. Per saperne di più sulle quote che utilizzi per le TPU in GKE, consulta la sezione Assicurati di disporre della quota TPU.
Opzione di consumo | Come funziona | Ideale per | Versioni e zone di TPU supportate | Tipo di quota per l'API Cloud TPU |
---|---|---|---|---|
Prenotazioni a lungo termine | Richiedi le risorse TPU in anticipo per un anno o più. Queste risorse sono riservate al tuo uso esclusivo durante quel periodo di tempo. Le prenotazioni offrono il massimo livello di garanzia per la capacità e sono convenienti, con un prezzo inferiore rispetto alle risorse on demand. Le prenotazioni TPU a lungo termine includono uno sconto per impegno di utilizzo (CUD). I CUD offrono prezzi scontati in cambio dell'acquisto di un contratto basato sull'impegno di utilizzo. Per saperne di più, consulta Richiedere una prenotazione a lungo termine. |
Le prenotazioni a lungo termine sono ideali per i job di addestramento a lunga esecuzione e i carichi di lavoro di inferenza. | Tutte le versioni TPU: consulta Regioni e zone TPU | Quota on demand |
Prenotazioni a breve termine (prenotazioni future in modalità calendario) (anteprima) | Richiedi risorse TPU per un orario di inizio e una durata specifici, compresi tra 1 e 90 giorni. Queste risorse sono riservate al tuo uso esclusivo durante quel periodo di tempo. Le prenotazioni offrono il massimo livello di garanzia per la capacità e sono convenienti, con un prezzo inferiore rispetto alle risorse on demand. Per saperne di più, consulta Richiedere una prenotazione a breve termine utilizzando la modalità calendario. |
Le prenotazioni a breve termine sono adatte per carichi di lavoro di addestramento ed esperimenti che richiedono orari di inizio precisi e hanno una durata definita. | v6e (Trillium) per l'addestramento e la pubblicazione: asia-northeast1-b, us-east5-a v5p per l'addestramento e la pubblicazione: us-east5-a v5e per l'addestramento: us-west4-a v5e per la pubblicazione: us-central1-a |
Nessuna quota richiesta |
On demand | Richiedi le risorse TPU da utilizzare il prima possibile, per tutto il tempo che vuoi. Su richiesta offre la massima flessibilità. Le risorse on demand non verranno interrotte, ma non è garantito che ci saranno risorse TPU disponibili sufficienti per soddisfare la tua richiesta. On demand è l'impostazione predefinita quando crei risorse TPU. Per saperne di più sulla creazione e sull'utilizzo delle TPU on demand, consulta Gestire le risorse TPU. |
On demand è una buona soluzione per i job urgenti e i carichi di lavoro che richiedono un'ora di fine flessibile. | Tutte le versioni TPU: consulta Regioni e zone TPU | Quota on demand |
Avvio flessibile (anteprima) | Richiedi risorse TPU per un periodo di tempo specifico, fino a 7 giorni, senza dover prenotare la capacità in anticipo. Le risorse con avvio flessibile vengono fornite da un pool di capacità dedicato, pertanto la disponibilità di queste risorse è superiore a quella on demand. Per ulteriori informazioni sull'utilizzo di Flex-start con le TPU, consulta Richiedere Cloud TPU utilizzando Flex-start. Per saperne di più sull'utilizzo di Flex-start con Google Kubernetes Engine (GKE), consulta la sezione Informazioni sul provisioning di GPU e TPU con la modalità di provisioning flessibile. |
L'avvio flessibile è ideale per la sperimentazione, i test su piccola scala, il provisioning dinamico delle TPU per i carichi di lavoro di inferenza, l'ottimizzazione dei modelli e le esecuzioni dei carichi di lavoro che richiedono meno di 7 giorni. |
v6e (Trillium): asia-northeast1-b, us-east5-a v5p: us-east5-a v5e: us-west4-a |
Quota prerilasciabile |
Spot | Richiedi risorse TPU che potrebbero essere prerilasciate. Le VM spot sono disponibili a un prezzo molto inferiore rispetto alle risorse on demand. Le VM spot potrebbero essere più facili da ottenere rispetto alle risorse on demand, ma possono essere prerilasciate (spente) in qualsiasi momento. Non esiste alcun limite alla durata di esecuzione. Per saperne di più sulle VM spot TPU, consulta Gestire le VM spot TPU. |
Spot è una buona soluzione per la pianificazione di carichi di lavoro a priorità inferiore, come il pre-addestramento del modello, il perfezionamento del modello e i job di simulazione che tollerano interruzioni della disponibilità. | Tutte le versioni TPU: consulta Regioni e zone TPU | Quota prerilasciabile |
Passaggi successivi
Inizia a utilizzare le TPU con: