Questa pagina è stata tradotta dall'API Cloud Translation.

Opzioni di consumo di Cloud TPU

Questo documento fornisce una descrizione delle opzioni di consumo supportate per Cloud TPU. Le opzioni di consumo sono i metodi utilizzati per richiedere capacità. Quando scegli un'opzione di consumo, considera i seguenti fattori:

Con quale rapidità hai bisogno della capacità
Per quanto tempo ti serve la capacità
Se hai bisogno della capacità per un periodo di tempo fisso o flessibile
Se la tua capacità può essere interrotta
Prezzi

Se utilizzi le API Cloud TPU, per ogni metodo di consumo hai bisogno di una quota on demand o prerilasciabile per il numero di core Cloud TPU che vuoi utilizzare. Esistono quote on demand e prerilasciabili predefinite diverse per ogni versione della TPU. Per maggiori informazioni, consulta Quote di Cloud TPU.

Se utilizzi le TPU con Google Kubernetes Engine (GKE), utilizzi la quota dell'API Compute Engine, che è una quota diversa. Per saperne di più sulle quote che utilizzi per le TPU in GKE, consulta la sezione Assicurati di disporre della quota TPU.

Opzione di consumo	Come funziona	Ideale per	Versioni e zone di TPU supportate	Tipo di quota per l'API Cloud TPU
Prenotazioni future per un anno o più	Richiedi le risorse TPU in anticipo per un anno o più. Queste risorse sono riservate al tuo uso esclusivo durante quel periodo di tempo. Le prenotazioni offrono il massimo livello di garanzia per la capacità e sono convenienti, con un prezzo inferiore rispetto alle risorse on demand. Le prenotazioni future di TPU hanno uno sconto per impegno di utilizzo (CUD) allegato. I CUD offrono prezzi scontati in cambio dell'acquisto di un contratto basato sull'impegno di utilizzo. Per saperne di più, consulta Richiedere una prenotazione futura per un anno o più.	Le prenotazioni future per un anno o più sono ideali per i job di addestramento a lunga esecuzione e i workload di inferenza.	Tutte le versioni TPU: consulta Regioni e zone TPU	Quota on demand
Prenotazioni future fino a 90 giorni (in modalità calendario) (anteprima)	Richiedi risorse TPU per un orario di inizio e una durata specifici, compresi tra 1 e 90 giorni. Queste risorse sono riservate al tuo uso esclusivo durante quel periodo di tempo. Le prenotazioni offrono il massimo livello di garanzia per la capacità e sono convenienti, con un prezzo inferiore rispetto alle risorse on demand. Per saperne di più, vedi Richiedere una prenotazione futura fino a 90 giorni in modalità calendario.	Le prenotazioni future in modalità calendario sono adatte ai workload di addestramento e sperimentazione che richiedono orari di inizio precisi e hanno una durata definita.	v6e (Trillium) per l'addestramento e la pubblicazione: asia-northeast1-b, us-east5-a v5p per l'addestramento e la pubblicazione: us-east5-a v5e per l'addestramento: us-west4-a v5e per la pubblicazione: us-central1-a	Nessuna quota richiesta
On demand	Richiedi le risorse TPU da utilizzare il prima possibile, per tutto il tempo che vuoi. L'opzione su richiesta offre la massima flessibilità. Le risorse on demand non verranno interrotte, ma non è garantito che ci saranno risorse TPU disponibili sufficienti per soddisfare la tua richiesta. On demand è l'impostazione predefinita quando crei risorse TPU. Per saperne di più sulla creazione e sull'utilizzo delle TPU on demand, consulta Gestire le risorse TPU.	On demand è una buona soluzione per i job urgenti e i carichi di lavoro che richiedono un orario di fine flessibile.	Tutte le versioni TPU: consulta Regioni e zone TPU	Quota on demand
Avvio flessibile (anteprima)	Richiedi risorse TPU per un periodo di tempo specifico, fino a 7 giorni, senza dover prenotare la capacità in anticipo. Le VM TPU Flex-start vengono fornite da un pool di capacità dedicato, pertanto la disponibilità di queste risorse è superiore rispetto a quelle on demand. Per ulteriori informazioni sull'utilizzo delle VM TPU Flex-start, consulta Richiedere VM TPU Flex-start. Per saperne di più sull'utilizzo delle VM TPU Flex-start con Google Kubernetes Engine (GKE), consulta Informazioni sul provisioning di GPU e TPU con la modalità di provisioning Flex-start.	L'avvio flessibile è ideale per la sperimentazione, i test su piccola scala, il provisioning dinamico delle TPU per i carichi di lavoro di inferenza, l'ottimizzazione dei modelli e le esecuzioni dei carichi di lavoro che richiedono meno di 7 giorni.	v6e (Trillium): asia-northeast1-b, us-east5-a v5p: us-east5-a v5e: us-west4-a	Quota prerilasciabile
Spot	Richiedi risorse TPU che potrebbero essere prerilasciate. Le VM spot sono disponibili a un prezzo molto inferiore rispetto alle risorse on demand. Le VM spot potrebbero essere più facili da ottenere rispetto alle risorse on demand, ma possono essere prerilasciate (spente) in qualsiasi momento. Non esiste alcun limite alla durata di esecuzione. Per ulteriori informazioni sulle VM spot TPU, consulta Gestire le VM spot TPU.	Spot è una buona soluzione per la pianificazione di carichi di lavoro a bassa priorità come il pre-addestramento dei modelli, il perfezionamento dei modelli e i job di simulazione che tollerano interruzioni della disponibilità.	Tutte le versioni TPU: consulta Regioni e zone TPU	Quota prerilasciabile

Passaggi successivi

Inizia a utilizzare le TPU con: