Richiedere una prenotazione a breve termine utilizzando la modalità Calendario

Per prenotare TPU per una data e ora di inizio e una durata specifiche, comprese tra 1 e 90 giorni, richiedi una prenotazione futura in modalità calendario. Questa modalità, basata su Dynamic Workload Scheduler, ti consente di verificare la disponibilità delle TPU fino a 120 giorni prima e richiedere capacità in base alla tua pianificazione. Puoi richiedere una prenotazione futura in modalità calendario utilizzando l'API Compute Engine o la console Google Cloud . Se approvata, Compute Engine crea automaticamente una prenotazione per la data e l'ora che hai scelto. Puoi quindi utilizzare la prenotazione eseguendo il provisioning delle TPU utilizzando l'API Create Node o l'API Queued Resources. Compute Engine elimina automaticamente la prenotazione e tutte le TPU che la utilizzano al termine del periodo di prenotazione.

La richiesta di una prenotazione futura in modalità calendario è adatta ai carichi di lavoro di addestramento e sperimentazione che richiedono orari di inizio precisi e hanno una durata definita.

Per saperne di più, consulta Informazioni sulle richieste di prenotazione futura in modalità calendario.

Visualizzare la disponibilità futura delle TPU

Puoi visualizzare la disponibilità delle TPU da 1 a 120 giorni in anticipo. Per saperne di più, consulta Visualizzare la disponibilità futura delle risorse.

Creare una richiesta di prenotazione futura in modalità calendario

Puoi richiedere una prenotazione futura in modalità calendario utilizzando l'API Compute Engine o la console Google Cloud . Per ulteriori informazioni, vedi Creare una richiesta di prenotazione futura in modalità calendario.

Limitazioni

La richiesta di una prenotazione futura in modalità calendario per le TPU presenta le seguenti limitazioni:

  • Non puoi modificare, annullare o eliminare una richiesta di prenotazione futura.
  • Devi specificare una durata della prenotazione con un minimo di 1 giorno e un massimo di 90 giorni.
  • Puoi prenotare solo le seguenti versioni della TPU nelle zone specificate:
    • TPU v6e: asia-northeast1-b, us-east5-a, us-east5-b
    • TPU v5p: us-east5-a
    • TPU v5e: us-west4-b (BATCH), us-central1-a (SERVING)

Per il numero consentito di chip TPU per richiesta, consulta la sezione Limitazioni nella documentazione di Compute Engine.

Passaggi successivi