Questo documento offre una panoramica delle richieste di prenotazione future in modalità calendario. Per scoprire di più sui diversi modi per prenotare risorse in Compute Engine, consulta Scegliere un tipo di prenotazione.
Per ottenere la capacità di creare istanze di macchine virtuali (VM) con GPU o TPU collegate, utilizza le richieste di prenotazione future in modalità calendario. Se Google Cloud approva la tua richiesta, Compute Engine esegue il provisioning delle risorse riservate alla data e all'ora scelte e per la durata selezionata. Puoi utilizzare le risorse prenotate per creare VM GPU o VM TPU per eseguire i seguenti carichi di lavoro:
Job di pre-addestramento dei modelli
Job di ottimizzazione del modello
Workload di simulazione per il computing ad alte prestazioni (HPC)
Aumenti previsti a breve termine dei carichi di lavoro di inferenza
Creare una richiesta in modalità calendario
Le sezioni seguenti spiegano come visualizzare la disponibilità delle risorse e quali dettagli specificare quando crei una richiesta di prenotazione futura in modalità calendario.
Visualizzare la disponibilità futura delle risorse
Prima di creare una richiesta di prenotazione futura in modalità calendario, puoi visualizzare la disponibilità futura in una regione delle seguenti risorse:
Per le VM GPU, fino a 60 giorni di anticipo
Per le TPU, fino a 120 giorni di anticipo
Compute Engine utilizza lo strumento di pianificazione dei workload dinamici (DWS) per visualizzare quando sono disponibili le risorse richieste. Quando crei una richiesta, specifica il numero, il tipo e il periodo di prenotazione delle risorse che hai confermato come disponibili. Google Cloud è più probabile che approvi la tua richiesta se fornisci queste informazioni.
Definisci le proprietà della richiesta
Quando crei una richiesta di prenotazione futura in modalità calendario, devi specificare le seguenti proprietà:
Eliminazione automatica. Questa proprietà determina se Compute Engine elimina la prenotazione creata automaticamente (auto-created) per la tua richiesta all'ora di fine, anche se la prenotazione non è stata utilizzata completamente. Per creare una richiesta in modalità calendario, devi attivare l'opzione di eliminazione automatica.
Tipo di consumo. Questa proprietà definisce il modo in cui le VM utilizzano la prenotazione creata automaticamente. Quando crei una richiesta in modalità calendario, devi specificare che vuoi creare prenotazioni con target specifico. Questa impostazione indica che solo le VM che hanno come target la prenotazione possono utilizzarla.
Tipo di deployment. Questa proprietà definisce la collocazione delle risorse riservate. Quando crei una richiesta in modalità calendario, devi specificare di eseguire il deployment delle risorse in modo denso. In questo tipo di deployment, le risorse si trovano vicine tra loro per ridurre al minimo la latenza di rete.
Nome. Il nome della richiesta, che deve essere univoco all'interno del progetto.
Numero di risorse. Il numero di VM GPU o TPU da prenotare all'ora di inizio richiesta.
Stato della pianificazione. Questa proprietà definisce se inviare immediatamente la richiesta a Google Cloud per la revisione o salvarla come bozza e inviarla in un secondo momento. Quando crei una richiesta in modalità calendario, devi specificare di inviarla immediatamente per la revisione.
Modalità di prenotazione. Questa proprietà definisce il metodo per prenotare le risorse, che devi impostare su
CALENDAR
per una richiesta in modalità calendario.Nome prenotazione. Il nome della prenotazione che Compute Engine crea automaticamente se Google Cloud approva la tua richiesta.
Tipo di condivisione. Questa proprietà definisce se altri progetti della tua organizzazione possono utilizzare la prenotazione creata automaticamente per la tua richiesta approvata. Puoi specificare una delle seguenti opzioni:
Un solo progetto. Solo il tuo progetto può utilizzare la capacità riservata.
Condiviso. Puoi condividere la capacità riservata con un massimo di 100 altri progetti nella tua organizzazione. Se specifichi questa opzione, devi specificare i progetti con cui condividere la prenotazione creata automaticamente. Per maggiori informazioni, consulta le best practice per le prenotazioni condivise.
Periodo di prenotazione. La data e l'ora in cui Compute Engine esegue il provisioning della capacità richiesta e puoi utilizzarla. Il periodo di prenotazione include quanto segue:
Ora di inizio. Quando vuoi iniziare a utilizzare la capacità prenotata. In base alle risorse che prenoti, l'ora di inizio deve essere almeno uno dei seguenti valori dal momento in cui crei e invii una richiesta:
Per le VM GPU, 87 ore (tre giorni e 15 ore)
Per le TPU, 24 ore
Ora di fine. Quando la capacità richiesta non è più riservata a te. A questo punto, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina le VM che la utilizzano in base all'azione di terminazione specificata per le VM.
Proprietà della risorsa. I requisiti hardware delle VM con GPU o delle TPU che vuoi prenotare. Le VM possono utilizzare una prenotazione solo se le loro proprietà corrispondono a quelle della prenotazione. Per saperne di più, consulta i requisiti per utilizzare le prenotazioni.
Tipo di workload. Se prenoti TPU v5e, devi specificare come prenotare la capacità in base al tipo di workload:
Batch. Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML).
Servizio. Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML.
Zona. La zona in cui vuoi prenotare la capacità.
Procedura di richiesta di revisione
Per prenotare la capacità utilizzando una richiesta di prenotazione futura in modalità calendario, devi creare e inviare la richiesta a Google Cloud per la revisione. Dopo aver creato e inviato una richiesta, Google Cloud la esamina entro un minuto e poi si verifica uno dei seguenti casi:
Google Cloud approva la tua richiesta: Compute Engine prenota le risorse richieste e, entro un minuto dall'approvazione, crea automaticamente una prenotazione vuota. All'ora di inizio della richiesta, Compute Engine esegue il provisioning della capacità richiesta aumentando il numero di TPU nella prenotazione.
Si è verificato un errore. La richiesta non va a buon fine perché la zona della richiesta non dispone di risorse sufficienti. Ti consigliamo di controllare di nuovo la disponibilità delle risorse future e poi creare e inviare una nuova richiesta di revisione.
Ciclo di vita della richiesta
Il seguente diagramma mostra i diversi stati in cui Compute Engine può impostare una richiesta di prenotazione futura in modalità calendario:
Gli stati e il flusso di eventi mostrati nel diagramma precedente sono i seguenti:
PENDING_APPROVAL
: hai creato e inviato una richiesta di revisione. Entro un minuto, Google Cloud approva la richiesta.APPROVED
: Google Cloud ha approvato la tua richiesta. Entro un minuto, Compute Engine crea automaticamente una prenotazione vuota e modifica lo stato della richiesta inPROCURING
.PROCURING
: Compute Engine pianifica il provisioning delle risorse riservate. Prima dell'ora di inizio della richiesta, lo stato della richiesta cambia inPROVISIONING
.PROVISIONING
: Compute Engine sta eseguendo il provisioning delle risorse riservate aumentando il numero di TPU riservate nella prenotazione creata automaticamente. All'ora di inizio della richiesta, lo stato della richiesta cambia inFULFILLED
.FULFILLED
: Compute Engine ha eseguito il provisioning delle risorse riservate e ti vengono addebitate. Puoi utilizzare la prenotazione creata automaticamente creando VM fino all'ora di fine della richiesta.
All'ora di fine della richiesta, Compute Engine elimina la richiesta e la prenotazione creata automaticamente. Inoltre, arresta o elimina le VM che consumano la prenotazione in base all'azione di terminazione che hai specificato per le VM.
Consumare la capacità di provisioning
Dopo che Google Cloud approva una richiesta di prenotazione futura in modalità calendario, Compute Engine crea automaticamente una prenotazione con le seguenti caratteristiche:
La prenotazione creata automaticamente non ha VM GPU o TPU riservate, quindi non puoi ancora utilizzarla.
La prenotazione creata automaticamente eredita le proprietà della VM o della TPU specificate nella richiesta.
All'ora di inizio della richiesta, Compute Engine esegue il provisioning della capacità richiesta aumentando il numero di VM con GPU o TPU nella prenotazione creata automaticamente. Puoi quindi utilizzare la prenotazione creando VM con GPU o TPU che soddisfino tutte le seguenti condizioni:
Le VM e la prenotazione hanno proprietà corrispondenti.
Le VM utilizzano il modello di provisioning vincolato alla prenotazione.
Le VM devono essere arrestate o eliminate all'ora di fine della prenotazione.
Puoi creare VM finché la prenotazione non viene completamente utilizzata o fino all'ora di fine della richiesta. All'ora di fine della richiesta, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina le VM che la utilizzano.
Quota
Le richieste di prenotazione futura in modalità calendario devono utilizzare il modello di provisioning con prenotazione. Questo modello non richiede la quota di Compute Engine per prenotare le risorse. Tuttavia, prima di creare una richiesta, verifica di avere una quota sufficiente per qualsiasi risorsa che non fa parte di una prenotazione quando crei VM, ad esempio dischi o indirizzi IP.
Prezzi
Quando crei una richiesta di prenotazione futura in modalità calendario, non ti viene addebitato alcun costo. Al contrario, ti vengono addebitati costi quando si verifica quanto segue:
Compute Engine esegue il provisioning della capacità richiesta. Quando una richiesta raggiunge lo stato
FULFILLED
, ti vengono addebitate le risorse di cui è stato eseguito il provisioning in base ai prezzi di DWS. Questo modello di prezzi offre vCPU, GPU e TPU a un prezzo scontato.Utilizzi risorse non coperte dalla prenotazione. Quando crei VM che utilizzano una prenotazione creata automaticamente, non ti vengono addebitati nuovamente i costi per le risorse utilizzate. Ti vengono addebitate solo le risorse che non fanno parte della prenotazione, come dischi o indirizzi IP.
L'addebito dei costi termina all'ora di fine della richiesta. A questo punto, Compute Engine elimina la prenotazione creata automaticamente e arresta o elimina tutte le VM che utilizzano la prenotazione.
Limitazioni
Le sezioni seguenti spiegano le limitazioni per le richieste di prenotazione future in modalità calendario.
Limitazioni per tutte le richieste
Tutte le richieste di prenotazione futura in modalità calendario presentano le seguenti limitazioni:
Puoi prenotare risorse per un periodo compreso tra 1 e 90 giorni.
Dopo aver creato e inviato una richiesta, non puoi annullarla, eliminarla o modificarla.
Limitazioni per le richieste di VM GPU
Puoi prenotare le VM GPU solo nel seguente modo:
Puoi prenotare da 1 a 80 VM con GPU per richiesta.
Puoi prenotare le seguenti serie di macchine:
Puoi prenotare VM con GPU solo in zone specifiche.
Limitazioni per le richieste di TPU
Puoi prenotare le TPU solo nel seguente modo:
Puoi prenotare 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024 chip TPU per richiesta.
Puoi prenotare le seguenti versioni di TPU:
Puoi prenotare solo 1, 4 o 8 chip TPU v5e per i tipi di workload di servizio (
SERVING
).Puoi prenotare le TPU solo nelle seguenti zone:
Per TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Per TPU v5p:
us-east5-a
Per TPU v5e:
Per i tipi di workload batch (
BATCH
):us-west4-b
Per i tipi di workload di pubblicazione (
SERVING
):us-central1-a
Limitazioni per tutte le prenotazioni create automaticamente
Una prenotazione creata automaticamente per una richiesta presenta le seguenti limitazioni:
Puoi modificare la prenotazione solo come segue:
Per consentire o impedire ai job Vertex AI di utilizzarlo.
Dopo l'ora di inizio della prenotazione.
Non puoi applicare sconti per impegno di utilizzo (CUD) o sconti per utilizzo sostenuto (SUD) alla prenotazione.
Non puoi eliminare la prenotazione. Compute Engine la elimina all'ora di fine della prenotazione.