Modelli di provisioning delle istanze Compute Engine


Questo documento descrive i modelli di provisioning per le istanze Compute Engine. Per scoprire di più sulle opzioni di deployment, consulta Scegliere una strategia di deployment di Compute Engine per il tuo workload.

I modelli di provisioning determinano la disponibilità, la durata e il prezzo delle tue istanze. Se comprendi questi modelli, puoi scegliere l'opzione migliore per il tuo workload.

Modelli di provisioning disponibili

Quando crei un'istanza di calcolo, puoi specificare uno dei seguenti modelli di provisioning. Se non specifichi un modello di provisioning, Compute Engine utilizza il modello di provisioning standard per impostazione predefinita.

  • Standard

  • Spot

  • Avvio flessibile (anteprima)

  • Con prenotazione

La seguente tabella ti aiuta a confrontare i casi d'uso e i prezzi di ciascun modello di provisioning:

Standard Spot Avvio flessibile (anteprima) Con prenotazione
Riepilogo
  • In base alla disponibilità delle risorse, puoi creare immediatamente istanze.
  • Puoi controllare quando arrestare o eliminare le istanze.
  • In base alla disponibilità delle risorse, puoi creare immediatamente istanze.
  • Puoi controllare quando arrestare o eliminare le istanze. Tuttavia, puoi anche consentire a Compute Engine di arrestare o eliminare le istanze in qualsiasi momento per recuperare la capacità.
  • Dopo aver creato un gruppo di istanze gestite (MIG) a livello di zona, richiedi a Compute Engine di aggiungere istanze con GPU collegate al MIG. Compute Engine pianifica il provisioning delle istanze in base alla disponibilità delle risorse.
  • Puoi controllare quando eliminare le istanze. Tuttavia, non puoi arrestarli, sospenderli o ricrearli. Le istanze vengono eseguite per un massimo di sette giorni. Dopodiché, Compute Engine le elimina.
  • Puoi richiedere di prenotare la capacità in una data futura per creare istanze con GPU collegate. Se Google Cloud approva la tua richiesta, Compute Engine crea una prenotazione. All'inizio del periodo di prenotazione, puoi utilizzare la prenotazione creando istanze GPU corrispondenti.
  • Durante il periodo di prenotazione approvato, puoi arrestare, riavviare, eliminare e ricreare le istanze per utilizzare la prenotazione in base alle necessità. Al termine del periodo di prenotazione, Compute Engine elimina la prenotazione e arresta o elimina le istanze che la utilizzano.
Casi d'uso Ideale per i carichi di lavoro che richiedono stabilità e funzionamento continuo, come i seguenti carichi di lavoro:
  • Server web
  • Database
  • Applicazioni aziendali
  • Sviluppo e test
Ideale per i workload che possono tollerare interruzioni, come i seguenti:
  • Elaborazione dei dati in modalità batch
  • Computing ad alte prestazioni (HPC)
  • Integrazione continua e deployment continuo (CI/CD)
  • Analisi di dati
  • Codifica dei contenuti multimediali
  • Inferenza online
Workload che richiedono stabilità e devono essere eseguiti per non più di sette giorni, ad esempio i seguenti workload:
  • Pre-addestramento del modello piccolo
  • Ottimizzazione del modello
  • Simulazione HPC
  • Inferenza batch
Ideale per i carichi di lavoro che richiedono stabilità e un runtime specifico, come i seguenti:
  • Per i workload che durano fino a 90 giorni:
    • Job di pre-addestramento dei modelli
    • Job di ottimizzazione del modello
    • Workload di simulazione HPC
    • Aumenti previsti a breve termine dei carichi di lavoro di inferenza
  • Per i workload più lunghi di 90 giorni:
    • Workload di addestramento
    • Carichi di lavoro di inferenza
Prezzi Per le istanze vengono applicati i prezzi standard. Per saperne di più, consulta Prezzi delle istanze VM. La maggior parte delle vCPU, delle GPU e degli SSD locali sono disponibili con uno sconto del 60-91%. Per ulteriori informazioni, consulta Prezzi delle VM spot. In base alla famiglia di macchine utilizzata dalle tue istanze, puoi ottenere uno sconto fino al 53% per vCPU e GPU. Consulta i prezzi di Dynamic Workload Scheduler (DWS). In base alla famiglia di macchine utilizzata dalle tue istanze, puoi ottenere uno sconto fino al 53% per vCPU e GPU. Inoltre, ti vengono addebitati costi in base a come prenoti la capacità per creare istanze nel seguente modo:
Quota Quando crei un'istanza, viene consumata la quota standard. Quando crei un'istanza, viene utilizzata la quota prerilasciabile . Se il progetto non dispone di una quota prerilasciabile, viene utilizzata la quota standard. I crediti del livello gratuito non si applicano alle VM spot.Google Cloud Quando il gruppo di istanze gestite aggiunge istanze al gruppo, viene consumata la quota prerilasciabile. Se il progetto non ha una quota prerilasciabile, viene utilizzata la quota standard. La quota non si applica al modello di provisioning con prenotazione.

Disponibilità e durata dell'istanza

La tabella seguente mostra la disponibilità e la durata delle istanze di calcolo per ogni modello di provisioning:

Standard Spot Avvio flessibile (anteprima) Con prenotazione
Prerequisiti per la creazione Nessun prerequisito per la creazione. Nessun prerequisito per la creazione. Nessun prerequisito per la creazione.

Per creare istanze, devi prima prenotare la capacità utilizzando uno dei seguenti metodi:

Nella data e nell'ora di consegna scelte, Compute Engine esegue il provisioning della capacità richiesta. Poi, puoi utilizzare la capacità creando istanze.
Serie di macchine supportate Puoi utilizzare qualsiasi serie di macchine, ad eccezione di A4X, A4 e A3 Ultra. Puoi utilizzare qualsiasi serie di macchine, ad eccezione delle seguenti:
  • M2 e M3
  • Istanze bare metal
Puoi utilizzare solo le seguenti serie di macchine:
A seconda di come prenoti la capacità per creare VM, puoi utilizzare solo le seguenti serie di macchine:
Disponibilità dell'istanza Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Puoi creare istanze in qualsiasi momento, a condizione che le risorse richieste siano disponibili. Puoi creare istanze solo creando richieste di ridimensionamento in un MIG. Compute Engine utilizza DWS per pianificare il provisioning della capacità richiesta in base alla disponibilità delle risorse. DWS ti aiuta a ottenere risorse molto richieste come le GPU. Puoi creare istanze solo dopo aver prenotato la capacità per una data futura. Nella data richiesta, Compute Engine fornisce la capacità richiesta, che puoi utilizzare per creare istanze. Se prenoti risorse utilizzando le prenotazioni future in modalità calendario, Compute Engine utilizza DWS per eseguire il provisioning della capacità richiesta. DWS ti aiuta a ottenere risorse ad alta richiesta come le GPU.
Durata dell'istanza Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta le istanze durante gli eventi di manutenzione dell'host.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Compute Engine potrebbe arrestare o eliminare l'istanza in qualsiasi momento per recuperare la capacità. Questo processo è chiamato preemption.
  • Se il tipo di macchina utilizzato dall'istanza non supporta la migrazione live, Compute Engine arresta le istanze durante gli eventi di manutenzione dell'host.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.
Le istanze di cui è stato eseguito il provisioning vengono eseguite per la durata di esecuzione scelta, che può essere fino a sette giorni. Non puoi arrestare, sospendere o ricreare le istanze.

Compute Engine elimina le istanze quando si verifica uno dei seguenti eventi:
  • Richiedi l'eliminazione delle istanze.
  • Le istanze raggiungono la fine della durata di esecuzione.
Puoi controllare quando arrestare o eliminare un'istanza, tranne nei seguenti casi:
  • Compute Engine arresta l'istanza durante gli eventi di manutenzione dell'host.
  • La prenotazione creata automaticamente per eseguire il provisioning della capacità richiesta raggiunge la fine del periodo di prenotazione impegnata. A quel punto, Compute Engine elimina la prenotazione e arresta o elimina le istanze che la utilizzano.
  • In rari casi, l'istanza potrebbe arrestarsi a causa di un errore dell'host.

Passaggi successivi