Questa pagina è stata tradotta dall'API Cloud Translation.

Crea un'istanza A3 Ultra o A4

Questo documento descrive come creare istanze con GPU collegate dalle serie di macchine A3 Ultra o A4. Per scoprire di più sulla creazione di istanze con GPU collegate, consulta la Panoramica della creazione di un'istanza con GPU collegate.

Le serie di macchine A4 e A3 Ultra sono progettate per consentirti di eseguire cluster AI/ML su larga scala con funzionalità come il posizionamento mirato dei workload, controlli avanzati di manutenzione dei cluster e pianificazione in base alla topologia. Per ulteriori informazioni, consulta Panoramica della gestione dei cluster.

Prima di iniziare

Per esaminare le limitazioni e i passaggi preliminari aggiuntivi per la creazione di istanze con GPU collegate, ad esempio come selezionare un'immagine sistema operativo o controllare la quota di GPU, consulta la Panoramica della creazione di un'istanza con GPU collegate.
Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione verifica la tua identità per l'accesso a Google Cloud servizi e API. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:
  gcloud init
  Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
  
  Nota:se hai installato gcloud CLI in precedenza, assicurati di avere l'ultima versione eseguendo gcloud components update.
2. Set a default region and zone.
REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizza le credenziali che fornisci a gcloud CLI.
Per saperne di più, consulta Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare istanze, chiedi all'amministratore di concederti il ruolo IAM Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare istanze. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare istanze sono necessarie le seguenti autorizzazioni:

compute.instances.create sul progetto
Per utilizzare un'immagine personalizzata per creare la VM: compute.images.useReadOnly sull'immagine
Per utilizzare uno snapshot per creare la VM: compute.snapshots.useReadOnly sullo snapshot
Per utilizzare un template di istanza per creare la VM: compute.instanceTemplates.useReadOnly sul template di istanza
Per specificare una subnet per la VM: compute.subnetworks.use sul progetto o sulla subnet scelta
Per specificare un indirizzo IP statico per la VM: compute.addresses.use sul progetto
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete VPC: compute.subnetworks.useExternalIp sul progetto o sulla subnet scelta
Per assegnare una rete legacy alla VM: compute.networks.use sul progetto
Per assegnare un indirizzo IP esterno alla VM quando utilizzi una rete legacy: compute.networks.useExternalIp sul progetto
Per impostare i metadati dell'istanza VM per la VM: compute.instances.setMetadata sul progetto
Per impostare i tag per la VM: compute.instances.setTags sulla VM
Per impostare le etichette per la VM: compute.instances.setLabels sulla VM
Per impostare un service account che la VM possa utilizzare: compute.instances.setServiceAccount sulla VM
Per creare un nuovo disco per la VM: compute.disks.create sul progetto
Per collegare un disco esistente in modalità di sola lettura o di lettura e scrittura: compute.disks.use sul disco
Per collegare un disco esistente in modalità di sola lettura: compute.disks.useReadOnly sul disco

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Determina come creare istanze A3 Ultra o A4

Per determinare le opzioni che vuoi utilizzare per creare istanze A3 Ultra o A4, completa i seguenti passaggi:

Scegli un'opzione di consumo: per scoprire come scegliere un'opzione di consumo per un'istanza A3 Ultra o A4, consulta Scegli un'opzione di consumo nella documentazione di AI Hypercomputer.

Nota: le istanze A3 Ultra e A4 non supportano le istanze on demand, che è l'opzione predefinita quando si creano istanze Compute Engine.
Ottieni capacità: per scoprire come ottenere capacità per le istanze A3 Ultra o A4 per l'opzione di consumo che hai scelto, consulta Panoramica della capacità nella documentazione di AI Hypercomputer.
Seleziona le istruzioni di creazione: per scoprire tutte le opzioni che puoi utilizzare per creare istanze A3 Ultra o A4, come gruppi di istanze gestite (MIG) o cluster, consulta Panoramica della creazione di VM e cluster nella documentazione di AI Hypercomputer.

Se vuoi utilizzare le funzionalità di gestione dei cluster di A3 Ultra o A4 oppure se non vuoi creare istanze autonome, seleziona un'opzione di creazione nella documentazione di AI Hypercomputer.

Crea un'istanza A3 Ultra o A4

Per creare un'istanza A3 Ultra o A4, completa i seguenti passaggi:

Crea reti VPC
Crea l'istanza
Prepara l'istanza per l'uso

Crea reti VPC

Suggerimento:se stai configurando un test rapido, puoi saltare questo passaggio e specificare una singola NIC --network-interface=nic-type=GVNIC.

Per configurare la rete per il tipo di macchina A4 o A3 Ultra, crea tre reti VPC per le seguenti interfacce di rete:

2 reti VPC standard per le interfacce di rete (NIC) gVNIC. Vengono utilizzati per la comunicazione da host a host.
Per le NIC CX-7 è necessaria una rete VPC con il profilo di rete RoCE. La rete VPC RoCE deve avere 8 subnet, una per ogni NIC CX-7. Queste NIC utilizzano RDMA su Converged Ethernet (RoCE), fornendo la comunicazione a larghezza di banda elevata e bassa latenza essenziale per la comunicazione da GPU a GPU.

Per ulteriori informazioni sulla disposizione del NIC, consulta Controlla la larghezza di banda della rete e la disposizione del NIC.

Crea le reti manualmente seguendo le guide alle istruzioni o automaticamente utilizzando lo script fornito.

Guide con istruzioni

Per creare le reti, puoi utilizzare le seguenti istruzioni:

Per creare le normali reti VPC per le gNIC, consulta Crea e gestisci le reti Virtual Private Cloud.
Per creare la rete VPC RoCE, consulta Crea una rete Virtual Private Cloud per le NIC RDMA.

Per queste reti VPC, ti consigliamo di impostare l'unità massima di trasmissione (MTU) su un valore maggiore. Per il tipo di macchina A4 o A3 Ultra, l'MTU consigliata è di 8896 byte. Per esaminare le impostazioni MTU consigliate per altri tipi di macchine GPU, consulta Impostazioni MTU per i tipi di macchine GPU.

Script

Per creare le emittenti, segui questi passaggi.

Utilizza il seguente script per creare reti VPC per le NIC gVNIC e CX-7.

  
    #!/bin/bash

    # Create regular VPC networks and subnets for the gVNICs
    for N in $(seq 0 1); do
      gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
        --subnet-mode=custom \
        --mtu=8896

      gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --region=REGION \
        --range=10.$N.0.0/16

      gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
        --network=GVNIC_NAME_PREFIX-net-$N \
        --action=ALLOW \
        --rules=tcp:0-65535,udp:0-65535,icmp \
        --source-ranges=10.0.0.0/8
    done

    # Create SSH firewall rules
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=tcp:22 \
      --source-ranges=IP_RANGE

    # Assumes that an external IP is only created for vNIC 0
    gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
      --network=GVNIC_NAME_PREFIX-net-0 \
      --action=ALLOW \
      --rules=icmp \
      --source-ranges=IP_RANGE

  
    # List and make sure network profiles exist in the machine type's zone
    gcloud compute network-profiles list --filter "location.name=ZONE"

    # Create network for CX-7
    gcloud compute networks create RDMA_NAME_PREFIX-mrdma \
      --network-profile=ZONE-vpc-roce \
      --subnet-mode custom \
      --mtu=8896

    # Create subnets
    for N in $(seq 0 7); do
      gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \
        --network=RDMA_NAME_PREFIX-mrdma \
        --region=REGION \
        --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs
    done

Sostituisci quanto segue:

GVNIC_NAME_PREFIX: il prefisso del nome personalizzato da utilizzare per le reti VPC e le subnet regolari per le gNIC.
RDMA_NAME_PREFIX: il prefisso del nome personalizzato da utilizzare per la rete VPC e le subnet RoCE per le NIC CX-7.
ZONE: specifica una zona in cui è disponibile il tipo di macchina che vuoi utilizzare, ad esempio us-central1-a. Per informazioni sulle regioni, consulta la sezione Disponibilità delle GPU per regioni e zone.
REGION: la regione in cui vuoi creare le subnet. Questa regione deve corrispondere alla zona specificata. Ad esempio, se la tua zona è us-central1-a, la tua regione è us-central1.
IP_RANGE: l'intervallo IP da utilizzare per le regole firewall SSH.

(Facoltativo) Per verificare che le risorse di rete VPC siano state create correttamente, controlla le impostazioni di rete nella console Google Cloud :
1. Nella console Google Cloud , vai alla pagina Reti VPC.
  Vai a Reti VPC
2. Cerca nell'elenco le reti che hai creato nel passaggio precedente.
3. Per visualizzare le subnet, le regole firewall e altre impostazioni di rete, fai clic sul nome della rete.

Crea l'istanza

Per creare un'istanza, utilizza una delle seguenti opzioni.

Console

Nella console Google Cloud , vai alla pagina Crea un'istanza.

Vai a Crea un'istanza

Viene visualizzata la schermata Crea un'istanza, che mostra il riquadro Configurazione macchina.
Nel riquadro Configurazione macchina, completa i seguenti passaggi:
1. Specifica un Nome per l'istanza. Consulta Convenzione di denominazione delle risorse.
2. Seleziona la regione e la zona in cui hai prenotato la capacità.
3. Fai clic sulla scheda GPU e poi completa i seguenti passaggi:
  1. Nell'elenco Tipo di GPU, seleziona il tipo di GPU.
    - Per le istanze A4, seleziona NVIDIA B200.
    - Per le istanze A3 Ultra, seleziona NVIDIA H200 141 GB.
  2. Nell'elenco Numero di GPU, seleziona 8.
Nel menu di navigazione, fai clic su Sistema operativo e spazio di archiviazione. Nel riquadro Sistema operativo e spazio di archiviazione visualizzato, completa i seguenti passaggi:
1. Fai clic su Cambia. Viene visualizzato il riquadro Configurazione del disco di avvio.
2. Nella scheda Immagini pubbliche, seleziona un'immagine consigliata. Per un elenco di immagini consigliate, vedi Sistemi operativi.
3. Per confermare le opzioni relative al disco di avvio, fai clic su Seleziona.
Per creare un'istanza con più NIC, completa i seguenti passaggi. In caso contrario, per creare un'istanza con una sola NIC, salta questi passaggi.
- Nel menu di navigazione, fai clic su Networking. Nel riquadro Networking visualizzato, completa i seguenti passaggi:
  1. Nella sezione Interfacce di rete, completa questi passaggi:
  2. Elimina l'interfaccia di rete predefinita. Per eliminare l'interfaccia, fai clic su Elimina.
  3. Fai clic su Aggiungi un'interfaccia di rete. Utilizza questa opzione per aggiungere interfacce di rete che si collegano alle reti VPC che hai creato nella sezione precedente. Quando aggiungi le interfacce di rete, ricorda quanto segue:
    - Per un'interfaccia di rete utilizzata per la comunicazione host-host, seleziona una rete VPC e una subnet normali dagli elenchi Rete e Subnet e imposta l'elenco Scheda di interfaccia di rete su gVNIC.
    - Per un'interfaccia di rete utilizzata per la comunicazione da GPU a GPU, seleziona la rete VPC e la subnet RoCE dagli elenchi Rete e Subnet e imposta l'elenco Scheda di interfaccia di rete su MRDMA per queste interfacce di rete.
Nel menu di navigazione, fai clic su Avanzate. Quindi, completa i passaggi seguenti per il modello di provisioning che vuoi utilizzare.
Avvio flessibile
1. Nella sezione Modello di provisioning, nell'elenco Modello di provisioning delle VM, seleziona Avvio flessibile.
2. In Inserisci il numero di ore, inserisci la quantità massima di tempo per cui vuoi che la VM venga eseguita. Il valore deve essere compreso tra 46 secondi (0.01) e sette giorni (168 o 168 ore).
3. Seleziona Imposta un tempo di attesa per la creazione della VM.
  
  In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
  - Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
  - Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona della regione, specifica una durata di 0 secondi o deseleziona la casella di controllo Imposta un tempo di attesa per la creazione della VM. Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
Con prenotazione
1. Fai clic su Scegli una prenotazione. Questa azione apre un riquadro con un elenco delle prenotazioni disponibili all'interno della zona selezionata. Nell'elenco delle prenotazioni, completa i seguenti passaggi:
  1. Seleziona la prenotazione che vuoi utilizzare per la VM. Puoi anche selezionare un blocco specifico all'interno della prenotazione.
  2. Fai clic su Scegli.
Spot
1. Nella sezione Modello di provisioning, seleziona Spot dall'elenco Modello di provisioning delle VM.
2. (Facoltativo) Per selezionare l'azione di terminazione che si verifica quando Compute Engine esegue il prerilascio della VM, completa i seguenti passaggi:
  1. Espandi la sezione Impostazioni avanzate del modello di provisioning delle VM.
  2. Nell'elenco Alla terminazione della VM, seleziona una delle seguenti opzioni:
    
    Per arrestare la VM durante il prerilascio, seleziona Arresta (valore predefinito).
    
    Per eliminare la VM durante il prerilascio, seleziona Elimina.
Per creare e avviare l'istanza, fai clic su Crea.

gcloud

Per creare la VM, utilizza il comando gcloud compute instances create.

I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questa implementazione. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.

Avvio flessibile

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
    --reservation-affinity=none \
    --provisioning-model=FLEX_START \
    --request-valid-for-duration=REQUEST_VALID_FOR_DURATION \
    --max-run-duration=MAX_RUN_DURATION \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

Sostituisci quanto segue:

VM_NAME: il nome della VM.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
DISK_SIZE: le dimensioni del disco di avvio in GB.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
REQUEST_VALID_FOR_DURATION: la durata per cui è valida la richiesta di creazione della VM. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguiti rispettivamente da d, h, m e s. Ad esempio, specifica 30m per 30 minuti o 1d2h3m4s per un giorno, due ore, tre minuti e quattro secondi. Se non specifichi una durata, la durata predefinita è 90 secondi.

In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
- Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
- Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona all'interno della regione, specifica una durata di zero secondi (0). Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
MAX_RUN_DURATION: la durata per cui vuoi eseguire le VM richieste. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguito rispettivamente da d, h, m e s. Ad esempio, specifica 30m per 30 minuti o 1d2h3m4s per un giorno, due ore, tre minuti e quattro secondi. Il valore deve essere compreso tra 10 minuti e sette giorni.

Con prenotazione

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=TERMINATION_ACTION \
    --maintenance-policy=TERMINATE

Sostituisci quanto segue:

VM_NAME: il nome della VM.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
DISK_SIZE: le dimensioni del disco di avvio in GB.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
RESERVATION: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:
- Per creare l'istanza su un blocco:
```
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
```
  Inoltre, per creare più istanze nello stesso blocco, applica la stessa policy di posizionamento compatto che specifica una collocazione di blocchi (maxDistance=2) quando crei ogni istanza. Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.
- Per creare l'istanza su un blocco specifico:
```
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
```
Suggerimento:se la prenotazione esiste nel progetto corrente, puoi omettere projects/RESERVATION_OWNER_PROJECT_ID/reservations/ dal valore della prenotazione.
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) la VM al termine del periodo di prenotazione.

Spot

gcloud compute instances create VM_NAME  \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
    --network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
    --network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
    --provisioning-model=SPOT \
    --instance-termination-action=TERMINATION_ACTION

Sostituisci quanto segue:

VM_NAME: il nome della VM.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
DISK_SIZE: le dimensioni del disco di avvio in GB.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
TERMINATION_ACTION: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovvero STOP (impostazione predefinita) o DELETE.

Importante: assicurati che la tua applicazione possa gestire la preemption. Ad esempio, ti consigliamo di gestire il prerilascio specificando uno script di arresto durante la creazione dell'istanza. Scopri come gestire il prerilascio con uno script di arresto.

REST

Per creare la VM, invia una richiesta POST al metodo instances.insert.

I parametri da specificare dipendono dall'opzione di consumo che utilizzi per questa implementazione. Seleziona la scheda corrispondente al modello di provisioning dell'opzione di consumo.

Avvio flessibile

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "hyperdisk-balanced",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "NO_RESERVATION",
  },
  "scheduling":{
    "provisioningModel": "FLEX_START",
    "requestValidForDuration": {
      "seconds": REQUEST_VALID_FOR_DURATION
    },
    "maxRunDuration": {
      "seconds": MAX_RUN_DURATION
    },
    "instanceTerminationAction": "DELETE",
    "onHostMaintenance": "TERMINATE",
  }
}

Sostituisci quanto segue:

PROJECT_ID: l'ID progetto del progetto in cui vuoi creare la VM.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
VM_NAME: il nome della VM.
DISK_SIZE: le dimensioni del disco di avvio in GB.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
NETWORK_PROJECT_ID: l'ID progetto della rete.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
REGION: la regione della subnet.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
REQUEST_VALID_FOR_DURATION: la durata per cui è valida la richiesta di creazione della VM. Devi formattare il valore come numero di giorni, ore, minuti o secondi seguiti rispettivamente da d, h, m e s. Ad esempio, specifica 30m per 30 minuti o 1d2h3m4s per un giorno, due ore, tre minuti e quattro secondi. Se non specifichi una durata, la durata predefinita è 90 secondi.

In base ai requisiti di zona per il tuo carico di lavoro, ti consigliamo di specificare una delle seguenti durate per aumentare le probabilità di riuscita della richiesta di creazione della VM:
- Workload con requisiti di zona rigorosi: se il tuo workload richiede la creazione della VM in una zona specifica, specifica una durata compresa tra 90 secondi e 2 ore. Le durate più lunghe aumentano le probabilità di ottenere risorse.
- Workload senza requisiti di zona rigorosi: se la VM può essere eseguita in qualsiasi zona all'interno della regione, specifica una durata di zero secondi (0). Questa azione specifica che Compute Engine alloca le risorse solo se sono immediatamente disponibili. Se la richiesta di creazione della VM non va a buon fine perché le risorse non sono disponibili, riprova a inviare la richiesta in un'altra zona.
MAX_RUN_DURATION: la durata per cui vuoi eseguire le VM richieste. Devi formattare il valore come numero di secondi. Ad esempio, specifica 86400 per un giorno. Il valore deve essere compreso tra 10 minuti e sette giorni.

Con prenotazione

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "hyperdisk-balanced",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
    }
  ],
  "reservationAffinity":{
    "consumeReservationType": "SPECIFIC_RESERVATION",
    "key": "compute.googleapis.com/reservation-name",
    "values":[
      "RESERVATION"
    ]
  },
  "scheduling":{
    "provisioningModel": "RESERVATION_BOUND",
    "instanceTerminationAction": "TERMINATION_ACTION",
    "onHostMaintenance": "TERMINATE",
    "automaticRestart": true
  }
}

Sostituisci quanto segue:

PROJECT_ID: l'ID progetto del progetto in cui vuoi creare la VM.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
VM_NAME: il nome della VM.
DISK_SIZE: le dimensioni del disco di avvio in GB.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
NETWORK_PROJECT_ID: l'ID progetto della rete.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
REGION: la regione della subnet.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
RESERVATION: il nome della prenotazione o un blocco specifico all'interno di una prenotazione. Per ottenere il nome della prenotazione o i blocchi disponibili, vedi Visualizzare la capacità riservata. In base al tuo requisito per il posizionamento dell'istanza, scegli una delle seguenti opzioni:
- Per creare l'istanza su un blocco:
```
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
```
  Inoltre, per creare più istanze nello stesso blocco, applica la stessa policy di posizionamento compatto che specifica una collocazione di blocchi (maxDistance=2) quando crei ogni istanza. Compute Engine applica quindi la policy alla prenotazione e crea istanze sullo stesso blocco.
- Per creare l'istanza su un blocco specifico:
```
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
```
Suggerimento:se la prenotazione esiste nel progetto corrente, puoi omettere projects/RESERVATION_OWNER_PROJECT_ID/reservations/ dal valore della prenotazione.
TERMINATION_ACTION: indica se Compute Engine arresta (STOP) o elimina (DELETE) la VM al termine del periodo di prenotazione.

Spot

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "name": "VM_NAME",
  "disks":[
    {
      "boot":true,
      "initializeParams":{
        "diskSizeGb": "DISK_SIZE",
        "diskType": "hyperdisk-balanced",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "mode": "READ_WRITE",
      "type": "PERSISTENT"
    }
  ],
  "serviceAccounts": [
    {
      "email": "default",
      "scopes": [
        "https://www.googleapis.com/auth/cloud-platform"
      ]
    }
  ],
  "networkInterfaces": [
    {
      "accessConfigs": [
        {
          "name": "external-nat",
          "type": "ONE_TO_ONE_NAT"
        }
      ],
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
      "nicType": "GVNIC",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
    },
    {
      "network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
      "nicType": "MRDMA",
      "subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
    }
  ],
  "scheduling":
  {
    "provisioningModel": "SPOT",
    "instanceTerminationAction": "TERMINATION_ACTION"
  }
}

Sostituisci quanto segue:

PROJECT_ID: l'ID progetto del progetto in cui vuoi creare la VM.
ZONE: la zona in cui è disponibile il tipo di macchina che vuoi utilizzare. Per informazioni sulle regioni, vedi Disponibilità delle GPU per regioni e zone.
MACHINE_TYPE: il tipo di macchina da utilizzare per la VM. Per saperne di più, vedi Tipi di macchine GPU.
VM_NAME: il nome della VM.
DISK_SIZE: le dimensioni del disco di avvio in GB.
IMAGE_PROJECT: l'ID progetto dell'immagine del sistema operativo.
IMAGE_FAMILY: la famiglia di immagini dell'immagine del sistema operativo che vuoi utilizzare. Per un elenco dei sistemi operativi supportati, consulta Dettagli del sistema operativo.
NETWORK_PROJECT_ID: l'ID progetto della rete.
GVNIC_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet standard che utilizzano gVNIC.
REGION: la regione della subnet.
RDMA_NAME_PREFIX: il prefisso del nome che hai specificato durante la creazione delle reti VPC e delle subnet che utilizzano NIC RDMA.
TERMINATION_ACTION: l'azione da intraprendere quando Compute Engine prerilascia l'istanza, ovvero STOP (impostazione predefinita) o DELETE.

Importante: assicurati che la tua applicazione possa gestire la preemption. Ad esempio, ti consigliamo di gestire il prerilascio specificando uno script di arresto durante la creazione dell'istanza. Scopri come gestire il prerilascio con uno script di arresto.

Preparare l'istanza per l'uso

Per preparare un'istanza con GPU collegate per l'utilizzo, completa i seguenti passaggi:

Per consentire a un'istanza A4 o A3 Ultra di utilizzare le GPU collegate, è necessario che sull'istanza siano installati i driver GPU. A meno che l'immagine nell'istanza non includa già i driver GPU richiesti,installa i driver GPU.
Se hai creato una VM spot nella sezione precedente, completa i seguenti passaggi:
- Per preparare la VM spot a un potenziale prerilascio, consulta Gestisci il prerilascio delle VM spot.
- (Facoltativo) Scopri di più sulle best practice per le VM spot.

Passaggi successivi

Per monitorare le prestazioni della GPU, vedi Monitora le prestazioni della GPU.
Per risolvere i problemi relativi alle istanze GPU, consulta Risoluzione dei problemi relativi alle VM GPU.
Scopri di più sulle piattaforme GPU.