Utilizzare una prenotazione

Se hai una prenotazione di TPU, puoi utilizzare le risorse riservate per creare TPU corrispondenti alle proprietà della prenotazione. Questa azione è nota come utilizzo di una prenotazione. Per informazioni sull'utilizzo di una prenotazione TPU quando utilizzi GKE, consulta la sezione Prenotazione TPU nella documentazione di GKE.

Utilizzare una prenotazione specifica

Quando crei risorse con il comando gcloud alpha compute tpus queued-resources create, utilizza il flag --reservation per specificare il nome della prenotazione da utilizzare. Per le prenotazioni future create in modalità calendario, devi anche impostare il --provisioning-model flag su reservation-bound:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Sostituisci le seguenti variabili segnaposto:

  • QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
  • TPU_NAME: un ID (nome) assegnato dall'utente per la TPU che viene creato quando viene allocata la richiesta di risorse in coda.
  • ZONE: la zona in cui creare la VM TPU. Per ulteriori informazioni sulle zone supportate, consulta Regioni e zone.
  • ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
  • SOFTWARE_VERSION: la versione software di Cloud TPU.
  • RESERVATION_URL: l'URL della prenotazione. Specifica uno dei seguenti valori:
    • Se la prenotazione si trova nel tuo progetto: RESERVATION_NAME
    • Se la prenotazione si trova in un altro progetto e il tuo progetto può utilizzarla: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Utilizza qualsiasi prenotazione corrispondente

Puoi utilizzare il flag --reserved per determinare automaticamente la prenotazione da utilizzare in base al tipo di acceleratore, all'ID progetto e alla zona.

CreateNode

Per utilizzare qualsiasi prenotazione corrispondente utilizzando l'API CreateNode, utilizza il comando gcloud alpha compute tpus tpu-vm create con il --reserved flag:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Sostituisci le seguenti variabili segnaposto:

  • TPU_NAME: un nome per la TPU.
  • ZONE: la zona in cui creare la VM TPU, che deve corrispondere alla zona di prenotazione.
  • ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
  • SOFTWARE_VERSION: la versione software di Cloud TPU.

Risorse in coda

Per utilizzare qualsiasi prenotazione corrispondente utilizzando le risorse in coda, utilizza il comando gcloud alpha compute tpus queued-resources create con il flag --reserved:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Sostituisci le seguenti variabili segnaposto:

  • QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
  • TPU_NAME: un ID (nome) assegnato dall'utente per la TPU che viene creato quando viene allocata la richiesta di risorse in coda.
  • ZONE: la zona in cui creare la VM TPU e in cui esiste la prenotazione.
  • ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
  • SOFTWARE_VERSION: la versione software di Cloud TPU.

Controllare l'utilizzo della prenotazione

Puoi controllare l'utilizzo di una prenotazione condivisa solo dal progetto del proprietario. Se ti trovi in un progetto consumer, devi passare al progetto del proprietario per controllare l'utilizzo delle prenotazioni.

Per vedere la quantità di spazio di archiviazione della prenotazione in uso, utilizza il comando gcloud compute reservations describe:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Sostituisci le seguenti variabili segnaposto:

  • RESERVATION_NAME: il nome della prenotazione.
  • PROJECT_ID: l'ID del progetto che contiene la prenotazione.
  • ZONE: la zona in cui esiste la prenotazione.

Per elencare tutte le prenotazioni in un progetto, utilizza il comando gcloud compute reservations list:

gcloud compute reservations list --project=PROJECT_ID

Sostituisci la seguente variabile segnaposto:

  • PROJECT_ID: l'ID del progetto.

Passaggi successivi