Utilizzare una prenotazione
Se hai una prenotazione di TPU, puoi utilizzare le risorse riservate per creare TPU corrispondenti alle proprietà della prenotazione. Questa azione è nota come utilizzo di una prenotazione. Per informazioni sull'utilizzo di una prenotazione TPU quando utilizzi GKE, consulta la sezione Prenotazione TPU nella documentazione di GKE.
Utilizzare una prenotazione specifica
Quando crei risorse con il comando gcloud alpha compute tpus queued-resources
create
, utilizza il flag --reservation
per specificare il nome della prenotazione da utilizzare. Per le prenotazioni future
create in modalità calendario, devi anche impostare il --provisioning-model
flag
su reservation-bound
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
Sostituisci le seguenti variabili segnaposto:
- QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
- TPU_NAME: un ID (nome) assegnato dall'utente per la TPU che viene creato quando viene allocata la richiesta di risorse in coda.
- ZONE: la zona in cui creare la VM TPU. Per ulteriori informazioni sulle zone supportate, consulta Regioni e zone.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
- RESERVATION_URL: l'URL della prenotazione. Specifica uno dei seguenti valori:
- Se la prenotazione si trova nel tuo progetto:
RESERVATION_NAME
- Se la prenotazione si trova in un altro progetto e il tuo progetto può utilizzarla:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- Se la prenotazione si trova nel tuo progetto:
Utilizza qualsiasi prenotazione corrispondente
Puoi utilizzare il flag --reserved
per determinare automaticamente la prenotazione da utilizzare in base al tipo di acceleratore, all'ID progetto e alla zona.
CreateNode
Per utilizzare qualsiasi prenotazione corrispondente utilizzando l'API CreateNode, utilizza il comando gcloud
alpha compute tpus tpu-vm create
con il --reserved
flag:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
Sostituisci le seguenti variabili segnaposto:
- TPU_NAME: un nome per la TPU.
- ZONE: la zona in cui creare la VM TPU, che deve corrispondere alla zona di prenotazione.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
Risorse in coda
Per utilizzare qualsiasi prenotazione corrispondente utilizzando le risorse in coda, utilizza il comando gcloud alpha compute tpus
queued-resources create
con il flag --reserved
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
Sostituisci le seguenti variabili segnaposto:
- QUEUED_RESOURCE_ID: un ID assegnato dall'utente per la richiesta di risorse in coda.
- TPU_NAME: un ID (nome) assegnato dall'utente per la TPU che viene creato quando viene allocata la richiesta di risorse in coda.
- ZONE: la zona in cui creare la VM TPU e in cui esiste la prenotazione.
- ACCELERATOR_TYPE: specifica la versione e le dimensioni della Cloud TPU da creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
- SOFTWARE_VERSION: la versione software di Cloud TPU.
Controllare l'utilizzo della prenotazione
Puoi controllare l'utilizzo di una prenotazione condivisa solo dal progetto del proprietario. Se ti trovi in un progetto consumer, devi passare al progetto del proprietario per controllare l'utilizzo delle prenotazioni.
Per vedere la quantità di spazio di archiviazione della prenotazione in uso, utilizza il comando gcloud compute
reservations describe
:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
Sostituisci le seguenti variabili segnaposto:
- RESERVATION_NAME: il nome della prenotazione.
- PROJECT_ID: l'ID del progetto che contiene la prenotazione.
- ZONE: la zona in cui esiste la prenotazione.
Per elencare tutte le prenotazioni in un progetto, utilizza il comando gcloud compute reservations
list
:
gcloud compute reservations list --project=PROJECT_ID
Sostituisci la seguente variabile segnaposto:
- PROJECT_ID: l'ID del progetto.