Consumir uma reserva

Se você tiver uma reserva de TPU, poderá usar seus recursos reservados para criar TPUs que correspondam às propriedades da reserva. Essa ação é conhecida como consumir uma reserva. Para informações sobre como consumir uma reserva de TPU ao usar o GKE, consulte Reserva de TPU na documentação do GKE.

Consumir uma reserva específica

Ao criar recursos com o comando gcloud alpha compute tpus queued-resources create, use a flag --reservation para especificar o nome da reserva a ser consumida. Para reservas futuras criadas no modo de agenda, também é necessário definir a flag --provisioning-model como reservation-bound:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_NAME \
    --provisioning-model=reservation-bound # Only required for calendar mode

Substitua as seguintes variáveis ​​de marcador:

  • QUEUED_RESOURCE_ID: um ID atribuído pelo usuário para a solicitação de recurso em fila.
  • TPU_NAME: um ID (nome) atribuído pelo usuário para o TPU que é criado quando a solicitação de recurso em fila é alocada.
  • ZONE: a zona em que a VM da TPU será criada. Para mais informações sobre as zonas com suporte, consulte Regiões e zonas.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho do Cloud TPU a ser criado. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
  • SOFTWARE_VERSION: a versão do software da Cloud TPU.
  • RESERVATION_NAME: o nome da reserva a ser consumida.

Consumir qualquer reserva correspondente

É possível usar a flag --reserved para determinar automaticamente a reserva a ser usada com base no tipo de acelerador, no ID do projeto e na zona.

CreateNode

Para consumir qualquer reserva correspondente usando a API CreateNode, use o comando gcloud alpha compute tpus tpu-vm create com a sinalização --reserved:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Substitua as seguintes variáveis ​​de marcador:

  • TPU_NAME: um nome para a TPU.
  • ZONE: a zona em que a VM da TPU será criada. Para mais informações sobre as zonas com suporte, consulte Regiões e zonas.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho do Cloud TPU a ser criado. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
  • SOFTWARE_VERSION: a versão do software da Cloud TPU.

Recursos na fila

Para consumir qualquer reserva correspondente usando recursos em fila, use o comando gcloud alpha compute tpus queued-resources create com a flag --reserved:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Substitua as seguintes variáveis ​​de marcador:

  • QUEUED_RESOURCE_ID: um ID atribuído pelo usuário para a solicitação de recurso em fila.
  • TPU_NAME: um ID (nome) atribuído pelo usuário para o TPU que é criado quando a solicitação de recurso em fila é alocada.
  • ZONE: a zona em que a VM da TPU será criada. Para mais informações sobre as zonas com suporte, consulte Regiões e zonas.
  • ACCELERATOR_TYPE: especifica a versão e o tamanho do Cloud TPU a ser criado. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte Versões de TPU.
  • SOFTWARE_VERSION: a versão do software da Cloud TPU.

Verificar o uso da reserva

Para saber qual parte da reserva está em uso, use o comando gcloud compute reservations describe.

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Substitua as seguintes variáveis ​​de marcador:

  • RESERVATION_NAME: o nome da reserva.
  • PROJECT_ID: o ID do projeto que contém a reserva.
  • ZONE: a zona em que a reserva existe.

Para listar todas as reservas em um projeto, use o comando gcloud compute reservations list:

gcloud compute reservations list --project=PROJECT_ID

Substitua a seguinte variável de marcador de posição:

  • PROJECT_ID: o ID do projeto

A seguir