Guia do usuário sobre recursos em fila
Os recursos na fila permitem que você solicite recursos do Cloud TPU em fila. Quando você solicita recursos na fila, a solicitação é adicionada a uma fila mantida pelo serviço do Cloud TPU. Quando o recurso solicitado fica disponível, atribuídos ao seu projeto do Google Cloud para uso exclusivo imediato. Ela vai continuar atribuído ao seu projeto, a menos que você o exclua ou seja interrompido. Somente As VMs spot e as TPUs preemptivas de TPU estão qualificadas para a preempção.
É possível especificar um horário de início e término em uma fila. solicitação de recurso. O horário de início especifica o horário mais cedo para o preenchimento da solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado, o solicitação expirar. A solicitação permanece na fila após expirar.
As solicitações de recursos em fila podem estar em um dos seguintes estados:
WAITING_FOR_RESOURCES
- A solicitação passou na validação inicial e foi adicionada à fila. Ele permanece nesse estado até que haja recursos livres suficientes para começar provisionando sua solicitação ou o intervalo de alocação passa. Quando a demanda é alta, nem todas as solicitações podem ser feitas provisionado. Se você precisar de uma capacidade de obtenção mais confiável de TPUs, considere a compra de uma reserva.
PROVISIONING
- A solicitação foi selecionada na fila e os recursos dela estão sendo alocados.
ACTIVE
- A solicitação foi alocada. Quando as solicitações de recursos na fila estão no
ACTIVE
, é possível gerenciar suas VMs de TPU conforme descrito em Gerenciar TPUs. FAILED
- Não foi possível concluir a solicitação porque há um problema com a solicitação ou os recursos solicitados não estavam disponíveis no intervalo de alocação. A solicitação permanece na fila até ser explicitamente excluída.
SUSPENDING
- Os recursos associados à solicitação estão sendo excluídos.
SUSPENDED
- Os recursos especificados na solicitação foram excluídos. Quando uma solicitação
está no estado
SUSPENDED
, não está mais qualificada para alocação do projeto.
Pré-requisitos
Antes de executar os comandos deste guia, faça o seguinte:
- Instale os componentes Alfa da Google Cloud CLI.
- Ative a API Cloud TPU.
Solicitar um recurso na fila sob demanda
É possível solicitar um recurso na fila sob demanda usando o comando gcloud compute tpus queued-resources create
. Para mais informações sobre
recursos sob demanda, consulte Tipos de cota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
Tamanhos de fração padrão para recursos em fila sob demanda
Quando você usa a cota sob demanda, precisa solicitar um tamanho de fração menor que o limite padrão para o tipo de acelerador usado. Solicitações que excedem o os limites padrão são recusados pelo sistema.
A tabela a seguir mostra os tipos de TPU e os respectivos os limites padrão.
Tipo de acelerador | Limite padrão (em número de TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Se você precisar de tamanhos de fatia maiores, entre em contato com o Cloud TPU suporte para obter informações adicionais.
Solicitar um recurso na fila usando uma reserva
É possível solicitar um recurso na fila usando uma reserva especificando o
a sinalização --reserved
no comando gcloud
ou guaranteed.reserved=true
na
curl. Para comprar uma reserva, fale com a equipe de conta do Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de um Cloud TPU reserva.
Solicitar um recurso na fila de VM spot da TPU
Uma VM spot é um recurso que pode ser interrompido e atribuído a outra carga de trabalho a qualquer momento. Recursos da VM spot custam menos e você pode ter acesso aos recursos antes de VM que não é spot. Para mais informações sobre TPU VMs spot, consulte Gerenciar VMs spot de TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
spot
- Uma flag booleana que especifica que o recurso na fila é uma VM spot.
Solicitar que um recurso na fila seja alocado antes ou depois de um período especificado
É possível especificar um horário de início opcional, end horário, início duração ou final duração de uma solicitação de recurso na fila. O hora de início ou duração de início especifica o primeiro horário no qual o preenchimento solicitação. Se uma solicitação não tiver sido preenchida até o horário de término especificado ou dentro de a duração especificada, a solicitação vai expirar. Depois que a solicitação expirar, ela permanece na fila, mas não está mais qualificado para alocação.
Também é possível especificar um intervalo de alocação especificando o horário de início ou a duração e o horário de término ou duração.
Consulte Datetime para um lista de formatos de carimbo de data/hora e duração compatíveis.
Solicitar um recurso na fila após uma duração especificada
É possível especificar uma duração após a qual um recurso deve ser alocado usando
a sinalização --valid-after-duration
. O exemplo a seguir solicita que um v4-32 seja
alocados depois de seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-duration
- O período antes do qual a TPU não pode ser provisionada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI .
Solicitar um recurso na fila que expira após um período especificado
É possível especificar por quanto tempo uma solicitação de recurso na fila permanece válida usando
a sinalização --valid-until-duration
. O exemplo a seguir solicita uma instância v4-32 que
expira se não for preenchido em seis horas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI .
Solicitar um recurso na fila após um período especificado
É possível especificar um período após o qual um recurso deve ser alocado usando o método
sinalização --valid-after-time
.
O comando a seguir solicita uma TPU v4-4096 com
a versão tpu-vm-tf-2.17.0-pjrt
do ambiente de execução que será alocada após as 9h do dia 14 de dezembro de 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-after-time
- Depois desse tempo, o recurso deve ser alocado. Para mais informações sobre os formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila antes de um período especificado
É possível especificar um horário antes de o recurso ser alocado usando o método
sinalização --valid-until-time
.
O comando a seguir solicita uma TPU v4-4096 com
versão do ambiente de execução tpu-vm-tf-2.10.0-pod
criada até 14 de dezembro de 2022 às 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-time
- O horário depois que a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar que um recurso na fila seja alocado dentro de um intervalo especificado
Use qualquer par de --valid-after-time
para especificar um intervalo de alocação.
as sinalizações --valid-after-duration
, --valid-until-duration
e --valid-until-time
,
desde que uma flag especifique o início do intervalo de alocação e o
other especifica o fim do intervalo de alocação.
O comando a seguir solicita uma versão v4-32 em 5 horas e 30 minutos da horário atual, para ser criado até 14 de dezembro de 2022 às 9h.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
valid-until-timw
- O horário depois que a solicitação é cancelada. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
valid-until-duration
- O período de validade da solicitação. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
Solicitar um recurso na fila com um script de inicialização
Você pode especificar um script a ser executado em um recurso na fila depois de ter sido
provisionado. Ao usar o comando gcloud
, é possível usar o --metadata
ou --metadata-from-file
para especificar um comando de script ou um arquivo contendo
o código do script, respectivamente. Ao usar curl
, é necessário incluir o script
no conteúdo JSON. O exemplo a seguir cria um recurso na fila
solicitação que executará o script contido em startup-script.sh
. O curl
mostra um script in-line no corpo JSON.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID definido pelo usuário da TPU criada em resposta à solicitação.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
validInterval
- O tempo de validade da solicitação depois que ela é cancelado. Para mais informações sobre formatos de duração, consulte Data e hora do tópico da Google Cloud CLI.
metadata-from-file
- Especifica um arquivo que contém metadados. Se você não especificar um valor caminho qualificado para o arquivo de metadados, o comando presume que ele está localizado no diretório atual. Neste exemplo, o arquivo contém um script de inicialização que é executado quando o recurso na fila é provisionado.
metadata
- Especifica os metadados da solicitação. Neste exemplo, os metadados são um comando de script de inicialização executado quando o recurso na fila é provisionado.
Solicitar recursos na fila com uma rede e sub-rede especificadas
Você pode solicitar um recurso na fila especificando a rede e a sub-rede que com que você quer conectar a TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrições de parâmetros de comando
queued-resource-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
node-id
- O ID atribuído pelo usuário da TPU, criado quando a na fila solicitação de recurso é alocada.
project
- Seu projeto do Google Cloud.
zone
- A zona em que você planeja criar a Cloud TPU.
accelerator-type
- O tipo de acelerador especifica a versão e o tamanho do Cloud TPU que você quer criar. Para mais informações sobre os tipos de aceleradores compatíveis com cada versão de TPU, consulte versões de TPU.
runtime-version
- A versão do software do Cloud TPU.
reserved
- Use esta sinalização ao solicitar recursos na fila como parte de um Cloud TPU reserva.
network
- Uma rede da qual o recurso na fila fará parte.
subnetwork
- Uma sub-rede da qual o recurso na fila fará parte.
Excluir uma solicitação de recurso na fila
É possível excluir uma solicitação de recurso na fila e a VM da TPU criada pela solicitação
transmitindo a sinalização --force
ao comando queued-resource delete
. Caso contrário,
é preciso excluir a VM da TPU antes de excluir a solicitação de recurso na fila. Quando você
excluir a VM da TPU, a solicitação de recurso na fila é transferida para
Estado SUSPENDED
, depois do qual a solicitação de recurso na fila pode ser
excluída.
Os comandos a seguir excluem a solicitação de recurso na fila chamada
"my-queued-resource" no projeto "my-project" na zona "us-central2-b". Ela
usa a sinalização --force
para excluir a VM da TPU e o recurso na fila.
solicitação.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona do Cloud TPU a ser excluída.
force
- Exclua a VM da TPU e a solicitação de recurso na fila.
Os comandos a seguir excluem a solicitação de recurso na fila chamada "my-queued-resource" no projeto "my-project" na zona "us-central2-b".
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Recuperar informações de estado e diagnósticos sobre uma solicitação de recurso na fila
Recupere as informações de estado e diagnóstico sobre uma solicitação de recurso na fila:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrições de sinalizações de comando
queued-resource-request-id
- O ID atribuído pelo usuário da solicitação de recurso na fila.
project
- O ID do projeto em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.
Se a solicitação falhar, a resposta conterá informações sobre o erro. Para uma solicitação que está aguardando recursos, a saída será semelhante a esta:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Listar solicitações de recursos na fila no projeto
O comando a seguir lista as solicitações de recurso na fila do projeto "your-project-id":
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Descrições de sinalizações de comando
project
- O projeto do Google Cloud em que o recurso na fila está alocado.
zone
- A zona em que você planeja criar a Cloud TPU.