Cotas do Cloud TPU
Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre os preços da Cloud TPU, consulte Preços da Cloud TPU.
Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um Google Cloud recurso o projeto Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
- Monitora o consumo de Google Cloud produtos e serviços
- Restringe o consumo desses recursos.
- Fornece um meio de solicitar mudanças no valor da cota e automatizar ajustes de cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.
As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.
.cota de TPU
As cotas de TPU são limites no número de núcleos do Cloud TPU que você pode usar com um projetoGoogle Cloud . Cada versão da TPU está associada a uma cota. Além disso, cada cota da versão do Cloud TPU é dividida em cota sob demanda e preemptiva (ou spot).
Por padrão, você cria recursos sob demanda ao criar recursos do Cloud TPU. É possível criar recursos preempíveis usando o parâmetro --spot
ao criar recursos com o comando gcloud
. Para mais informações, consulte
Gerenciar recursos de TPU.
Cotas padrão do Cloud TPU
As tabelas a seguir mostram os valores padrão para a cota sob demanda e preemptível de cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.
Cotas preemptivas
Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
---|---|---|
v6e | 64 núcleos | Núcleos preemptivos da TPU v6e por projeto e zona |
v5p | 768 núcleos | Núcleos preemptivos da TPU v5p por projeto e zona |
v5e | 64 núcleos | Núcleos de pod TPU v5 lite preemptivos por projeto e zona |
v4 | 0 núcleos | Núcleos de pod preemptivos da TPU v4 por projeto e zona |
Pod v3 | 32 núcleos | Núcleos de pod preemptivos da TPU v3 por projeto e zona |
v3 | 120 núcleos | Núcleos preemptivos da TPU v3 por projeto e zona |
Pod v2 | 32 núcleos | Núcleos de pod preemptivos da TPU v2 por projeto e zona |
v2 | 120 núcleos | Núcleos preemptivos de TPU v2 por projeto e zona |
Cotas sob demanda
Versão da TPU | Cota padrão (número de núcleos) | Nome da cota |
---|---|---|
v6e | 32 núcleos | Núcleos da TPU v6e por projeto e zona |
v5p | 128 núcleos | Núcleos da TPU v5p por projeto e zona |
v5e | 32 núcleos | Núcleos de pod TPU v5 Lite por projeto e por zona |
v4 | 0 núcleos | Núcleos de pod da TPU v4 por projeto e zona |
v3 | 32 núcleos | Núcleos de pod da TPU v3 por projeto e zona |
v3 | 40 núcleos | Núcleos de TPU v3 por projeto e zona |
Pod v2 | 32 núcleos | Núcleos de TPU v2 por projeto e por zona |
v2 | 40 núcleos | Núcleos de pod da TPU v2 por projeto e zona |
Conferir e solicitar cota extra
Confira a cota alocada para seu Google Cloud projeto na página Cotas no console do Google Cloud.
É possível solicitar mais cota do Cloud TPU na página Cotas. Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para mais informações, consulte Solicitar um limite de cota maior. Se você solicitar uma cota abaixo do limite de aprovação automática, ela será aprovada automaticamente.
Cotas preemptivas
Versão da TPU | Limite de aprovação automática | Nome da cota |
---|---|---|
v6e | Todas as zonas: 0 cores | Núcleos preemptivos da TPU v6e por projeto e zona |
v5p | Todas as zonas: 0 cores | Núcleos preemptivos da TPU v5p por projeto e zona |
v5e |
|
Núcleos de pod TPU v5 lite preemptivos por projeto e zona |
v4 | Todas as zonas: 0 cores | Núcleos de pod preemptivos da TPU v4 por projeto e zona |
Pod v3 |
|
Núcleos de pod preemptivos da TPU v3 por projeto e zona |
v3 |
|
Núcleos preemptivos da TPU v3 por projeto e zona |
Pod v2 |
|
Núcleos de pod preemptivos da TPU v2 por projeto e zona |
v2 |
|
Núcleos preemptivos de TPU v2 por projeto e zona |
Cotas sob demanda
Versão da TPU | Limite de aprovação automática | Nome da cota |
---|---|---|
v6e | Todas as zonas: 0 cores | Núcleos da TPU v6e por projeto e zona |
v5p | us-east5-a: 64 núcleos | Núcleos da TPU v5p por projeto e zona |
v5e | Todas as zonas: 64 cores | Núcleos de pod TPU v5 Lite por projeto e por zona |
v4 | Todas as zonas: 0 cores | Núcleos de pod da TPU v4 por projeto e zona |
v3 |
|
Núcleos de pod da TPU v3 por projeto e zona |
v3 |
|
Núcleos de TPU v3 por projeto e zona |
Pod v2 |
|
Núcleos de TPU v2 por projeto e por zona |
v2 |
|
Núcleos de pod da TPU v2 por projeto e zona |
Você vai receber um e-mail informando se o pedido de cota foi aprovado ou negado. O aumento da cota do serviçoGoogle Cloud é feito gradualmente. Isso pode resultar em ou lançamentos contínuos em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Cotas não refletirá o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Conferir os lançamentos em andamento.