Cotas do Cloud TPU

Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre os preços da Cloud TPU, consulte Preços da Cloud TPU.

Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um Google Cloud recurso o projeto Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

.

cota de TPU

As cotas de TPU são limites no número de núcleos do Cloud TPU que você pode usar com um projetoGoogle Cloud . Cada versão da TPU está associada a uma cota. Além disso, cada cota da versão do Cloud TPU é dividida em cota sob demanda e preemptiva (ou spot).

Por padrão, você cria recursos sob demanda ao criar recursos do Cloud TPU. É possível criar recursos preempíveis usando o parâmetro --spot ao criar recursos com o comando gcloud. Para mais informações, consulte Gerenciar recursos de TPU.

Cotas padrão do Cloud TPU

As tabelas a seguir mostram os valores padrão para a cota sob demanda e preemptível de cada zona disponível. Esses valores especificam o número máximo de núcleos de TPU que podem ser usados no projeto.

Cotas preemptivas

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 64 núcleos Núcleos preemptivos da TPU v6e por projeto e zona
v5p 768 núcleos Núcleos preemptivos da TPU v5p por projeto e zona
v5e 64 núcleos Núcleos de pod TPU v5 lite preemptivos por projeto e zona
v4 0 núcleos Núcleos de pod preemptivos da TPU v4 por projeto e zona
Pod v3 32 núcleos Núcleos de pod preemptivos da TPU v3 por projeto e zona
v3 120 núcleos Núcleos preemptivos da TPU v3 por projeto e zona
Pod v2 32 núcleos Núcleos de pod preemptivos da TPU v2 por projeto e zona
v2 120 núcleos Núcleos preemptivos de TPU v2 por projeto e zona

Cotas sob demanda

Versão da TPU Cota padrão (número de núcleos) Nome da cota
v6e 32 núcleos Núcleos da TPU v6e por projeto e zona
v5p 128 núcleos Núcleos da TPU v5p por projeto e zona
v5e 32 núcleos Núcleos de pod TPU v5 Lite por projeto e por zona
v4 0 núcleos Núcleos de pod da TPU v4 por projeto e zona
v3 32 núcleos Núcleos de pod da TPU v3 por projeto e zona
v3 40 núcleos Núcleos de TPU v3 por projeto e zona
Pod v2 32 núcleos Núcleos de TPU v2 por projeto e por zona
v2 40 núcleos Núcleos de pod da TPU v2 por projeto e zona

Conferir e solicitar cota extra

Confira a cota alocada para seu Google Cloud projeto na página Cotas no console do Google Cloud.

É possível solicitar mais cota do Cloud TPU na página Cotas. Encontre a cota que você quer aumentar, clique nos três pontos verticais e escolha Editar cota. Para mais informações, consulte Solicitar um limite de cota maior. Se você solicitar uma cota abaixo do limite de aprovação automática, ela será aprovada automaticamente.

Cotas preemptivas

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 cores Núcleos preemptivos da TPU v6e por projeto e zona
v5p Todas as zonas: 0 cores Núcleos preemptivos da TPU v5p por projeto e zona
v5e
  • us-east5-b: 800 cores
  • us-west4-a: 1600 cores
  • us-west4-b: 3968 cores
  • us-west1-c: 576 núcleos
  • us-central1-a: 3264 núcleos
  • europe-west4-a: 4032 cores
Núcleos de pod TPU v5 lite preemptivos por projeto e zona
v4 Todas as zonas: 0 cores Núcleos de pod preemptivos da TPU v4 por projeto e zona
Pod v3
  • europe-west4-a: 512 cores
  • us-east1-d: 320 núcleos
Núcleos de pod preemptivos da TPU v3 por projeto e zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 cores
Núcleos preemptivos da TPU v3 por projeto e zona
Pod v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos de pod preemptivos da TPU v2 por projeto e zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 cores
Núcleos preemptivos de TPU v2 por projeto e zona

Cotas sob demanda

Versão da TPU Limite de aprovação automática Nome da cota
v6e Todas as zonas: 0 cores Núcleos da TPU v6e por projeto e zona
v5p us-east5-a: 64 núcleos Núcleos da TPU v5p por projeto e zona
v5e Todas as zonas: 64 cores Núcleos de pod TPU v5 Lite por projeto e por zona
v4 Todas as zonas: 0 cores Núcleos de pod da TPU v4 por projeto e zona
v3
  • europe-west4-a: 128 cores
  • us-east1-d: 64 núcleos
Núcleos de pod da TPU v3 por projeto e zona
v3
  • us-central1-a: 64 núcleos
  • europe-west4-a: 128 cores
Núcleos de TPU v3 por projeto e zona
Pod v2
  • us-central1-a: 64 núcleos
  • europe-west4-a: 64 núcleos
Núcleos de TPU v2 por projeto e por zona
v2
  • us-central1-b: 128 núcleos
  • us-central1-c: 64 núcleos
  • us-central1-f: 128 núcleos
  • europe-west4-a: 32 cores
Núcleos de pod da TPU v2 por projeto e zona

Você vai receber um e-mail informando se o pedido de cota foi aprovado ou negado. O aumento da cota do serviçoGoogle Cloud é feito gradualmente. Isso pode resultar em ou lançamentos contínuos em diferentes regiões ou recursos. Durante o lançamento, o valor de cota que aparece no console do Google Cloud ou na API Cloud Cotas não refletirá o novo valor de cota aumentado até que o lançamento seja concluído. Para mais informações, consulte Conferir os lançamentos em andamento.