Cotas do Cloud TPU

Este documento lista as cotas que se aplicam ao Cloud TPU. Para informações sobre os preços da Cloud TPU, consulte Preços da Cloud TPU.

O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.

O sistema de cotas do Cloud faz o seguinte:

  • Monitora o consumo de produtos e serviços do Google Cloud.
  • Restringe o consumo desses recursos.
  • Fornece um meio de solicitar mudanças no valor da cota

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

.

cota de TPU

Há cotas diferentes para cada versão de TPU. Por exemplo, há diferentes cotas para TPU v2, v3 e assim por diante. Para cada versão de TPU, há diferentes tipos de cota: sob demanda e preemptiva (VMs spot). A tabela a seguir descreve os diferentes tipos de cota.

Tipo da cota Descrição Valor padrão Como solicitar Flags para a criação de TPUs
Sob demanda O número de recursos sob demanda a que você tem acesso. Sob demanda recursos não serão interrompidos, mas a cota sob demanda não garante que não haja haverá recursos suficientes do Cloud TPU disponíveis para atender à solicitação. v3-8 e v2-8: 16 TensorCores
Todos os outros: 0
Consulte Solicitar cota adicional. Nenhuma flag necessária, selecionada por padrão.
Preemptiva O número de recursos preemptivos do Cloud TPU a que você tem acesso. Essa cota se aplica a TPUs preemptivas e VMs spot de TPU. Recursos preemptivos podem ser interrompidos para liberar espaço para maior prioridade a outras vagas. A cota preemptiva não garante que haja recursos suficientes do Cloud TPU disponíveis para atender à sua solicitação. Para mais informações, consulte TPUs preemptivas e Gerenciar VMs do Spot da TPU. v3-8 e v2-8: 48 TensorCores
Todos os outros: 0
Consulte Solicitar cota adicional.

As cotas de TPU são especificadas em termos de núcleos de TPU por projeto por zona ou por projeto por região.

Cotas da TPU v5p

É possível usar a cota de TPU v5p em qualquer combinação de núcleos. Por exemplo, se você tiver cota para 32 núcleos, é possível usá-la para criar quatro frações de TPU cada com 8 núcleos.

Cotas preemptivas:

  • Núcleos preemptivos da TPU v5p por projeto e por região
  • Núcleos de TPU v5p preemptivos por projeto por zona

Cotas sob demanda:

  • Núcleos da TPU v5p por projeto e por região
  • Núcleos da TPU v5p por projeto e zona

cotas da TPU v5e

A TPU v5e pode ser usada para treinamento e disponibilização. Há cotas separadas para treinamento e veiculação, além de host único (núcleos Lite) e vários hosts (núcleos Lite do pod).

Cotas de veiculação

Cotas de veiculação preemptiva:

  • Núcleos de pod TPU v5 lite preemptivos para exibição por projeto e região
  • Núcleos do pod Lite da TPU v5 preemptiva para exibição por projeto por zona

Cotas de veiculação sob demanda:

  • Núcleos do pod da TPU v5 Lite para exibição por projeto e por região
  • Núcleos de pod da TPU v5 lite para exibição por projeto e zona

Cotas de treinamento

Cotas de treinamento preemptivo:

  • Núcleos preemptivas da TPU v5 Lite por projeto por região
  • Núcleos preemptivos da TPU v5 Lite por projeto por zona
  • Núcleos do pod Lite da TPU v5 preemptiva por projeto por região
  • Núcleos do pod Lite da TPU v5 preemptiva por projeto por zona

Cotas de treinamento sob demanda:

  • Núcleos TPU v5 Lite por projeto e região
  • Núcleos TPU v5 Lite por projeto e por zona
  • Núcleos de pod TPU v5 Lite por projeto e região
  • Núcleos de pod TPU v5 Lite por projeto e por zona

Cotas da TPU v4

É possível usar a cota de TPU v4 em qualquer combinação de cores. Por exemplo, se você tiver cota para 32 núcleos, é possível usá-la para criar quatro frações de TPU cada com 8 núcleos.

Cotas preemptivas:

  • Núcleos do pod da TPU v4 preemptiva por projeto e por região
  • Núcleos de pod preemptivos da TPU v4 por projeto e zona

Cotas sob demanda:

  • Núcleos do pod da TPU v4 por projeto por região
  • Núcleos de pod da TPU v4 por projeto e zona

Cotas da TPU v3

Há cotas separadas da TPU v3 para TPUs de host único (core) e TPUs de vários hosts (pod). É preciso usar as cotas de pod v3 para criar TPUs com mais de 8 núcleos.

Cotas preemptivas:

  • núcleos preemptivos da TPU v3 por projeto por região
  • Núcleos da TPU v3 preemptivos por projeto por zona
  • Núcleos de pod preemptivos da TPU v3 por projeto e por região
  • Núcleos do pod da TPU v3 preemptiva por projeto por zona

Cotas sob demanda:

  • núcleos da TPU v3 por projeto por região
  • Núcleos de TPU v3 por projeto e zona
  • Núcleos de TPU v3 por projeto e por região
  • Núcleos do pod da TPU v3 por projeto por zona

Cotas da TPU v2

Há cotas separadas para TPUs v2 de host único (core) e TPUs de vários hosts (pod).

Cotas preemptivas:

  • núcleos preemptivos da TPU v2 por projeto por região
  • Núcleos preemptivos da TPU v2 por projeto por zona
  • Núcleos de pod preemptivos da TPU v2 por projeto e por região
  • Núcleos do pod da TPU v2 preemptiva por projeto por zona

Cotas sob demanda:

  • núcleos da TPU v2 por projeto por região
  • Núcleos de TPU v2 por projeto e por zona
  • Núcleos do pod da TPU v2 por projeto por região
  • Núcleos do pod da TPU v2 por projeto por zona

Para mais informações sobre chips de TPU e TensorCores, consulte Sistema de TPU do Terraform.

Ver e solicitar cota adicional

Confira a cota alocada para seu projeto do Google Cloud na página Cotas no console do Google Cloud. Se você precisar de mais cotas do Cloud TPU, solicite na página de cotas. Para mais informações, consulte Solicitar um limite de cota maior.