Cotas de alocação


Este documento lista as cotas de alocação aplicáveis ​​ao Compute Engine.

Cotas de alocação

As cotas de alocação, também conhecidas como cotas de recursos, definem o número de recursos aos quais seu projeto tem acesso. O Compute Engine impõe cotas de alocação no uso de recursos por vários motivos. Por exemplo, as quotas ajudam a proteger a comunidade de Google Cloud usuários, evitando picos imprevistos de uso. Google Cloud também oferece cotas de teste gratuito que fornecem acesso limitado a projetos para ajudá-lo a explorar Google Cloudem regime de teste gratuito.

Nem todos os projetos têm as mesmas cotas. À medida que você usa cada vez maisGoogle Cloud com o tempo, suas cotas poderão aumentar de acordo. Se você espera um aumento notável no uso, poderá solicitar ajustes de cota de forma proativa na página Cotas no console do Google Cloud.

Para informações específicas sobre cotas para limites de taxa da API Compute Engine, consulte Cota de API .

Cotas e disponibilidade de recursos

As cotas de alocação são o número máximo de recursos que você pode criar desse tipo de recurso, se esses recursos estiverem disponíveis. As cotas não garantem que os recursos estejam sempre disponíveis. Se um recurso não estiver disponível ou se a região escolhida estiver fora do recurso, você não poderá criar novos recursos desse tipo, mesmo que tenha cota restante em sua região ou projeto. Por exemplo, você ainda pode ter cota para criar endereços IP externos em us-central1 , mas pode não haver endereços IP disponíveis nessa região.

Da mesma forma, mesmo que você tenha uma cota regional, um recurso poderá não estar disponível em uma zona específica. Por exemplo, você pode ter cota para criar instâncias de VM na região us-central1 , mas talvez não consiga criar instâncias de VM na zona us-central1-a se a zona estiver esgotada. Nesses casos, tente criar o mesmo recurso em outra zona, como us-central1-f . Para saber mais sobre suas opções se os recursos zonais estiverem esgotados, consulte a documentação para solucionar problemas de disponibilidade de recursos .

Cotas de alocação

Ao planejar suas necessidades de instância de VM, você deve considerar diversas cotas que afetam quantas instâncias de VM você pode criar.

Cotas regionais e globais

As cotas de VM são gerenciadas em nível regional. Instância de VM, grupo de instâncias, cotas de disco e CPU podem ser consumidos por qualquer VM na região, independentemente da zona. Por exemplo, a cota de CPU é uma cota regional, portanto há um limite e uma contagem de uso diferentes para cada região. Para executar uma instância n2-standard-16 em qualquer zona da região us-central1 , você precisa de cota suficiente para pelo menos 16 CPUs em us-central1 .

As cotas de rede e de balanceamento de carga são necessárias para criar firewalls, balanceadores de carga, redes e VPNs. Estas cotas são cotas globais que não dependem de uma região. Qualquer região pode usar uma cota global. Por exemplo, endereços IP externos estáticos e em uso atribuídos a balanceadores de carga e proxies HTTP e HTTPS consomem cotas globais.

Instâncias de VM

A cota de instâncias de VM é uma cota regional e limita o número de instâncias de VM que podem existir em uma determinada região, independentemente de a VM estar em execução. Essa cota fica visível no console do Google Cloud, na página Cotas . O Compute Engine define automaticamente essa cota como 10 vezes maior que a cota normal de CPU. Você não precisa solicitar esta cota. Se você precisar de cota para mais instâncias de VM, solicite mais CPUs, pois ter mais CPUs aumenta a cota de instâncias de VM. A cota se aplica a VMs em execução e não em execução e a instâncias normais e preemptivas.

  1. No console do Google Cloud, acesse a página Cotas .

    Ir para cotas

  2. Na lista de filtros , selecione as seguintes opções:

    • Em Serviço , selecione API do Compute Engine .
    • Para Tipo , selecione Cota .
    • Em Nome , selecione Instâncias de VM .
    • Opcional: para Metric , selecione qualquer outro nome de CPU ou de cota de CPU comprometida que você deseja filtrar.
  3. Opcional: para classificar a tabela por região, clique na coluna Dimensões (por exemplo, localização) .

  4. Selecione as regiões cuja cota você deseja alterar.

  5. Clique em Editar .

  6. Preencha o formulário.

  7. Clique em Enviar solicitação .

Grupos de instâncias

Para usar grupos de instâncias, você deve ter cota disponível para todos os recursos que o grupo usa (por exemplo, cota de CPU) e cota disponível para o próprio recurso do grupo. Dependendo do tipo de grupo criado, as seguintes cotas de uso de recursos do grupo serão aplicadas:

Tipo de serviço Cota de serviço
Grupo de instâncias gerenciadas regionais (várias zonas) Regional instance group managers
Grupo de instâncias gerenciadas por zona (zona única) Ambos:
  • Instance group managers
  • Instance groups
Grupo de instâncias não gerenciadas (zona única) Instance groups
Autoescalador regional (multizona) Regional autoscalers
Autoescalador zonal (zona única) Autoscalers

Cotas de disco

As seguintes cotas de disco permanente, hiperdisco e SSD local se aplicam por região:

  • Hyperdisk Balanced Capacity (GB) . Essa cota é o tamanho total combinado de discos hiperdiscos balanceados que você pode criar em uma região. Na CLI gcloud e na API, essa cota é chamada de HDB-TOTAL-GB .
  • Hyperdisk Balanced Throughput (MB/s) . Essa cota é a quantidade total de taxa de transferência que você pode provisionar para todos os discos hiperdiscos balanceados em uma zona. Na CLI gcloud e na API, essa cota é chamada de HDB-TOTAL-THROUGHPUT .
  • Hyperdisk Balanced IOPS . Essa cota é a quantidade total de IOPS que você pode provisionar para todos os discos hiperdiscos balanceados em uma zona. Na CLI gcloud e na API, essa cota é chamada de HDB-TOTAL-IOPS .
  • Hyperdisk ML Capacity (GB) . Essa cota é o tamanho total combinado dos discos Hyperdisk ML que você pode criar em uma região. Na CLI gcloud e na API, essa cota é chamada de HDML-TOTAL-GB .
  • Hyperdisk ML Throughput (MB/s) . Essa cota é a quantidade total de taxa de transferência que você pode provisionar para todos os discos Hyperdisk ML em uma região. Na CLI gcloud e na API, essa cota é chamada de HDML-TOTAL-THROUGHPUT .
  • Persistent disk standard (GB) . Essa cota é o tamanho total do disco permanente padrão que pode ser criado em uma região. Na CLI gcloud e na API, essa cota é chamada de DISKS_TOTAL_GB . Esta cota também se aplica a:
    • Disco permanente padrão regional , mas o disco permanente regional consome o dobro da quantidade de cota por GiB devido à replicação em duas zonas dentro de uma região.
    • Quando você escolhe preservar os dados do SSD local ao interromper ou suspender uma VM, uma quantidade equivalente de cota do disco permanente padrão é consumida.
  • Persistent disk SSD (GB) . Essa cota é o tamanho total combinado dos volumes de disco permanente com suporte de SSD que podem ser criados em uma região. Na CLI gcloud e na API, essa cota é chamada de SSD_TOTAL_GB . Esta cota é separada da cota para discos SSD locais. Esta cota se aplica aos seguintes tipos de disco:

    • Disco permanente SSD zonal e regional
    • Disco permanente balanceado zonal e regional

    Os volumes regionais de disco permanente consomem o dobro da cota por GiB devido à replicação em duas zonas dentro de uma região.

  • Persistent Disk IOPS . Essa cota é o número total de operações de E/S por segundo para volumes Extreme Persistent Disk que podem ser criados em uma região. Na CLI gcloud e na API, essa cota é chamada de PD-EXTREME-TOTAL-PROVISIONED-IOPS . Essa cota é separada da cota de IOPS do Google Cloud Hyperdisk.

  • Local SSD per machine family (GB) . Esta cota é o tamanho total combinado de discos SSD locais que você pode anexar a VMs em uma região com base no tipo de máquina de cada VM. O SSD local é um disco rápido e efêmero que deve ser usado para tarefas temporárias, cache local ou processamento com alta tolerância a falhas, pois o disco não se destina a sobreviver a reinicializações de instâncias de VM.

    Os discos SSD locais são vendidos em incrementos de 375 GiB ou 3 TiB, dependendo do tipo de máquina. Há também um número máximo de discos SSD locais que podem ser anexados a uma única VM , dependendo do tipo de máquina. O número máximo de discos SSD locais e o tamanho de cada disco SSD local criam um limite na quantidade total de capacidade do disco SSD local que você pode alocar para uma VM. Na CLI gcloud e na API, esse limite é conhecido como cota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY .

    Para VMs A3 e A2 ultra, não é necessário solicitar esta cota, pois os SSDs locais são adicionados automaticamente a essas VMs. No entanto, você precisaria solicitar LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para as outras VMs otimizadas para acelerador .

Cotas do pool de armazenamento

Para capacidade, os pools de armazenamento de hiperdisco com provisionamento de capacidade avançado têm as seguintes cotas, medidas em GB (ou 1.000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB) : a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento balanceado de hiperdisco com provisionamento de capacidade avançada.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB) : a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento de taxa de transferência de hiperdisco com provisionamento de capacidade avançada.

    • CLI gcloud e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Para desempenho, os pools de armazenamento de hiperdisco com provisionamento de desempenho avançado têm as seguintes cotas:

  • Hyperdisk Balanced Storage Pools Advanced IOPS : o total de IOPS que você pode reservar em um pool de armazenamento balanceado de hiperdisco com provisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s) : a taxa de transferência total que você pode reservar em um pool de armazenamento balanceado de hiperdiscos com provisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s) : a taxa de transferência total que você pode reservar em um pool de armazenamento de taxa de transferência de hiperdisco com provisionamento de desempenho avançado para uma região.

    • CLI gcloud e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Limites de cota de CPU

A cota de CPU é o número total de CPUs virtuais em todas as instâncias de VM em uma região. As cotas de CPU se aplicam à execução de VMs e reservas de VM. Tanto as VMs predefinidas quanto as preemptivas consomem essa cota.

Para ajudar a proteger os sistemas do Compute Engine e outros usuários, algumas contas e projetos novos também têm uma cota global CPUs (All Regions) . Essa cota se aplica a todas as regiões e é medida como a soma de todas as suas vCPUs em todas as regiões.

Por exemplo, se você tiver 48 vCPUs restantes em uma única região, como us-central1 , mas apenas 32 vCPUs restantes para a cota de CPUs (All Regions) , será possível iniciar apenas 32 vCPUs na região us-central1 , mesmo que haja cota restante na região. Isso ocorre porque você atinge a cota CPU (All Regions) e precisa excluir as instâncias existentes antes de iniciar novas instâncias.

Os tipos de máquina E2 e N1 compartilham um pool de cotas de CPU. Salvo indicação em contrário, todos os outros tipos de máquinas possuem pools de cotas de CPU exclusivos e separados.

Se você estiver usando descontos por uso contínuo para suas VMs, deverá ter uma cota de desconto por uso contínuo antes de adquirir um contrato de desconto por uso contínuo.

Tipo de máquina Conjunto de cotas Nome da cota de CPU Nome da cota de CPU confirmada
N1 piscina compartilhada CPUS Committed_CPUS
E2 piscina compartilhada CPUS Committed_CPUS
N2 piscina separada N2_CPUS Committed_N2_CPUS
N4 piscina separada CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D piscina separada N2D_CPUS Committed_N2D_CPUS
DM2 piscina separada T2D_CPUS Committed_T2D_CPUS
T2A piscina separada T2A_CPUS Não disponível (N/A) para T2A
Z3 piscina separada CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 piscina separada M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 piscina separada M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 piscina separada M3_CPUS Committed_M3_CPUS
M4 piscina separada CPUS_PER_VM_FAMILY Committed_M4_CPUS
X4 piscina separada CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 piscina separada CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 piscina separada C2_CPUS Committed_C2_CPUS
C2D piscina separada C2D_CPUS Committed_C2D_CPUS
C3 piscina separada C3_CPUS Committed_C3_CPUS
C3D piscina separada CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 piscina separada CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A piscina separada CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2 * piscina separada A2_CPUS Committed_A2_CPUS
A4 Não aplicável (N/A) para A4 Não aplicável (N/A) para A4 Não aplicável (N/A) para A4
A3 Não aplicável (N/A) para A3 Não aplicável (N/A) para A3 Não aplicável (N/A) para A3
G2 Não aplicável (N/A) para G2 Não aplicável (N/A) para G2 Não aplicável (N/A) para G2
VMs preemptivas piscina compartilhada PREEMPTIBLE_CPUS Não disponível (N/A) para VMs preemptivas

* Para VMs A2, não é necessário solicitar cotas de CPU. Se você tiver as cotas de GPU NVIDIA A100 necessárias, isso é tudo o que é necessário para criar essas VMs.

Para VMs A4, A3 e G2, as cotas de CPU não são aplicáveis. Se você tiver as cotas de GPU NVIDIA B200, H200, H100 e L4 necessárias, respectivamente, isso é tudo o que é necessário para criar essas VMs.

Cota de GPU

Semelhante à cota de CPU virtual, a cota de GPU refere-se ao número total de GPUs virtuais em todas as instâncias de VM em uma região. As cotas de GPU se aplicam à execução de VMs e reservas de VM. Tanto as VMs predefinidas quanto as preemptivas consomem essa cota.

Verifique a página Cotas para garantir que você tenha GPUs suficientes disponíveis em seu projeto e para solicitar um aumento de cota. Além disso, novas contas e projetos têm uma cota global de GPU que se aplica a todas as regiões.

Ao solicitar uma cota de GPU, você deve solicitar uma cota para os modelos de GPU que deseja criar em cada região e uma cota global adicional ( GPUs (all regions) ) para o número total de GPUs de todos os tipos em todas as regiões. Solicite cota de GPU preemptiva para usar esses recursos.

Tipo de máquina Tipo de GPU Nome da cota GPU Família de GPUs Nome da cota de GPU confirmada Estação de trabalho virtual GPUs preemptivas Estação de trabalho virtual GPU preemptiva
A4 B200 N / D N / D COMMITTED_NVIDIA_B200_GPUS N / D PREEMPTIBLE_NVIDIA_B200_GPUS N / D
A3 Ultra H200 141GB N / D N / D COMMITTED_NVIDIA_H200_GPUS N / D PREEMPTIBLE_NVIDIA_H200_GPUS N / D
A3Mega H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS N / D PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS N / D
A3 Borda e A3 Alto H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS N / D PREEMPTIBLE_NVIDIA_H100_GPUS N / D
A2 ultra A100 80 GB NVIDIA_A100_80GB_GPUS N / D COMMITTED_NVIDIA_A100_80GB_GPUS N / D PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N / D
Padrão A2 A100 40 GB NVIDIA_A100_GPUS N / D COMMITTED_NVIDIA_A100_GPUS N / D PREEMPTIBLE_NVIDIA_A100_GPUS N / D
G2 L4 NVIDIA_L4_GPUS N / D COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS N / D COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS N / D COMMITTED_NVIDIA_V100_GPUS N / D PREEMPTIBLE_NVIDIA_V100_GPUS N / D
P100 NVIDIA_P100_GPUS N / D COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS N / D COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Cotas preemptivas

Você pode solicitar cotas preemptivas para Preemptible CPUs , Preemptible GPUs e Preemptible Local SSDs (GB) . Essas cotas preemptivas se aplicam às CPUs, GPUs e SSDs locais das seguintes VMs:

Se o seu projeto não tiver cota preemptiva e você nunca tiver solicitado cota preemptiva, esses recursos consumirão a cota padrão. No entanto, depois de solicitar a cota preemptiva no seu projeto, os recursos aplicáveis ​​só poderão consumir a cota preemptiva e não poderão voltar a consumir cotas padrão.

A solicitação de cotas preemptivas pode ajudá-lo a melhorar a obtenção de cotas, fornecendo cotas separadas para recursos temporários. Depois que o Compute Engine conceder cota preemptiva em uma região, todos os recursos aplicáveis ​​consumirão automaticamente a cota preemptiva. Se esta cota estiver esgotada, você deverá solicitar uma cota preemptiva para esses recursos.

Endereços IP externos

Você deve ter endereços IP externos suficientes para cada VM que precisa ser acessada diretamente pela Internet pública. A cota IP regional serve para atribuir endereços IPv4 a VMs nessa região. A cota IP global serve para atribuir endereços IPv4 a recursos de rede globais, como balanceadores de carga.Google Cloud oferece diferentes tipos de endereços IP, dependendo de suas necessidades. Para obter informações sobre custos, consulte Preços de endereços IP externos . Para obter informações sobre especificações de cotas, consulte Cotas e limites .

  • Endereços IP externos em uso . Inclui endereços IP efêmeros e estáticos que estão sendo usados ​​por um recurso.

  • Endereços IP externos estáticos : endereços IP externos reservados para seus recursos que persistem durante as reinicializações da máquina. Você pode registrar esses endereços com DNS e serviços de provedor de domínio para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.

  • Endereços IP internos estáticos: endereços IP internos estáticos permitem reservar endereços IP internos do intervalo de IP interno configurado na sub-rede. Você pode atribuir esses endereços internos reservados aos recursos conforme necessário.

Implementações de cotas

Ocasionalmente, Google Cloud altera a cota padrão para recursos e APIs. Essas mudanças ocorrem gradualmente. Durante a implementação de uma nova cota padrão, a cota máxima exibida no console do Google Cloud pode não refletir a cota máxima real disponível para você.

Por exemplo, suponha que Google Cloud alterar a cota máxima padrão para regras de firewall de 200 para 300 e você usar o console do Google Cloud para visualizar sua cota, poderá ver a nova cota de 300 , mesmo que sua cota real seja 200 até a implementação ser concluída.

Para obter informações sobre implementações de cotas em andamento, consulte problemas conhecidos . Se nenhum problema for descrito, nenhuma implementação de cota estará em andamento.

Se uma implementação de cota estiver em andamento e você quiser confirmar a cota máxima real disponível, use a CLI do Google Cloud para verificar sua cota . Se você precisar de mais cota do que tem acesso, envie uma solicitação de aumento de cota .

O que vem a seguir