Este documento lista as cotas de alocação aplicáveis ao Compute Engine.
Cotas de alocação
As cotas de alocação, também conhecidas como cotas de recursos, definem o número de recursos aos quais seu projeto tem acesso. O Compute Engine impõe cotas de alocação no uso de recursos por vários motivos. Por exemplo, as quotas ajudam a proteger a comunidade de Google Cloud usuários, evitando picos imprevistos de uso. Google Cloud também oferece cotas de teste gratuito que fornecem acesso limitado a projetos para ajudá-lo a explorar Google Cloudem regime de teste gratuito.
Nem todos os projetos têm as mesmas cotas. À medida que você usa cada vez maisGoogle Cloud com o tempo, suas cotas poderão aumentar de acordo. Se você espera um aumento notável no uso, poderá solicitar ajustes de cota de forma proativa na página Cotas no console do Google Cloud.
Para informações específicas sobre cotas para limites de taxa da API Compute Engine, consulte Cota de API .
Cotas e disponibilidade de recursos
As cotas de alocação são o número máximo de recursos que você pode criar desse tipo de recurso, se esses recursos estiverem disponíveis. As cotas não garantem que os recursos estejam sempre disponíveis. Se um recurso não estiver disponível ou se a região escolhida estiver fora do recurso, você não poderá criar novos recursos desse tipo, mesmo que tenha cota restante em sua região ou projeto. Por exemplo, você ainda pode ter cota para criar endereços IP externos em us-central1
, mas pode não haver endereços IP disponíveis nessa região.
Da mesma forma, mesmo que você tenha uma cota regional, um recurso poderá não estar disponível em uma zona específica. Por exemplo, você pode ter cota para criar instâncias de VM na região us-central1
, mas talvez não consiga criar instâncias de VM na zona us-central1-a
se a zona estiver esgotada. Nesses casos, tente criar o mesmo recurso em outra zona, como us-central1-f
. Para saber mais sobre suas opções se os recursos zonais estiverem esgotados, consulte a documentação para solucionar problemas de disponibilidade de recursos .
Cotas de alocação
Ao planejar suas necessidades de instância de VM, você deve considerar diversas cotas que afetam quantas instâncias de VM você pode criar.
Cotas regionais e globais
As cotas de VM são gerenciadas em nível regional. Instância de VM, grupo de instâncias, cotas de disco e CPU podem ser consumidos por qualquer VM na região, independentemente da zona. Por exemplo, a cota de CPU é uma cota regional, portanto há um limite e uma contagem de uso diferentes para cada região. Para executar uma instância n2-standard-16
em qualquer zona da região us-central1
, você precisa de cota suficiente para pelo menos 16 CPUs em us-central1
.
As cotas de rede e de balanceamento de carga são necessárias para criar firewalls, balanceadores de carga, redes e VPNs. Estas cotas são cotas globais que não dependem de uma região. Qualquer região pode usar uma cota global. Por exemplo, endereços IP externos estáticos e em uso atribuídos a balanceadores de carga e proxies HTTP e HTTPS consomem cotas globais.
Instâncias de VM
A cota de instâncias de VM é uma cota regional e limita o número de instâncias de VM que podem existir em uma determinada região, independentemente de a VM estar em execução. Essa cota fica visível no console do Google Cloud, na página Cotas . O Compute Engine define automaticamente essa cota como 10 vezes maior que a cota normal de CPU. Você não precisa solicitar esta cota. Se você precisar de cota para mais instâncias de VM, solicite mais CPUs, pois ter mais CPUs aumenta a cota de instâncias de VM. A cota se aplica a VMs em execução e não em execução e a instâncias normais e preemptivas.
No console do Google Cloud, acesse a página Cotas .
Na lista de filtros
, selecione as seguintes opções:- Em Serviço , selecione API do Compute Engine .
- Para Tipo , selecione Cota .
- Em Nome , selecione Instâncias de VM .
- Opcional: para Metric , selecione qualquer outro nome de CPU ou de cota de CPU comprometida que você deseja filtrar.
Opcional: para classificar a tabela por região, clique na coluna Dimensões (por exemplo, localização) .
Selecione as regiões cuja cota você deseja alterar.
Clique em
Editar .Preencha o formulário.
Clique em Enviar solicitação .
Grupos de instâncias
Para usar grupos de instâncias, você deve ter cota disponível para todos os recursos que o grupo usa (por exemplo, cota de CPU) e cota disponível para o próprio recurso do grupo. Dependendo do tipo de grupo criado, as seguintes cotas de uso de recursos do grupo serão aplicadas:
Tipo de serviço | Cota de serviço |
---|---|
Grupo de instâncias gerenciadas regionais (várias zonas) | Regional instance group managers |
Grupo de instâncias gerenciadas por zona (zona única) | Ambos:
|
Grupo de instâncias não gerenciadas (zona única) | Instance groups |
Autoescalador regional (multizona) | Regional autoscalers |
Autoescalador zonal (zona única) | Autoscalers |
Cotas de disco
As seguintes cotas de disco permanente, hiperdisco e SSD local se aplicam por região:
-
Hyperdisk Balanced Capacity (GB)
. Essa cota é o tamanho total combinado de discos hiperdiscos balanceados que você pode criar em uma região. Na CLI gcloud e na API, essa cota é chamada deHDB-TOTAL-GB
. -
Hyperdisk Balanced Throughput (MB/s)
. Essa cota é a quantidade total de taxa de transferência que você pode provisionar para todos os discos hiperdiscos balanceados em uma zona. Na CLI gcloud e na API, essa cota é chamada deHDB-TOTAL-THROUGHPUT
. -
Hyperdisk Balanced IOPS
. Essa cota é a quantidade total de IOPS que você pode provisionar para todos os discos hiperdiscos balanceados em uma zona. Na CLI gcloud e na API, essa cota é chamada deHDB-TOTAL-IOPS
. -
Hyperdisk ML Capacity (GB)
. Essa cota é o tamanho total combinado dos discos Hyperdisk ML que você pode criar em uma região. Na CLI gcloud e na API, essa cota é chamada deHDML-TOTAL-GB
. -
Hyperdisk ML Throughput (MB/s)
. Essa cota é a quantidade total de taxa de transferência que você pode provisionar para todos os discos Hyperdisk ML em uma região. Na CLI gcloud e na API, essa cota é chamada deHDML-TOTAL-THROUGHPUT
. -
Persistent disk standard (GB)
. Essa cota é o tamanho total do disco permanente padrão que pode ser criado em uma região. Na CLI gcloud e na API, essa cota é chamada deDISKS_TOTAL_GB
. Esta cota também se aplica a:- Disco permanente padrão regional , mas o disco permanente regional consome o dobro da quantidade de cota por GiB devido à replicação em duas zonas dentro de uma região.
- Quando você escolhe preservar os dados do SSD local ao interromper ou suspender uma VM, uma quantidade equivalente de cota do disco permanente padrão é consumida.
Persistent disk SSD (GB)
. Essa cota é o tamanho total combinado dos volumes de disco permanente com suporte de SSD que podem ser criados em uma região. Na CLI gcloud e na API, essa cota é chamada deSSD_TOTAL_GB
. Esta cota é separada da cota para discos SSD locais. Esta cota se aplica aos seguintes tipos de disco:- Disco permanente SSD zonal e regional
- Disco permanente balanceado zonal e regional
Os volumes regionais de disco permanente consomem o dobro da cota por GiB devido à replicação em duas zonas dentro de uma região.
Persistent Disk IOPS
. Essa cota é o número total de operações de E/S por segundo para volumes Extreme Persistent Disk que podem ser criados em uma região. Na CLI gcloud e na API, essa cota é chamada dePD-EXTREME-TOTAL-PROVISIONED-IOPS
. Essa cota é separada da cota de IOPS do Google Cloud Hyperdisk.Local SSD per machine family (GB)
. Esta cota é o tamanho total combinado de discos SSD locais que você pode anexar a VMs em uma região com base no tipo de máquina de cada VM. O SSD local é um disco rápido e efêmero que deve ser usado para tarefas temporárias, cache local ou processamento com alta tolerância a falhas, pois o disco não se destina a sobreviver a reinicializações de instâncias de VM.Os discos SSD locais são vendidos em incrementos de 375 GiB ou 3 TiB, dependendo do tipo de máquina. Há também um número máximo de discos SSD locais que podem ser anexados a uma única VM , dependendo do tipo de máquina. O número máximo de discos SSD locais e o tamanho de cada disco SSD local criam um limite na quantidade total de capacidade do disco SSD local que você pode alocar para uma VM. Na CLI gcloud e na API, esse limite é conhecido como cota
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
.Para VMs A3 e A2 ultra, não é necessário solicitar esta cota, pois os SSDs locais são adicionados automaticamente a essas VMs. No entanto, você precisaria solicitar
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
para as outras VMs otimizadas para acelerador .
Cotas do pool de armazenamento
Para capacidade, os pools de armazenamento de hiperdisco com provisionamento de capacidade avançado têm as seguintes cotas, medidas em GB (ou 1.000 MB):
Hyperdisk Balanced Storage Pools Advanced Capacity (GB)
: a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento balanceado de hiperdisco com provisionamento de capacidade avançada.- CLI gcloud e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
- CLI gcloud e API:
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)
: a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento de taxa de transferência de hiperdisco com provisionamento de capacidade avançada.- CLI gcloud e API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity
- CLI gcloud e API:
Para desempenho, os pools de armazenamento de hiperdisco com provisionamento de desempenho avançado têm as seguintes cotas:
Hyperdisk Balanced Storage Pools Advanced IOPS
: o total de IOPS que você pode reservar em um pool de armazenamento balanceado de hiperdisco com provisionamento de desempenho avançado para uma região.- CLI gcloud e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
- CLI gcloud e API:
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)
: a taxa de transferência total que você pode reservar em um pool de armazenamento balanceado de hiperdiscos com provisionamento de desempenho avançado para uma região.- CLI gcloud e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
- CLI gcloud e API:
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)
: a taxa de transferência total que você pode reservar em um pool de armazenamento de taxa de transferência de hiperdisco com provisionamento de desempenho avançado para uma região.- CLI gcloud e API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput
- CLI gcloud e API:
Limites de cota de CPU
A cota de CPU é o número total de CPUs virtuais em todas as instâncias de VM em uma região. As cotas de CPU se aplicam à execução de VMs e reservas de VM. Tanto as VMs predefinidas quanto as preemptivas consomem essa cota.
Para ajudar a proteger os sistemas do Compute Engine e outros usuários, algumas contas e projetos novos também têm uma cota global CPUs (All Regions)
. Essa cota se aplica a todas as regiões e é medida como a soma de todas as suas vCPUs em todas as regiões.
Por exemplo, se você tiver 48 vCPUs restantes em uma única região, como us-central1
, mas apenas 32 vCPUs restantes para a cota de CPUs (All Regions)
, será possível iniciar apenas 32 vCPUs na região us-central1
, mesmo que haja cota restante na região. Isso ocorre porque você atinge a cota CPU (All Regions)
e precisa excluir as instâncias existentes antes de iniciar novas instâncias.
Os tipos de máquina E2 e N1 compartilham um pool de cotas de CPU. Salvo indicação em contrário, todos os outros tipos de máquinas possuem pools de cotas de CPU exclusivos e separados.
Se você estiver usando descontos por uso contínuo para suas VMs, deverá ter uma cota de desconto por uso contínuo antes de adquirir um contrato de desconto por uso contínuo.
Tipo de máquina | Conjunto de cotas | Nome da cota de CPU | Nome da cota de CPU confirmada |
---|---|---|---|
N1 | piscina compartilhada | CPUS | Committed_CPUS |
E2 | piscina compartilhada | CPUS | Committed_CPUS |
N2 | piscina separada | N2_CPUS | Committed_N2_CPUS |
N4 | piscina separada | CPUS_PER_VM_FAMILY | Committed_N4_CPUS |
N2D | piscina separada | N2D_CPUS | Committed_N2D_CPUS |
DM2 | piscina separada | T2D_CPUS | Committed_T2D_CPUS |
T2A | piscina separada | T2A_CPUS | Não disponível (N/A) para T2A |
Z3 | piscina separada | CPUS_PER_VM_FAMILY | Committed_Z3_CPUS |
M1 | piscina separada | M1_CPUS | Committed_MEMORY-OPTIMIZED_CPUS |
M2 | piscina separada | M2_CPUS | Committed_MEMORY-OPTIMIZED_CPUS |
M3 | piscina separada | M3_CPUS | Committed_M3_CPUS |
M4 | piscina separada | CPUS_PER_VM_FAMILY | Committed_M4_CPUS |
X4 | piscina separada | CPUS_PER_VM_FAMILY | Committed_X4_CPUS |
H3 | piscina separada | CPUS_PER_VM_FAMILY | Committed_H3_CPUS |
C2 | piscina separada | C2_CPUS | Committed_C2_CPUS |
C2D | piscina separada | C2D_CPUS | Committed_C2D_CPUS |
C3 | piscina separada | C3_CPUS | Committed_C3_CPUS |
C3D | piscina separada | CPUS_PER_VM_FAMILY | Committed_C3D_CPUS |
C4 | piscina separada | CPUS_PER_VM_FAMILY | Committed_C4_CPUS |
C4A | piscina separada | CPUS_PER_VM_FAMILY | Committed_C4A_CPUS |
A2 * | piscina separada | A2_CPUS | Committed_A2_CPUS |
A4 † | Não aplicável (N/A) para A4 | Não aplicável (N/A) para A4 | Não aplicável (N/A) para A4 |
A3 † | Não aplicável (N/A) para A3 | Não aplicável (N/A) para A3 | Não aplicável (N/A) para A3 |
G2 † | Não aplicável (N/A) para G2 | Não aplicável (N/A) para G2 | Não aplicável (N/A) para G2 |
VMs preemptivas | piscina compartilhada | PREEMPTIBLE_CPUS | Não disponível (N/A) para VMs preemptivas |
* Para VMs A2, não é necessário solicitar cotas de CPU. Se você tiver as cotas de GPU NVIDIA A100 necessárias, isso é tudo o que é necessário para criar essas VMs.
† Para VMs A4, A3 e G2, as cotas de CPU não são aplicáveis. Se você tiver as cotas de GPU NVIDIA B200, H200, H100 e L4 necessárias, respectivamente, isso é tudo o que é necessário para criar essas VMs.
Cota de GPU
Semelhante à cota de CPU virtual, a cota de GPU refere-se ao número total de GPUs virtuais em todas as instâncias de VM em uma região. As cotas de GPU se aplicam à execução de VMs e reservas de VM. Tanto as VMs predefinidas quanto as preemptivas consomem essa cota.
Verifique a página Cotas para garantir que você tenha GPUs suficientes disponíveis em seu projeto e para solicitar um aumento de cota. Além disso, novas contas e projetos têm uma cota global de GPU que se aplica a todas as regiões.
Ao solicitar uma cota de GPU, você deve solicitar uma cota para os modelos de GPU que deseja criar em cada região e uma cota global adicional ( GPUs (all regions)
) para o número total de GPUs de todos os tipos em todas as regiões. Solicite cota de GPU preemptiva para usar esses recursos.
Tipo de máquina | Tipo de GPU | Nome da cota GPU | Família de GPUs | Nome da cota de GPU confirmada | Estação de trabalho virtual | GPUs preemptivas | Estação de trabalho virtual GPU preemptiva |
---|---|---|---|---|---|---|---|
A4 | B200 | N / D | N / D | COMMITTED_NVIDIA_B200_GPUS | N / D | PREEMPTIBLE_NVIDIA_B200_GPUS | N / D |
A3 Ultra | H200 141GB | N / D | N / D | COMMITTED_NVIDIA_H200_GPUS | N / D | PREEMPTIBLE_NVIDIA_H200_GPUS | N / D |
A3Mega | H100 80GB | GPUS_PER_GPU_FAMILY | NVIDIA_H100_MEGA | COMMITTED_NVIDIA_H100_MEGA_GPUS | N / D | PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS | N / D |
A3 Borda e A3 Alto | H100 80GB | GPUS_PER_GPU_FAMILY | NVIDIA_H100 | COMMITTED_NVIDIA_H100_GPUS | N / D | PREEMPTIBLE_NVIDIA_H100_GPUS | N / D |
A2 ultra | A100 80 GB | NVIDIA_A100_80GB_GPUS | N / D | COMMITTED_NVIDIA_A100_80GB_GPUS | N / D | PREEMPTIBLE_NVIDIA_A100_80GB_GPUS | N / D |
Padrão A2 | A100 40 GB | NVIDIA_A100_GPUS | N / D | COMMITTED_NVIDIA_A100_GPUS | N / D | PREEMPTIBLE_NVIDIA_A100_GPUS | N / D |
G2 | L4 | NVIDIA_L4_GPUS | N / D | COMMITTED_NVIDIA_L4_GPUS | NVIDIA_L4_VWS_GPUS | PREEMPTIBLE_NVIDIA_L4_GPUS | PREEMPTIBLE_NVIDIA_L4_VWS_GPUS |
N1 | T4 | NVIDIA_T4_GPUS | N / D | COMMITTED_NVIDIA_T4_GPUS | NVIDIA_T4_VWS_GPUS | PREEMPTIBLE_NVIDIA_T4_GPUS | PREEMPTIBLE_NVIDIA_T4_VWS_GPUS |
V100 | NVIDIA_V100_GPUS | N / D | COMMITTED_NVIDIA_V100_GPUS | N / D | PREEMPTIBLE_NVIDIA_V100_GPUS | N / D | |
P100 | NVIDIA_P100_GPUS | N / D | COMMITTED_NVIDIA_P100_GPUS | NVIDIA_P100_VWS_GPUS | PREEMPTIBLE_NVIDIA_P100_GPUS | PREEMPTIBLE_NVIDIA_P100_VWS_GPUS | |
P4 | NVIDIA_P4_GPUS | N / D | COMMITTED_NVIDIA_P4_GPUS | NVIDIA_P4_VWS_GPUS | PREEMPTIBLE_NVIDIA_P4_GPUS | PREEMPTIBLE_NVIDIA_P4_VWS_GPUS |
Cotas preemptivas
Você pode solicitar cotas preemptivas para Preemptible CPUs
, Preemptible GPUs
e Preemptible Local SSDs (GB)
. Essas cotas preemptivas se aplicam às CPUs, GPUs e SSDs locais das seguintes VMs:
Se o seu projeto não tiver cota preemptiva e você nunca tiver solicitado cota preemptiva, esses recursos consumirão a cota padrão. No entanto, depois de solicitar a cota preemptiva no seu projeto, os recursos aplicáveis só poderão consumir a cota preemptiva e não poderão voltar a consumir cotas padrão.
A solicitação de cotas preemptivas pode ajudá-lo a melhorar a obtenção de cotas, fornecendo cotas separadas para recursos temporários. Depois que o Compute Engine conceder cota preemptiva em uma região, todos os recursos aplicáveis consumirão automaticamente a cota preemptiva. Se esta cota estiver esgotada, você deverá solicitar uma cota preemptiva para esses recursos.
Endereços IP externos
Você deve ter endereços IP externos suficientes para cada VM que precisa ser acessada diretamente pela Internet pública. A cota IP regional serve para atribuir endereços IPv4 a VMs nessa região. A cota IP global serve para atribuir endereços IPv4 a recursos de rede globais, como balanceadores de carga.Google Cloud oferece diferentes tipos de endereços IP, dependendo de suas necessidades. Para obter informações sobre custos, consulte Preços de endereços IP externos . Para obter informações sobre especificações de cotas, consulte Cotas e limites .
Endereços IP externos em uso . Inclui endereços IP efêmeros e estáticos que estão sendo usados por um recurso.
Endereços IP externos estáticos : endereços IP externos reservados para seus recursos que persistem durante as reinicializações da máquina. Você pode registrar esses endereços com DNS e serviços de provedor de domínio para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.
Endereços IP internos estáticos: endereços IP internos estáticos permitem reservar endereços IP internos do intervalo de IP interno configurado na sub-rede. Você pode atribuir esses endereços internos reservados aos recursos conforme necessário.
Implementações de cotas
Ocasionalmente, Google Cloud altera a cota padrão para recursos e APIs. Essas mudanças ocorrem gradualmente. Durante a implementação de uma nova cota padrão, a cota máxima exibida no console do Google Cloud pode não refletir a cota máxima real disponível para você.
Por exemplo, suponha que Google Cloud alterar a cota máxima padrão para regras de firewall de 200
para 300
e você usar o console do Google Cloud para visualizar sua cota, poderá ver a nova cota de 300
, mesmo que sua cota real seja 200
até a implementação ser concluída.
Para obter informações sobre implementações de cotas em andamento, consulte problemas conhecidos . Se nenhum problema for descrito, nenhuma implementação de cota estará em andamento.
Se uma implementação de cota estiver em andamento e você quiser confirmar a cota máxima real disponível, use a CLI do Google Cloud para verificar sua cota . Se você precisar de mais cota do que tem acesso, envie uma solicitação de aumento de cota .
O que vem a seguir
- Leia sobre preços baseados em recursos .
- Leia sobre os preços das instâncias de VM .
- Saiba como visualizar e gerenciar cotas .
- Saiba como configurar alertas de cota .
- Saiba como aumentar automaticamente a cota com base no uso dos recursos do Compute Engine .