Esta página foi traduzida pela API Cloud Translation.

cotas de alocação.

Neste documento, listamos as cotas de alocação que se aplicam ao Compute Engine.

cotas de alocação.

As cotas de alocação, também conhecidas como cotas de recursos, definem o número de recursos que seu projeto pode acessar. O Compute Engine aplica cotas no uso de recursos por vários motivos. Por exemplo, as cotas ajudam a proteger a comunidade de usuários do Google Cloud , impedindo picos de uso inesperados.

OGoogle Cloud também oferece cotas de avaliação gratuita que proporcionam acesso limitado a projetos para ajudar você a explorar o Google Cloud sem custos financeiros.

Nem todos os projetos têm as mesmas cotas. Conforme você usa o Google Cloud ao longo do tempo, suas cotas podem aumentar proporcionalmente. Caso espere um aumento de uso significativo, solicite o ajuste das cotas na página Cotas doGoogle Cloud console.

Para informações específicas sobre cotas de limites de taxa da API Compute Engine, consulte Cota da API.

Cotas e disponibilidade de recursos

As cotas de alocação são o número máximo de recursos de um tipo específico que você criará, se eles estiverem disponíveis. As cotas não garantem que os recursos estejam sempre disponíveis. Se um recurso não estiver disponível, ou se a região escolhida estiver fora do recurso, não será possível criar novos recursos desse tipo, mesmo que ainda haja cota restante na região ou no projeto. Por exemplo, você ainda pode ter uma cota para criar endereços IP externos em us-central1, mas talvez não haja endereços IP disponíveis nessa região.

Do mesmo modo, mesmo que você tenha cota regional, é possível que um recurso não esteja disponível em uma zona específica. Por exemplo, você tem cota para criar instâncias de VM na região us-central1, mas talvez não consiga criar instâncias de VM na zona us-central1-a se ela estiver esgotada. Nesse caso, tente criar o mesmo recurso em outra zona, como us-central1-f. Para saber mais sobre as opções se os recursos zonais estiverem esgotados, consulte a documentação para resolver problemas de disponibilidade de recursos.

cotas de alocação.

Ao planejar a utilização das instâncias de VM, considere várias cotas que afetam o número de instâncias que podem ser criadas.

Cotas regionais e globais

As cotas de VM são gerenciadas no nível regional. A instância de VM, o grupo de instâncias, as cotas de disco e a CPU podem ser consumidos por qualquer VM na região, independentemente da zona. Por exemplo, a cota da CPU é regional. Sendo assim, o limite e a contagem de uso são diferentes para cada região. Para iniciar uma instância de n2-standard-16 em qualquer zona na região us-central1, você precisa de cota suficiente para pelo menos 16 CPUs em us-central1.

São necessárias cotas de rede e balanceamento de carga para a criação de firewalls, balanceadores de carga, redes e VPNs. Essas cotas são globais que não dependem de uma região. Qualquer região pode usar uma cota global. Por exemplo, os endereços IP externos em uso e estáticos atribuídos a balanceadores de carga e proxies HTTP(S) consomem cotas globais.

Instâncias de VM

A cota de instâncias de VM é uma cota regional que limita o número de instâncias de VM que podem existir em uma determinada região, esteja a VM em execução ou não. Essa cota pode ser visualizada no console do Google Cloud na página Cotas. O Compute Engine define automaticamente essa cota como dez vezes a cota de CPU normal. Não é necessário solicitar essa cota. Caso você precise de cota para mais instâncias de VM, solicite mais CPUs, porque com mais CPUs a cota de instâncias de VM será maior. A cota se aplica a VMs em execução ou não e a instâncias normais e preemptivas.

No Google Cloud console, acesse a página Cotas.

Acessar "Cotas"
Na lista Filtro, selecione as seguintes opções:
- Em Serviço, selecione API Compute Engine.
- Em Tipo, selecione Cota.
- Em Nome, selecione Instâncias de VM.
- Opcional: em Métrica, selecione qualquer outro nome de cota de CPU ou CPU comprometida que você quer filtrar.
Opcional: para ordenar a tabela por região, clique na coluna Dimensões (por exemplo, local).
Selecione as regiões da cota que você quer mudar.
Clique em Editar.
Preencha o formulário.
Clique em Enviar solicitação.

Grupos de instâncias

Para usar grupos de instâncias, é preciso ter uma cota disponível para todos os recursos usados pelo grupo (por exemplo, cota de CPU) e cotas disponíveis para o próprio recurso do grupo. Dependendo do tipo de grupo criado, aplicam-se as cotas de uso de recursos de grupo a seguir:

Tipo de serviço	Cota de serviço
Grupo regional de instâncias gerenciadas (várias zonas)	`Regional instance group managers`
Grupo por zona de instâncias gerenciadas (única zona)	Ambos: `Instance group managers` `Instance groups`
Grupo de instâncias não gerenciadas (única zona)	`Instance groups`
Escalonador automático regional (várias zonas)	`Regional autoscalers`
Escalonador automático de zona (única zona)	`Autoscalers`

Cotas de disco

As cotas de disco permanente e SSD local a seguir aplicam-se por região:

Hyperdisk Balanced Capacity (GB) é a cota que representa o tamanho total combinado dos discos Hyperdisk equilibrado que podem ser criados em uma região. Na gcloud CLI e API, essa cota é chamada de HDB-TOTAL-GB.
Hyperdisk Balanced Throughput (MB/s). Essa cota é a quantidade total de capacidade de processamento que pode ser provisionada para todos os discos do Hyperdisk equilibrado em uma zona. Na gcloud CLI e API, essa cota é chamada de HDB-TOTAL-THROUGHPUT.
Hyperdisk Balanced IOPS. Essa cota é a quantidade total de IOPS que você pode provisionar para todos os discos do Hyperdisk equilibrado em uma zona. Na gcloud CLI e API, essa cota é chamada de HDB-TOTAL-IOPS.
Hyperdisk ML Capacity (GB). Essa cota é o tamanho total combinado dos discos Hyperdisk ML que podem ser criados em uma região. Na gcloud CLI e API, essa cota é chamada de HDML-TOTAL-GB.
Hyperdisk ML Throughput (MB/s) é a cota que representa a quantidade total de capacidade de processamento que pode ser provisionada para todos os discos do Hyperdisk ML em uma região. Na gcloud CLI e API, essa cota é chamada de HDML-TOTAL-THROUGHPUT.
Persistent disk standard (GB) é a cota que representa o tamanho total do Disco permanente padrão que pode ser criado em uma região. Na gcloud CLI e API, essa cota é chamada de DISKS_TOTAL_GB. Essa cota também se aplica a:
- Disco permanente padrão regional. No entanto, os discos permanentes regionais consomem o dobro da cota por GiB devido à replicação em duas zonas de uma região.
- Quando você escolhe preservar os dados do SSD local ao interromper ou suspender uma VM, uma quantidade equivalente de cota do disco persistente padrão é consumida.
Persistent disk SSD (GB) é a cota que representa o tamanho total combinado das partições de Disco permanente SSD que podem ser criadas em uma região. Na gcloud CLI e API, essa cota é chamada de SSD_TOTAL_GB. Essa cota é separada da cota para discos SSD locais. Essa cota se aplica aos seguintes tipos de disco:
- Disco permanente SSD regional e zonal.
- Disco permanente equilibrado regional e zonal.
Os volumes de disco permanente regional consomem o dobro da cota por GiB devido à replicação em duas zonas de uma região.
Persistent Disk IOPS é a cota que representa o número total de operações de E/S por segundo para volumes de disco permanente extremo que podem ser criados em uma região. Na gcloud CLI e API, essa cota é chamada de PD-EXTREME-TOTAL-PROVISIONED-IOPS. Essa cota é separada da cota de IOPS para o Google Cloud. Hyperdisk.
Local SSD per machine family (GB). Essa cota é o tamanho total combinado das partições de disco SSD local que podem ser anexadas às VMs em uma região com base no tipo de máquina de cada VM. O SSD local é um disco temporário rápido que pode ser usado como disco de trabalho e para cache local ou processamento de jobs com alta tolerância a falhas. O disco não tem resistência a reinicializações de instâncias de VM.

Os discos SSD locais são vendidos em incrementos de 375 GiB ou 3 TiB, dependendo do tipo de máquina. Há também um número máximo de discos SSD locais que podem ser anexados a uma única VM, dependendo do tipo de máquina. O número máximo de discos SSD locais e o tamanho de cada um deles criam um limite na quantidade total de capacidade de disco SSD local que você pode alocar para uma VM. Na gcloud CLI e API, esse limite é chamado de cota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

Observação: o uso da cota de LOCAL_SSD_TOTAL_GB foi suspenso. Para conferir o uso e os limites da cota de SSD local, use a métrica de cota compute.googleapis.com/local_ssd_total_storage_per_vm_family ^BETA nos painéis, alertas e consultas do Cloud Monitoring. Para mais informações, consulte Ver e gerenciar a cota de SSD local.

Para os tipos de máquina A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge, A2 ultra e G4, não é necessário solicitar essa cota, já que os SSDs locais são adicionados automaticamente às VMs criadas com esses tipos de máquina. No entanto, você precisa solicitar LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY para as outras VMs otimizadas para aceleradores.

Cotas de pool de armazenamento

Em relação à capacidade, os pools de armazenamento de Hyperdisk com provisionamento de capacidade avançado têm as seguintes cotas, medidas em GB (ou 1.000 MB):

Hyperdisk Balanced Storage Pools Advanced Capacity (GB): a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento equilibrado do Hyperdisk com provisionamento de capacidade avançado.
- Gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
Hyperdisk Throughput Storage Pools Advanced Capacity (GB): a quantidade total de espaço em disco que você pode reservar por região em um pool de armazenamento de capacidade de processamento do Hyperdisk com provisionamento de capacidade avançado.
- Gcloud CLI e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Para desempenho, os pools de armazenamento de Hyperdisk com provisionamento de desempenho avançado têm as seguintes cotas:

Hyperdisk Balanced Storage Pools Advanced IOPS: as IOPS totais que podem ser reservadas em um pool de armazenamento equilibrado de Hyperdisk com provisionamento de desempenho avançado para uma região.
- gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): a capacidade de processamento total que você pode reservar em um pool de armazenamento equilibrado do Hyperdisk com provisionamento de desempenho avançado para uma região.
- Gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): a capacidade de processamento total que você pode reservar em um pool de armazenamento de capacidade de processamento do Hyperdisk com provisionamento de desempenho avançado para uma região.
- gcloud CLI e a API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Métrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Limites de cota da CPU

A cota de CPU é o número total de CPUs virtuais em todas as suas instâncias de VM em uma região. As cotas de CPU se aplicam a VMs em execução e reservas de VM. As VMs preemptivas e predefinidas consomem essa cota.

Para proteger os usuários e sistemas do Compute Engine, novas contas e projetos têm, também, uma cota CPUs (All Regions) global que se aplicará a todas as regiões e é medida como a soma de todas as vCPUs em todas as regiões.

Por exemplo, se você tiver 48 vCPUs restantes em uma única região como us-central1, mas apenas 32 vCPUs restantes para a cota de CPUs (All Regions), só é possível iniciar 32 vCPUs na região us-central1, mesmo que haja uma cota maior nessa região. Isso ocorre porque você alcançará a cota de CPU (All Regions) e terá que excluir as instâncias existentes antes de iniciar novas instâncias.

Os tipos de máquina E2 e N1 compartilham um pool de cotas de CPU. A menos que indicado de outra forma, todos os outros tipos de máquina têm pools de cotas de CPU exclusivos e separados.

Se você estiver usando descontos por compromisso de uso para suas VMs, precisará ter cota para esse tipo de benefício antes de comprar um contrato de uso.

A tabela a seguir lista os nomes de cota para tipos de máquina do Compute Engine. Se a cota não for aplicável ao tipo de máquina, o valor N/A para "Não aplicável" será exibido.

Tipo de máquina	Pool de cotas	Nome da cota de CPU	Nome da cota de CPU de uso contínuo
N1	Pool compartilhado	`CPUS`	`Committed_CPUS`
E2	Pool compartilhado	`CPUS`	`Committed_CPUS`
N2	Pool separado	`N2_CPUS`	`Committed_N2_CPUS`
N4	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_N4_CPUS`
N2D	Pool separado	`N2D_CPUS`	`Committed_N2D_CPUS`
T2D	Pool separado	`T2D_CPUS`	`Committed_T2D_CPUS`
T2A	Pool separado	`T2A_CPUS`	Indisponível para T2A
Z3	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_Z3_CPUS`
M1	Pool separado	`M1_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M2	Pool separado	`M2_CPUS`	`Committed_MEMORY-OPTIMIZED_CPUS`
M3	Pool separado	`M3_CPUS`	`Committed_M3_CPUS`
M4	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_M4_CPUS`
X4	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_X4_CPUS`
H3	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_H3_CPUS`
C2	Pool separado	`C2_CPUS`	`Committed_C2_CPUS`
C2D	Pool separado	`C2D_CPUS`	`Committed_C2D_CPUS`
C3	Pool separado	`C3_CPUS`	`Committed_C3_CPUS`
C3D	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_C3D_CPUS`
C4	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_C4_CPUS`
C4A	Pool separado	`CPUS_PER_VM_FAMILY`	`Committed_C4A_CPUS`
A2^*	Pool separado	`A2_CPUS`	`Committed_A2_CPUS`
A4X^†	N/A para A4X	N/A para A4X	N/A para A4X
A4^†	N/A para A4	N/A para A4	N/A para A4
A3^†	N/A para A3	N/A para A3	N/A para A3
G4^†	N/A aplicável para G4	N/A aplicável para G4	N/A aplicável para G4
G2^†	N/A relevante para G2	N/A relevante para G2	N/A relevante para G2
VMs preemptivas	Pool compartilhado	`PREEMPTIBLE_CPUS`	Indisponível para VMs preemptivas

^*Para criar VMs A2, basta ter as cotas de GPU NVIDIA A100 necessárias. Não é necessário solicitar cotas de CPU.

^† Para criar VMs A4X, A4, A3, G4 e G2, basta ter as cotas de GPU NVIDIA B200, H200, H100, RTX PRO 6000 e L4 necessárias, respectivamente. Não é necessário solicitar cotas de CPU.

Cota de GPU

Para garantir que você tenha GPUs suficientes disponíveis no projeto, consulte a página "Cotas" no console do Google Cloud . Solicite um aumento de cota se precisar. Novas contas e projetos têm uma cota global de GPU que se aplica a todas as regiões.

Assim como acontece com a cota de CPU virtual, a cota de GPU se refere ao número total de GPUs virtuais em todas as instâncias de VM em uma região. As instâncias e reservas em execução consomem cotas de GPU. Você tem cotas diferentes para criar instâncias padrão, VMs do Spot (por exemplo, instâncias preemptivas), estações de trabalho virtuais ou instâncias que usam o uso confirmado.

Quando você solicita uma cota de GPU, peça uma cota para os modelos de GPU que quer criar em cada região. Também solicite uma cota global adicional (GPUs (all regions)) para o número total de GPUs de todos os tipos em todas as regiões.

A tabela a seguir lista as cotas de GPU disponíveis para cada tipo de máquina.

Tipo de máquina	Tipo de GPU	Cota padrão	Cota por compromisso de uso	Cota de estação de trabalho virtual	Cota preemptiva	Cota de estação de trabalho virtual preemptiva
A4X	GB200	Indisponível	`COMMITTED_NVIDIA_GB200_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_GB200_GPUS`	Indisponível
A4	B200	Indisponível	`COMMITTED_NVIDIA_B200_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_B200_GPUS`	Indisponível
A3 Ultra	H200	Indisponível	`COMMITTED_NVIDIA_H200_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_H200_GPUS`	Indisponível
A3 Mega	H100	`GPU_FAMILY:NVIDIA_H100_MEGA`	`COMMITTED_NVIDIA_H100_MEGA_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS`	Indisponível
A3 Edge e A3 High	H100	`GPU_FAMILY:NVIDIA_H100`	`COMMITTED_NVIDIA_H100_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_H100_GPUS`	Indisponível
A2 Ultra	A100 80 GB	`NVIDIA_A100_80GB_GPUS`	`COMMITTED_NVIDIA_A100_80GB_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_A100_80GB_GPUS`	Indisponível
A2 Padrão	A100 40 GB	`NVIDIA_A100_GPUS`	`COMMITTED_NVIDIA_A100_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_A100_GPUS`	Indisponível
^Prévia da G4	RTX PRO 6000	`GPU_FAMILY:NVIDIA_RTX_PRO_6000`	Indisponível	Indisponível	Indisponível	Indisponível
G2	L4	`GPU_FAMILY:NVIDIA_L4`	`COMMITTED_NVIDIA_L4_GPUS`	`NVIDIA_L4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_L4_GPUS`	`PREEMPTIBLE_NVIDIA_L4_VWS_GPUS`
N1	T4	`NVIDIA_T4_GPUS`	`COMMITTED_NVIDIA_T4_GPUS`	`NVIDIA_T4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_T4_GPUS`	`PREEMPTIBLE_NVIDIA_T4_VWS_GPUS`
N1	V100	`NVIDIA_V100_GPUS`	`COMMITTED_NVIDIA_V100_GPUS`	Indisponível	`PREEMPTIBLE_NVIDIA_V100_GPUS`	Indisponível
N1	P100	`NVIDIA_P100_GPUS`	`COMMITTED_NVIDIA_P100_GPUS`	`NVIDIA_P100_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P100_GPUS`	`PREEMPTIBLE_NVIDIA_P100_VWS_GPUS`
N1	P4	`NVIDIA_P4_GPUS`	`COMMITTED_NVIDIA_P4_GPUS`	`NVIDIA_P4_VWS_GPUS`	`PREEMPTIBLE_NVIDIA_P4_GPUS`	`PREEMPTIBLE_NVIDIA_P4_VWS_GPUS`

Cotas preemptivas

É possível solicitar cotas preemptivas para Preemptible CPUs, Preemptible GPUs e Preemptible Local SSDs (GB). Essas cotas preemptivas se aplicam a CPUs, GPUs e SSDs locais das seguintes VMs:

Se o projeto não tiver uma cota preemptiva e você nunca tiver solicitado a cota preemptiva, esses recursos vão consumir a cota padrão. No entanto, depois que você solicita a cota preemptiva no projeto, os recursos aplicáveis só podem consumir a cota preemptiva e não podem reverter para o consumo de cotas padrão.

Solicitar cotas preemptivas pode ajudar a melhorar a disponibilidade de cotas, fornecendo cotas separadas para recursos temporários. Depois que o Compute Engine concede a cota preemptiva em uma região, todos os recursos aplicáveis consomem automaticamente a cota preemptiva. À medida que essa cota esgotar, é necessário solicitar uma cota preemptiva para esses recursos.

Endereços IP externos

Cada VM que precisar ser acessada diretamente pela Internet pública precisará de endereços IP externos suficientes. A cota de IP regional é usada para atribuir endereços IPv4 ou IPv6 a VMs nessa região. Os endereços IP IPv6 usam os mesmos tipos de cota dos endereços IP IPv4, exceto os endereços IPv6 estáticos externos e internos, que têm os próprios tipos de cota.

A cota de IP global é usada para atribuir endereços IPv4 a recursos de rede global, como balanceadores de carga.

OGoogle Cloud oferece diferentes tipos de endereços IP, conforme a necessidade. Para mais informações sobre os custos, consulte Preços de endereços IP externos. Para informações sobre cotas, consulte Cotas e limites.

Endereços IP estáticos. O número de endereços IPv4 externos, estáticos e regionais que você pode reservar em cada região do seu projeto.
Intervalos de endereços IPv6 externos regionais estáticos:o número de intervalos de endereços IPv6 externos regionais estáticos que você pode reservar em cada região do seu projeto.
Endereços IP estáticos globais: são endereços IP externos reservados para os recursos que resistem a reinicializações da máquina. É possível registrar esses endereços com serviços de DNS e provedor de domínio para fornecer um endereço fácil de usar. Por exemplo, www.example-site.com.
Endereços IP em uso. O número de endereços IP externo regionais estáticos e temporários que podem ser usados no projeto simultaneamente.
Endereços IP em uso globais. O número de endereços IP externo globais estáticos e temporários que podem ser usados no projeto simultaneamente.

Observação: se o mesmo endereço IP for atribuído a mais de uma regra de encaminhamento, oGoogle Cloud contará e adicionará cada uso do endereço à cota IN_USE_ADDRESSES, em vez de uma contagem exclusiva de objetos de endereço IP usados.

Lançamentos de cotas

Ocasionalmente,o Google Cloud muda a cota padrão de recursos e APIs. Essas mudanças ocorrem de forma gradual. Durante o lançamento de uma nova cota padrão, a cota máxima que aparece no console do Google Cloud pode não refletir a cota máxima real disponível.

Por exemplo, suponha que Google Cloud mude a cota máxima padrão das regras de firewall de 200 para 300, e você use o console do Google Cloud para conferir sua cota. Talvez você encontre a nova cota de 300, mesmo que sua cota real seja de 200 até a conclusão do lançamento.

Para mais informações sobre lançamentos de cotas em andamento, consulte problemas conhecidos. Se nenhum problema for descrito, não haverá lançamento de cota em andamento.

Se um lançamento de cota estiver em andamento e você quiser confirmar a cota máxima real disponível, use a Google Cloud CLI para verificar sua cota. Se você precisar de mais cota do que o acesso, envie uma solicitação de ajuste de cota.

A seguir

Saiba mais sobre preços baseados em recursos.
Leia sobre os preços das instâncias de VM.
Saiba como acessar e gerenciar a cota.
Saiba como configurar alertas de cota.
Saiba como aumentar a cota automaticamente com base no uso dos recursos do Compute Engine.

cotas de alocação. Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

cotas de alocação.

Cotas e disponibilidade de recursos

cotas de alocação.

Cotas regionais e globais

Instâncias de VM

Grupos de instâncias

Cotas de disco

Cotas de pool de armazenamento

Limites de cota da CPU

Cota de GPU

Cotas preemptivas

Endereços IP externos

Lançamentos de cotas

A seguir

cotas de alocação.