Esta página descreve como ajustar cotas usando o sistema do ajustador de cotas.
O ajustador de cotas observa o consumo de recursos e envia solicitações de ajuste de cota em seu nome. Monitorar o uso de recursos e enviar solicitações de ajuste de cota de modo proativo ajuda a evitar interrupções causadas ao atingir o limite da cota. Com o ajustador de cotas, você se preocupa menos em monitorar aumentos não planejados no uso de recursos e envia menos solicitações manuais para ajustes de cota.
Como o ajustador de cotas funciona
Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e considera a seguinte lógica:
- O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
- Nesse caso, ele tenta aumentar o limite de cota, em geral, em torno de 10 a 20%.
Se for possível aumentar o valor da cota, o aumento será aprovado e o valor será ajustado. Você sempre pode solicitar manualmente aumentos para o limite de cota, independentemente da ativação do ajustador de cotas.
O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual de cota, o ajustador não envia solicitações de ajuste.
É possível conferir as solicitações feitas pelo ajustador de cota na página "Cotas e limites do sistema" do console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador de cotas.
Limitações
O ajustador de cotas tem as seguintes limitações:
- As configurações do ajustador de cotas estão disponíveis apenas por projeto.
- As configurações do ajustador de cota só podem ser acessadas no console doGoogle Cloud .
Disponibilidade
O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar cota extra. Por esse motivo, a opção de ativar o ajustador de cotas está disponível apenas em projetos com atividade histórica suficiente para permitir previsões exatas.
Para conferir a lista de cotas qualificadas para ajuste pelo ajustador de cotas, siga estas etapas:
No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
Clique na guia Configurações para ver a lista.
Como alternativa, para pesquisar na tabela a seguir, insira uma palavra-chave no campo Filtrar tabela por palavra-chave.
Serviço Cotas API Artifact Registry Solicitações por projeto na multirregião da Ásia por minuto API Artifact Registry Solicitações por projeto na multirregião da Europa por minuto API Artifact Registry Solicitações por projeto na multirregião dos EUA por minuto API Artifact Registry Solicitações por projeto, por região e por minuto, por região API Cloud Build Solicitações de build e operação Get por minuto API Cloud Build Solicitações de build e operação GET por minuto por usuário API Cloud Build CPUs de build simultâneas (pool regional padrão) API Cloud Build Builds simultâneas (pool padrão não regional) Cloud Key Management Service API Solicitações de criptografia por minuto Cloud Key Management Service API Solicitações de leitura por minuto Cloud Key Management Service API Solicitações de gravação por minuto API Cloud Logging Bytes de gravação de registros por minuto e região API Cloud Resource Manager Solicitações de leitura por minuto API Cloud Run Admin Solicitações de execução de jobs por minuto e região API Cloud Run Admin Solicitações de leitura por minuto por região API Cloud Run Admin Alocação total de CPU, em mili vCPU, por projeto e região API Cloud Run Admin Solicitações de gravação por minuto por região API Cloud Trace Solicitações de gravação (gratuitas) por minuto API Compute Engine Grupos de afinidade API Compute Engine Buckets de back-end API Compute Engine CPUs C2 API Compute Engine CPUs C2D API Compute Engine CPUs C3 API Compute Engine Compromissos API Compute Engine CPUs A2 de uso contínuo API Compute Engine CPUs de uso contínuo API Compute Engine Licenças atribuídas API Compute Engine Disco SSD local reservado por compromisso (GB) API Compute Engine CPUs M3 de uso contínuo API Compute Engine CPUs com otimização de memória de uso contínuo API Compute Engine CPUs N2 de uso contínuo API Compute Engine CPUs N2D de uso contínuo API Compute Engine CPUs T2D de uso contínuo API Compute Engine CPUs API Compute Engine CPUs por família de VMs API Compute Engine Projetos de serviço de rede entre projetos API Compute Engine Rotas estáticas personalizadas por rede VPC API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem externa API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem externa API Compute Engine Regras de encaminhamento de protocolo externo API Compute Engine Regras de firewall API Compute Engine Regras de encaminhamento API Compute Engine Serviços de back-end gerenciados externos globais API Compute Engine Regras de encaminhamento gerenciadas externas globais API Compute Engine Serviços de back-end de balanceador de carga de proxy externo global API Compute Engine Serviços de back-end do Traffic Director internos globais API Compute Engine Contagem de GPUs por família de GPU API Compute Engine GPUs (todas as regiões) API Compute Engine Verificações de integridade API Compute Engine Capacidade do Hyperdisk Balanced (GB) API Compute Engine Imagens API Compute Engine Endereços IP em uso API Compute Engine Endereços IPv4 externos regionais em uso API Compute Engine Programações de snapshots em uso API Compute Engine Grupos de instâncias API Compute Engine Modelos de instância API Compute Engine Instâncias por grupo de peering API Compute Engine Instâncias por rede VPC API Compute Engine Endereços IP internos API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem interna API Compute Engine Regras de encaminhamento de balanceador de carga de rede interno por grupo de peering API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem interna por rede VPC API Compute Engine Aliases de IP por grupo de peering API Compute Engine Alias de IP por rede VPC API Compute Engine Disco SSD local por família de VMs (GB) API Compute Engine CPUs M1 API Compute Engine CPUs M2 API Compute Engine CPUs M3 API Compute Engine Grupos de instâncias gerenciadas API Compute Engine CPUs N2 API Compute Engine CPUs N2D API Compute Engine Grupos de endpoints de rede API Compute Engine Políticas de firewall de rede API Compute Engine Atributos de regra da política de segurança de balanceamento de carga de rede API Compute Engine Políticas de segurança de balanceamento de carga de rede API Compute Engine Redes API Compute Engine CPUs NVIDIA A2 API Compute Engine Peerings por rede VPC API Compute Engine IOPS do Persistent Disk API Compute Engine Persistent disk SSD (GB) API Compute Engine disco permanente padrão (GB) API Compute Engine CPUs preemptivas API Compute Engine SSD local preemptivo (GB) API Compute Engine GPUs NVIDIA A100 de 80 GB preemptivas API Compute Engine GPUs NVIDIA A100 preemptivas API Compute Engine GPUs NVIDIA H100 preemptivas API Compute Engine GPUs NVIDIA H100 MEGA preemptivas API Compute Engine GPUs NVIDIA K80 preemptivas API Compute Engine GPUs NVIDIA L4 preemptivas API Compute Engine GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais API Compute Engine GPUs NVIDIA P100 preemptivas API Compute Engine GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais API Compute Engine GPUs NVIDIA P4 preemptivas API Compute Engine GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais API Compute Engine GPUs NVIDIA T4 preemptivas API Compute Engine GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais API Compute Engine GPUs NVIDIA V100 preemptivas API Compute Engine Prefixo anunciado público API Compute Engine Serviços de back-end gerenciados externos regionais API Compute Engine Regras de encaminhamento gerenciadas externas regionais por região e rede VPC API Compute Engine Modelos de instâncias regionais API Compute Engine Serviços de back-end gerenciados internos regionais API Compute Engine Serviços de back-end do Traffic Director internos regionais API Compute Engine Grupos de instâncias gerenciadas regionais API Compute Engine Políticas de segurança regionais API Compute Engine Regras de política de segurança regional com uma condição de correspondência avançada API Compute Engine Proxies TCP de destino regionais API Compute Engine Roteadores API Compute Engine Rotas API Compute Engine Políticas de segurança API Compute Engine Regras da política de segurança API Compute Engine Regras de linguagem das regras da política de segurança API Compute Engine Snapshots API Compute Engine Certificados SSL API Compute Engine Endereços IP BYOIP estáticos API Compute Engine Endereços IP estáticos API Compute Engine Intervalos de sub-rede por grupo de peering API Compute Engine Intervalos de sub-rede por rede VPC API Compute Engine CPUs T2A API Compute Engine CPUs T2D API Compute Engine Proxies HTTP de destino API Compute Engine Proxies HTTPS de destino API Compute Engine Proxies SSL de destino API Compute Engine Proxies TCP de destino API Compute Engine Gateways VPN de destino API Compute Engine Total do disco SSD local reservado (GB) API Compute Engine Mapas de URL API Compute Engine Instâncias de VM API Compute Engine Gateways de VPN API Compute Engine Túneis VPN API Connect Gateway Solicitações de conexão de gateway por minuto API Dialogflow Todas as outras solicitações por minuto API Filestore Backups por região API Filestore Capacidade do HDD básico (padrão) (GB) por região API Filestore Capacidade do SSD básico (Premium) (GB) por região API Filestore Capacidade zonal e regional de 1 a 10 TiB (Enterprise) (GB) por região API Filestore Capacidade zonal e regional de 10 a 100 TiB (alta escala) (GB) por região Google Cloud API Memorystore for Redis Capacidade total do Redis (GB) por região Google Cloud API Memorystore for Redis Total de unidades do cluster do Redis por projeto e por região API Memorystore Total de unidades da Memorystore por projeto e região API Vertex AI CPUs de veiculação de modelo personalizado por região API Vertex AI GPUs Nvidia T4 para veiculação de modelos personalizados por região API Vertex AI GPUs Nvidia T4 de treinamento de modelo personalizado por região API Vertex AI Gerar solicitações de conteúdo por minuto, por projeto e por modelo de base API Vertex AI Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base
Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud .
API Vertex AI Solicitações (CRUD) de gerenciamento de recursos por minuto e região API Vertex AI Núcleos do pod da TPU V3 de treinamento de imagens restritos por região
Ativar o ajustador de cotas
Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para ativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:
Console
Para ativar o ajustador de cotas no seu projeto do Google Cloud no console do Google Cloud , siga estas etapas:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar.
Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso e emitir solicitações de ajuste de cota quando o uso de recursos se aproximar do limite da cota.
REST
Para ativar o ajustador de cotas no seu projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo da solicitação, especifique o recurso de configurações do ajuste de cota e defina o campo
enablement
comoENABLED
. Também é possível especificar uma ETag, mas isso é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Substitua:
PROJECT_ID_OR_NUMBER
: o ID do projeto ou número do projeto em que você quer ativar o ajuste de cota.OPTIONAL_ETAG
: uma string ETag opcional para as configurações do ajustador de cota.
Isso atualiza o status de ativação para
enabled
.
gcloud
Para ativar o ajustador de cotas no seu Google Cloud projeto usando a CLI gcloud (pré-lançamento), siga estas etapas:
Faça a autenticação usando a CLI gcloud:
gcloud auth login
Ative as configurações do ajustador de cotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID do projeto ou número do projeto em que você quer ativar o ajuste de cota.Verifique o status de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Desde que você tenha as permissões necessárias, isso vai retornar o status como
enabled
.
Conferir solicitações de ajuste de cota
Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
- Clique no campo Filtro.
- Selecione Tipo no menu e digite
Auto
. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.
Configurar alertas do ajustador de cotas
Para receber alertas do ajustador de cotas:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique em Criar alerta.
- Selecione um dos modelos de alerta ou ambos:
- A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste para o projeto.
- A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue fazer isso.
- Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
- Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
- Clique em Criar.
Editar ou excluir alertas do ajustador de cotas
É possível editar ou excluir os alertas do ajustador de cotas no consoleGoogle Cloud :
Acesse a página Políticas no console do Cloud Monitoring.
Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:
Quota adjuster errors and failures
All adjustments by quota adjuster
Na linha que mostra a política de alertas do ajustador de cotas, clique em
Ver mais.Clique em Editar ou Excluir.
Desativar o ajustador de cotas
Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para desativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:
Console
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar. O botão fica cinza.
Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.
REST
Para desativar o ajustador de cota no seu projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cota:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo da solicitação, especifique o recurso de configurações do ajuste de cota e defina o campo
enablement
comoDISABLED
. Também é possível especificar uma ETag, mas isso é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Substitua:
PROJECT_ID_OR_NUMBER
: o ID do projeto ou número do projeto em que você quer desativar o ajuste de cota.OPTIONAL_ETAG
: uma string ETag opcional para as configurações do ajustador de cota.
Isso atualiza o status de ativação para
disabled
.
gcloud
Para desativar o ajustador de cotas no seu projeto Google Cloud usando a CLI gcloud (prévia), siga estas etapas:
Faça a autenticação na CLI gcloud:
gcloud auth login
Desative as configurações do ajustador de cotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID do projeto ou número do projeto em que você quer desativar o ajuste de cota.Verifique o estado de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Desde que você tenha as permissões necessárias, isso vai retornar o status como
disabled
.
Resolver problemas que negam aumento de cota
É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região específica além de um determinado limite. Nesses casos, ainda é possível solicitar um aumento de cota manual.
Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador é negada, configure alertas do ajustador de cotas.