Ajustador de cotas

Esta página descreve como ajustar cotas usando o sistema do ajustador de cotas.

O ajustador de cotas observa o consumo de recursos e envia solicitações de ajuste de cota em seu nome. Monitorar o uso de recursos e enviar solicitações de ajuste de cota de modo proativo ajuda a evitar interrupções causadas ao atingir o limite da cota. Com o ajustador de cotas, você se preocupa menos em monitorar aumentos não planejados no uso de recursos e envia menos solicitações manuais para ajustes de cota.

Como o ajustador de cotas funciona

Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e considera a seguinte lógica:

  • O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
  • Nesse caso, ele tenta aumentar o limite de cota, em geral, em torno de 10 a 20%.

Se for possível aumentar o valor da cota, o aumento será aprovado e o valor será ajustado. Você sempre pode solicitar manualmente aumentos para o limite de cota, independentemente da ativação do ajustador de cotas.

O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual de cota, o ajustador não envia solicitações de ajuste.

É possível conferir as solicitações feitas pelo ajustador de cota na página "Cotas e limites do sistema" do console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador de cotas.

Limitações

O ajustador de cotas tem as seguintes limitações:

  • As configurações do ajustador de cotas estão disponíveis apenas por projeto.
  • As configurações do ajustador de cota só podem ser acessadas no console doGoogle Cloud .

Disponibilidade

O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar cota extra. Por esse motivo, a opção de ativar o ajustador de cotas está disponível apenas em projetos com atividade histórica suficiente para permitir previsões exatas.

Para conferir a lista de cotas qualificadas para ajuste pelo ajustador de cotas, siga estas etapas:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações para ver a lista.

    Como alternativa, para pesquisar na tabela a seguir, insira uma palavra-chave no campo Filtrar tabela por palavra-chave.

    Serviço Cotas
    API Artifact Registry Solicitações por projeto na multirregião da Ásia por minuto
    API Artifact Registry Solicitações por projeto na multirregião da Europa por minuto
    API Artifact Registry Solicitações por projeto na multirregião dos EUA por minuto
    API Artifact Registry Solicitações por projeto, por região e por minuto, por região
    API Cloud Build Solicitações de build e operação Get por minuto
    API Cloud Build Solicitações de build e operação GET por minuto por usuário
    API Cloud Build CPUs de build simultâneas (pool regional padrão)
    API Cloud Build Builds simultâneas (pool padrão não regional)
    Cloud Key Management Service API Solicitações de criptografia por minuto
    Cloud Key Management Service API Solicitações de leitura por minuto
    Cloud Key Management Service API Solicitações de gravação por minuto
    API Cloud Logging Bytes de gravação de registros por minuto e região
    API Cloud Resource Manager Solicitações de leitura por minuto
    API Cloud Run Admin Solicitações de execução de jobs por minuto e região
    API Cloud Run Admin Solicitações de leitura por minuto por região
    API Cloud Run Admin Alocação total de CPU, em mili vCPU, por projeto e região
    API Cloud Run Admin Solicitações de gravação por minuto por região
    API Cloud Trace Solicitações de gravação (gratuitas) por minuto
    API Compute Engine Grupos de afinidade
    API Compute Engine Buckets de back-end
    API Compute Engine CPUs C2
    API Compute Engine CPUs C2D
    API Compute Engine CPUs C3
    API Compute Engine Compromissos
    API Compute Engine CPUs A2 de uso contínuo
    API Compute Engine CPUs de uso contínuo
    API Compute Engine Licenças atribuídas
    API Compute Engine Disco SSD local reservado por compromisso (GB)
    API Compute Engine CPUs M3 de uso contínuo
    API Compute Engine CPUs com otimização de memória de uso contínuo
    API Compute Engine CPUs N2 de uso contínuo
    API Compute Engine CPUs N2D de uso contínuo
    API Compute Engine CPUs T2D de uso contínuo
    API Compute Engine CPUs
    API Compute Engine CPUs por família de VMs
    API Compute Engine Projetos de serviço de rede entre projetos
    API Compute Engine Rotas estáticas personalizadas por rede VPC
    API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem externa
    API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem externa
    API Compute Engine Regras de encaminhamento de protocolo externo
    API Compute Engine Regras de firewall
    API Compute Engine Regras de encaminhamento
    API Compute Engine Serviços de back-end gerenciados externos globais
    API Compute Engine Regras de encaminhamento gerenciadas externas globais
    API Compute Engine Serviços de back-end de balanceador de carga de proxy externo global
    API Compute Engine Serviços de back-end do Traffic Director internos globais
    API Compute Engine Contagem de GPUs por família de GPU
    API Compute Engine GPUs (todas as regiões)
    API Compute Engine Verificações de integridade
    API Compute Engine Capacidade do Hyperdisk Balanced (GB)
    API Compute Engine Imagens
    API Compute Engine Endereços IP em uso
    API Compute Engine Endereços IPv4 externos regionais em uso
    API Compute Engine Programações de snapshots em uso
    API Compute Engine Grupos de instâncias
    API Compute Engine Modelos de instância
    API Compute Engine Instâncias por grupo de peering
    API Compute Engine Instâncias por rede VPC
    API Compute Engine Endereços IP internos
    API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem interna
    API Compute Engine Regras de encaminhamento de balanceador de carga de rede interno por grupo de peering
    API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem interna por rede VPC
    API Compute Engine Aliases de IP por grupo de peering
    API Compute Engine Alias de IP por rede VPC
    API Compute Engine Disco SSD local por família de VMs (GB)
    API Compute Engine CPUs M1
    API Compute Engine CPUs M2
    API Compute Engine CPUs M3
    API Compute Engine Grupos de instâncias gerenciadas
    API Compute Engine CPUs N2
    API Compute Engine CPUs N2D
    API Compute Engine Grupos de endpoints de rede
    API Compute Engine Políticas de firewall de rede
    API Compute Engine Atributos de regra da política de segurança de balanceamento de carga de rede
    API Compute Engine Políticas de segurança de balanceamento de carga de rede
    API Compute Engine Redes
    API Compute Engine CPUs NVIDIA A2
    API Compute Engine Peerings por rede VPC
    API Compute Engine IOPS do Persistent Disk
    API Compute Engine Persistent disk SSD (GB)
    API Compute Engine disco permanente padrão (GB)
    API Compute Engine CPUs preemptivas
    API Compute Engine SSD local preemptivo (GB)
    API Compute Engine GPUs NVIDIA A100 de 80 GB preemptivas
    API Compute Engine GPUs NVIDIA A100 preemptivas
    API Compute Engine GPUs NVIDIA H100 preemptivas
    API Compute Engine GPUs NVIDIA H100 MEGA preemptivas
    API Compute Engine GPUs NVIDIA K80 preemptivas
    API Compute Engine GPUs NVIDIA L4 preemptivas
    API Compute Engine GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA P100 preemptivas
    API Compute Engine GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA P4 preemptivas
    API Compute Engine GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA T4 preemptivas
    API Compute Engine GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA V100 preemptivas
    API Compute Engine Prefixo anunciado público
    API Compute Engine Serviços de back-end gerenciados externos regionais
    API Compute Engine Regras de encaminhamento gerenciadas externas regionais por região e rede VPC
    API Compute Engine Modelos de instâncias regionais
    API Compute Engine Serviços de back-end gerenciados internos regionais
    API Compute Engine Serviços de back-end do Traffic Director internos regionais
    API Compute Engine Grupos de instâncias gerenciadas regionais
    API Compute Engine Políticas de segurança regionais
    API Compute Engine Regras de política de segurança regional com uma condição de correspondência avançada
    API Compute Engine Proxies TCP de destino regionais
    API Compute Engine Roteadores
    API Compute Engine Rotas
    API Compute Engine Políticas de segurança
    API Compute Engine Regras da política de segurança
    API Compute Engine Regras de linguagem das regras da política de segurança
    API Compute Engine Snapshots
    API Compute Engine Certificados SSL
    API Compute Engine Endereços IP BYOIP estáticos
    API Compute Engine Endereços IP estáticos
    API Compute Engine Intervalos de sub-rede por grupo de peering
    API Compute Engine Intervalos de sub-rede por rede VPC
    API Compute Engine CPUs T2A
    API Compute Engine CPUs T2D
    API Compute Engine Proxies HTTP de destino
    API Compute Engine Proxies HTTPS de destino
    API Compute Engine Proxies SSL de destino
    API Compute Engine Proxies TCP de destino
    API Compute Engine Gateways VPN de destino
    API Compute Engine Total do disco SSD local reservado (GB)
    API Compute Engine Mapas de URL
    API Compute Engine Instâncias de VM
    API Compute Engine Gateways de VPN
    API Compute Engine Túneis VPN
    API Connect Gateway Solicitações de conexão de gateway por minuto
    API Dialogflow Todas as outras solicitações por minuto
    API Filestore Backups por região
    API Filestore Capacidade do HDD básico (padrão) (GB) por região
    API Filestore Capacidade do SSD básico (Premium) (GB) por região
    API Filestore Capacidade zonal e regional de 1 a 10 TiB (Enterprise) (GB) por região
    API Filestore Capacidade zonal e regional de 10 a 100 TiB (alta escala) (GB) por região
    Google Cloud API Memorystore for Redis Capacidade total do Redis (GB) por região
    Google Cloud API Memorystore for Redis Total de unidades do cluster do Redis por projeto e por região
    API Memorystore Total de unidades da Memorystore por projeto e região
    API Vertex AI CPUs de veiculação de modelo personalizado por região
    API Vertex AI GPUs Nvidia T4 para veiculação de modelos personalizados por região
    API Vertex AI GPUs Nvidia T4 de treinamento de modelo personalizado por região
    API Vertex AI Gerar solicitações de conteúdo por minuto, por projeto e por modelo de base
    API Vertex AI

    Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base

    Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud .

    API Vertex AI Solicitações (CRUD) de gerenciamento de recursos por minuto e região
    API Vertex AI Núcleos do pod da TPU V3 de treinamento de imagens restritos por região

Ativar o ajustador de cotas

Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para ativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:

Console

Para ativar o ajustador de cotas no seu projeto do Google Cloud no console do Google Cloud , siga estas etapas:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar.

Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso e emitir solicitações de ajuste de cota quando o uso de recursos se aproximar do limite da cota.

REST

  1. Para ativar o ajustador de cotas no seu projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajuste de cota e defina o campo enablement como ENABLED. Também é possível especificar uma ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID do projeto ou número do projeto em que você quer ativar o ajuste de cota.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cota.

    Isso atualiza o status de ativação para enabled.

gcloud

Para ativar o ajustador de cotas no seu Google Cloud projeto usando a CLI gcloud (pré-lançamento), siga estas etapas:

  1. Faça a autenticação usando a CLI gcloud:

    gcloud auth login
    
  2. Ative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou número do projeto em que você quer ativar o ajuste de cota.

  3. Verifique o status de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Desde que você tenha as permissões necessárias, isso vai retornar o status como enabled.

Conferir solicitações de ajuste de cota

Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
  3. Clique no campo Filtro.
  4. Selecione Tipo no menu e digite Auto. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.

Configurar alertas do ajustador de cotas

Para receber alertas do ajustador de cotas:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique em Criar alerta.
  4. Selecione um dos modelos de alerta ou ambos:
    1. A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste para o projeto.
    2. A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue fazer isso.
  5. Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
  6. Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
  7. Clique em Criar.

Editar ou excluir alertas do ajustador de cotas

É possível editar ou excluir os alertas do ajustador de cotas no consoleGoogle Cloud :

  1. Acesse a página Políticas no console do Cloud Monitoring.

    Acessar "Políticas"

  2. Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Na linha que mostra a política de alertas do ajustador de cotas, clique em Ver mais.

  4. Clique em Editar ou Excluir.

Desativar o ajustador de cotas

Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para desativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:

Console

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar. O botão fica cinza.

Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.

REST

  1. Para desativar o ajustador de cota no seu projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajuste de cota e defina o campo enablement como DISABLED. Também é possível especificar uma ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID do projeto ou número do projeto em que você quer desativar o ajuste de cota.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cota.

    Isso atualiza o status de ativação para disabled.

gcloud

Para desativar o ajustador de cotas no seu projeto Google Cloud usando a CLI gcloud (prévia), siga estas etapas:

  1. Faça a autenticação na CLI gcloud:

    gcloud auth login
    
  2. Desative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID do projeto ou número do projeto em que você quer desativar o ajuste de cota.

  3. Verifique o estado de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Desde que você tenha as permissões necessárias, isso vai retornar o status como disabled.

Resolver problemas que negam aumento de cota

É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região específica além de um determinado limite. Nesses casos, ainda é possível solicitar um aumento de cota manual.

Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador é negada, configure alertas do ajustador de cotas.