Ajustador de cotas

Neste documento, descrevemos como ajustar cotas usando o sistema do ajustador de cotas.

O ajustador de cotas observa seu consumo de recursos e envia solicitações de ajuste de cota em seu nome. Ao monitorar seu uso de recursos e enviar solicitações de ajuste de cota de modo proativo, ele ajuda a evitar interrupções causadas ao atingir o limite da cota. Ao usar o ajustador de cotas, você se preocupa menos com o monitoramento de aumentos não planejados no uso de recursos e envia menos solicitações manuais de ajustes de cota.

Como o ajustador de cotas funciona

Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e adota a seguinte lógica:

  • O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
  • Se isso aconteceu, ele tenta aumentar o limite de cota. Em geral, esse aumento é em torno de 10 a 20%.

Quando é possível aumentar o limite da cota, o aumento é aprovado e o valor ajustado. Você sempre pode solicitar manualmente aumentos de limite de cota, independentemente da ativação do ajustador de cotas.

O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual, o ajustador não envia solicitações de ajuste.

É possível conferir as solicitações feitas pelo ajustador de cotas na página Cotas e limites do sistema no console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador.

Limitações

O ajustador de cotas tem as seguintes limitações:

  • As configurações do ajustador de cotas estão disponíveis com base no projeto.
  • Essas configurações só podem ser acessadas no console doGoogle Cloud .
  • O ajuste de cotas não está disponível para todas as cotas. Para saber mais, consulte Disponibilidade neste documento.

Disponibilidade

A disponibilidade do ajustador de cotas depende do projeto do Google Cloud e só está disponível para algumas cotas do Google Cloud .

Qualificação com base no histórico de uso

O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar mais cotas. Por isso, a opção de ativar o ajustador de cotas só está disponível em projetos com um histórico de atividades suficiente para permitir previsões exatas.

Cotas aceitas

O ajustador de cotas não está disponível para todas as cotas doGoogle Cloud . Um serviço do Google Cloud pode aceitar o uso do ajustador de cotas para todas, algumas ou nenhuma das cotas. Se você ativar o ajustador de cotas em um projeto, ele será aplicado a todas as cotas aceitas.

Quando um serviço do Google Cloud adiciona ou expande o suporte ao ajustador para as próprias cotas, o ajustador monitora e ajusta automaticamente essas cotas que agora são aceitas para o projeto. Isso acontece mesmo quando essas cotas específicas não eram aceitas ao ativar inicialmente o ajustador de cotas.

A tabela a seguir lista as cotas aceitas pelo ajustador de cotas.

Serviço Cotas
API Artifact Registry Solicitações por projeto na multirregião da Ásia por minuto
API Artifact Registry Solicitações por projeto na multirregião da Europa por minuto
API Artifact Registry Solicitações por projeto na multirregião dos EUA por minuto
API Artifact Registry Solicitações por projeto, por região e por minuto
API Cloud Build Solicitações GET de build e de operação por minuto
API Cloud Build Solicitações GET de build e de operação por minuto e por usuário
API Cloud Build CPUs de builds simultâneos (pool padrão regional)
API Cloud Build Builds simultâneos (pool padrão não regional)
API Cloud Key Management Service Solicitações de criptografia por minuto
API Cloud Key Management Service Solicitações de leitura por minuto
API Cloud Key Management Service Solicitações de gravação por minuto
API Cloud Logging Bytes de gravação no registro por minuto e por região
API Cloud Resource Manager Solicitações de leitura por minuto
API Cloud Run Admin Solicitações de execução de jobs por minuto e por região
API Cloud Run Admin Solicitações de leitura por minuto e por região
API Cloud Run Admin Alocação total de CPUs, em mili vCPU, por projeto e por região
API Cloud Run Admin Solicitações de gravação por minuto e por região
API Cloud Trace Solicitações de gravação (sem custos) por minuto
API Compute Engine Grupos de afinidade
API Compute Engine Buckets de back-end
API Compute Engine CPUs C2
API Compute Engine CPUs C2D
API Compute Engine CPUs C3
API Compute Engine Compromissos
API Compute Engine CPUs A2 com compromisso de uso
API Compute Engine CPUs com compromisso de uso
API Compute Engine Licenças em uso
API Compute Engine Disco SSD local reservado com compromisso de uso (GB)
API Compute Engine CPUs M3 com compromisso de uso
API Compute Engine CPUs com otimização de memória e compromisso de uso
API Compute Engine CPUs N2 com compromisso de uso
API Compute Engine CPUs N2D com compromisso de uso
API Compute Engine CPUs T2D com compromisso de uso
API Compute Engine CPUs
API Compute Engine CPUs por família de VMs
API Compute Engine Projetos do serviço de redes entre projetos
API Compute Engine Rotas estáticas personalizadas por rede VPC
API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem externo
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem externo
API Compute Engine Regras de encaminhamento de protocolo externo
API Compute Engine Regras de firewall
API Compute Engine Regras de encaminhamento
API Compute Engine Serviços de back-end gerenciados externos globais
API Compute Engine Regras de encaminhamento gerenciadas externas globais
API Compute Engine Serviços de back-end de balanceador de carga de proxy externo global
API Compute Engine Serviços de back-end do Traffic Director interno global
API Compute Engine Contagem de GPUs por família de GPUs
API Compute Engine GPUs (todas as regiões)
API Compute Engine Verificações de integridade
API Compute Engine Imagens
API Compute Engine Endereços IP em uso
API Compute Engine Endereços IPv4 externos regionais em uso
API Compute Engine Programações de snapshots em uso
API Compute Engine Grupos de instâncias
API Compute Engine Modelos de instância
API Compute Engine Instâncias por grupo de peering
API Compute Engine Instâncias por rede VPC
API Compute Engine Endereços IP internos
API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem interno
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem interno por grupo de peering
API Compute Engine Regras de encaminhamento do balanceador de carga de rede de passagem interno por rede VPC
API Compute Engine Aliases de IP por grupo de peering
API Compute Engine Alias de IP por rede VPC
API Compute Engine Disco SSD local por família de VMs (GB)
API Compute Engine CPUs M1
API Compute Engine CPUs M2
API Compute Engine CPUs M3
API Compute Engine Grupos gerenciados de instâncias
API Compute Engine CPUs N2
API Compute Engine CPUs N2D
API Compute Engine Grupos de endpoints de rede
API Compute Engine Políticas de firewall de rede
API Compute Engine Atributos de regra da política de segurança de balanceamento de carga de rede
API Compute Engine Políticas de segurança de balanceamento de carga de rede
API Compute Engine Redes
API Compute Engine CPUs NVIDIA A2
API Compute Engine Peerings por rede VPC
API Compute Engine IOPS do Persistent Disk
API Compute Engine SSD do Persistent Disk (GB)
API Compute Engine Persistent Disk padrão (GB)
API Compute Engine CPUs preemptivas
API Compute Engine SSD local preemptivo (GB)
API Compute Engine GPUs NVIDIA A100 preemptivas de 80 GB
API Compute Engine GPUs NVIDIA A100 preemptivas
API Compute Engine GPUs NVIDIA H100 preemptivas
API Compute Engine GPUs NVIDIA H100 MEGA preemptivas
API Compute Engine GPUs NVIDIA K80 preemptivas
API Compute Engine GPUs NVIDIA L4 preemptivas
API Compute Engine GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais
API Compute Engine GPUs NVIDIA P100 preemptivas
API Compute Engine GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais
API Compute Engine GPUs NVIDIA P4 preemptivas
API Compute Engine GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais
API Compute Engine GPUs NVIDIA T4 preemptivas
API Compute Engine GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais
API Compute Engine GPUs NVIDIA V100 preemptivas
API Compute Engine Prefixos públicos anunciados
API Compute Engine Serviços de back-end gerenciados externos regionais
API Compute Engine Regras de encaminhamento gerenciadas externas regionais por região e por rede VPC
API Compute Engine Modelos de instâncias regionais
API Compute Engine Serviços de back-end gerenciados internos regionais
API Compute Engine Serviços de back-end do Traffic Director interno regional
API Compute Engine Grupos gerenciados de instâncias regionais
API Compute Engine Políticas de segurança regionais
API Compute Engine Regras de política de segurança regional com uma condição de correspondência avançada
API Compute Engine Proxies TCP de destino regionais
API Compute Engine Roteadores
API Compute Engine Rotas
API Compute Engine Políticas de segurança
API Compute Engine Regras da política de segurança
API Compute Engine Regras de linguagem das regras da política de segurança
API Compute Engine Snapshots
API Compute Engine Certificados SSL
API Compute Engine Endereços IP BYOIP estáticos
API Compute Engine Endereços IP estáticos
API Compute Engine Intervalos de sub-redes por grupo de peering
API Compute Engine Intervalos de sub-redes por rede VPC
API Compute Engine CPUs T2A
API Compute Engine CPUs T2D
API Compute Engine Proxies HTTP de destino
API Compute Engine Proxies HTTPS de destino
API Compute Engine Proxies SSL de destino
API Compute Engine Proxies TCP de destino
API Compute Engine Gateways VPN de destino
API Compute Engine Total do disco SSD local reservado (GB)
API Compute Engine Mapas de URL
API Compute Engine Instâncias de VM
API Compute Engine Gateways VPN
API Compute Engine Túneis VPN
API Connect Gateway Solicitações de conexão de gateway por minuto
API Dialogflow Todas as outras solicitações por minuto
API Filestore Backups por região
API Filestore Capacidade do HDD básico (padrão) por região (GB)
API Filestore Capacidade do SSD básico (Premium) por região (GB)
API Filestore Capacidade zonal e regional de 1 a 10 TiB (Enterprise) por região (GB)
API Filestore Capacidade zonal e regional de 10 a 100 TiB (alta escala) por região (GB)
API Memorystore for Redis doGoogle Cloud Capacidade total do Redis por região (GB)
API Memorystore for Redis doGoogle Cloud Total de unidades do cluster do Redis por projeto e por região
API Memorystore Total de unidades do Memorystore por projeto e por região
API Vertex AI CPUs personalizadas de disponibilização de modelos por região
API Vertex AI GPUs NVIDIA T4 personalizadas de disponibilização de modelos por região
API Vertex AI GPUs NVIDIA T4 personalizadas de treinamento de modelos por região
API Vertex AI Solicitações de geração de conteúdo por minuto, por projeto e por modelo de base
API Vertex AI

Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base

Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud .

API Vertex AI Solicitações de gerenciamento de recursos (CRUD) por minuto e por região
API Vertex AI Núcleos de pod TPU V3 de treinamento de imagens restritos por região

Ativar o ajustador de cotas

Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para ativar o ajustador de cotas no projeto usando o console do Google Cloud , selecione a guia apropriada e siga as instruções:

Console

Para ativar o ajustador de cotas no projeto do Google Cloud usando o console do Google Cloud , siga estas etapas:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acessar Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar.

Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso de recursos e emitir solicitações de ajuste de cota quando esse uso se aproximar do limite.

REST

  1. Para ativar o ajustador de cotas no projeto do Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajustador de cotas e defina o campo enablement como ENABLED. Também é possível especificar uma ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID ou número do projeto em que você quer ativar o ajustador de cotas.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.

    Isso atualiza o status de ativação para enabled.

gcloud

Para ativar o ajustador de cotas no projeto do Google Cloud usando a gcloud CLI (pré-lançamento), siga estas etapas:

  1. Faça a autenticação usando a gcloud CLI:

    gcloud auth login
    
  2. Ative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID ou número do projeto em que você quer ativar o ajustador de cotas.

  3. Verifique o status de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Se você tiver as permissões necessárias, o status será retornado como enabled.

Conferir solicitações de ajuste de cota

Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas, faça o seguinte:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acessar Cotas e limites do sistema

  2. Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
  3. Clique no campo Filtro.
  4. Selecione Tipo no menu e digite Auto. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.

Configurar alertas do ajustador de cotas

Para receber alertas do ajustador de cotas, faça o seguinte:

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acessar Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique em Criar alerta.
  4. Selecione um dos modelos de alerta ou ambos:
    1. A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste de cotas para o projeto.
    2. A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue.
  5. Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
  6. Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
  7. Clique em Criar.

Editar ou excluir alertas do ajustador de cotas

É possível editar ou excluir os alertas do ajustador de cotas no console doGoogle Cloud :

  1. Acesse a página Políticas no console do Cloud Monitoring.

    Acessar Políticas

  2. Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Na linha que mostra a política de alertas do ajustador de cotas, clique em Ver mais.

  4. Clique em Editar ou em Excluir.

Desativar o ajustador de cotas

Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para desativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:

Console

  1. No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:

    Acessar Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar. O botão fica cinza.

Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.

REST

  1. Para desativar o ajustador de cotas no projeto do Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajustador de cotas e defina o campo enablement como DISABLED. Também é possível especificar uma ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID ou número do projeto em que você quer desativar o ajustador de cotas.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cotas.

    Isso atualiza o status de ativação para disabled.

gcloud

Para desativar o ajustador de cotas no projeto do Google Cloud usando a gcloud CLI (pré-lançamento), siga estas etapas:

  1. Autentique-se na gcloud CLI:

    gcloud auth login
    
  2. Desative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID ou número do projeto em que você quer desativar o ajustador de cotas.

  3. Verifique o estado de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Se você tiver as permissões necessárias, o status será retornado como disabled.

Resolver problemas de negação do aumento de cota

É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando o Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região além de um determinado valor. Nesses casos, ainda é possível solicitar um aumento manual de cota.

Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador for negada, configure os alertas do ajustador de cotas.