Ajustador de cotas

Esta página descreve como ajustar cotas usando o sistema do ajustador de cotas.

O ajustador de cotas observa o consumo de recursos e envia solicitações de ajuste de cota em seu nome. Monitorar o uso de recursos e enviar solicitações de ajuste de cota de modo proativo ajuda a evitar interrupções causadas ao atingir o limite da cota. Com o ajustador de cotas, você se preocupa menos em monitorar aumentos não planejados no uso de recursos e envia menos solicitações manuais para ajustes de cota.

Como o ajustador de cotas funciona

Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e aplica a seguinte lógica:

  • O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
  • Nesse caso, ele tenta aumentar o limite de cota, em geral, em torno de 10 a 20%.

Se for possível aumentar o valor da cota, o aumento será aprovado e o valor será ajustado. Você sempre pode solicitar manualmente aumentos para o limite de cota, independentemente da ativação do ajustador de cotas.

O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual de cota, o ajustador não envia solicitações de ajuste.

É possível visualizar as solicitações feitas pelo ajustador de cota na página "Cotas e limites do sistema" do console do Google Cloud. Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador de cotas.

Limitações

O ajustador de cotas tem as seguintes limitações:

  • As configurações do ajustador de cotas estão disponíveis apenas por projeto.
  • As configurações do ajustador de cota só podem ser acessadas no console do Google Cloud.

Disponibilidade

O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar cota extra. Por esse motivo, a opção de ativar o ajustador de cotas está disponível apenas em projetos com atividade histórica suficiente para permitir previsões exatas.

Para conferir a lista de cotas qualificadas para ajuste pelo ajustador de cotas, siga estas etapas:

  1. No console do Google Cloud, acesse a página IAM e administrador > Cuotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações para acessar a lista.

    Confira a tabela a seguir:

    Serviço Cotas
    API Artifact Registry Solicitações por minuto e projeto na multirregião da Ásia
    API Artifact Registry Solicitações por minuto e projeto na multirregião da Europa
    API Artifact Registry Solicitações por minuto por projeto na multirregião dos EUA
    API Artifact Registry Solicitações por projeto, por região e por minuto
    API Cloud Build Solicitações de recebimento de build e operação por minuto
    API Cloud Build Solicitações GET de build e operação por minuto por usuário
    API Cloud Build CPUs de build simultâneas (pool regional padrão)
    API Cloud Build Builds simultâneos (pool padrão não regional)
    API Filestore Backups por região
    API Filestore Capacidade de HDD básico (padrão) (GB) por região
    API Filestore Capacidade de SSD básico (Premium) (GB) por região
    API Filestore Capacidade zonal e regional de 1 a 10 TiB (empresa) (GB) por região
    API Filestore Capacidade (GB) de 10 a 100 TiB (escala alta) por região
    Cloud Key Management Service API Solicitações criptográficas por minuto
    Cloud Key Management Service API Solicitações de leitura por minuto
    Cloud Key Management Service API Solicitações de gravação por minuto
    API Cloud Logging Bytes de gravação de registro por minuto e região
    API Cloud Resource Manager Solicitações de leitura por minuto
    API Cloud Run Admin Solicitações de execução de jobs por minuto e por região
    API Cloud Run Admin Solicitações de leitura por minuto por região
    API Cloud Run Admin Alocação total de CPU, em mili vCPU, por projeto e região
    API Cloud Run Admin Solicitações de gravação por minuto por região
    API Cloud Trace Solicitações de gravação (gratuitas) por minuto
    API Compute Engine Buckets de back-end
    API Compute Engine CPUs C2
    API Compute Engine CPUs C2D
    API Compute Engine CPUs C3
    API Compute Engine CPUs
    API Compute Engine CPUs por família de VMs
    API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem externa
    API Compute Engine Serviços de back-end gerenciados externos globais
    API Compute Engine Serviços de back-end de balanceador de carga de proxy externo global
    API Compute Engine Serviços de back-end do Traffic Director interno global
    API Compute Engine Verificações de integridade
    API Compute Engine Endereços IPv4 externos regionais em uso
    API Compute Engine Instâncias por rede VPC
    API Compute Engine Serviços de back-end do balanceador de carga de rede de passagem interna
    API Compute Engine Alias de IP por rede VPC
    API Compute Engine CPUs N2
    API Compute Engine CPUs N2D
    API Compute Engine Redes
    API Compute Engine Persistent disk SSD (GB)
    API Compute Engine disco permanente padrão (GB)
    API Compute Engine GPUs NVIDIA A100 de 80 GB preemptivas
    API Compute Engine GPUs NVIDIA A100 preemptivas
    API Compute Engine GPUs NVIDIA H100 preemptivas
    API Compute Engine GPUs NVIDIA H100 MEGA preemptivas
    API Compute Engine GPUs NVIDIA K80 preemptivas
    API Compute Engine GPUs NVIDIA L4 preemptivas
    API Compute Engine GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA P100 preemptivas
    API Compute Engine GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA P4 preemptivas
    API Compute Engine GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA T4 preemptivas
    API Compute Engine GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais
    API Compute Engine GPUs NVIDIA V100 preemptivas
    API Compute Engine Serviços de back-end gerenciados externos regionais
    API Compute Engine Serviços de back-end gerenciados internos regionais
    API Compute Engine Serviços de back-end do Traffic Director interno regional
    API Connect Gateway Solicitações de conexão do gateway por minuto
    API Dialogflow Todas as outras solicitações por minuto
    Google Cloud API Memorystore para Redis Capacidade total do Redis (GB) por região
    Google Cloud API Memorystore para Redis Total de unidades do cluster do Redis por projeto e região
    API Memorystore Total de unidades do Memorystore por projeto e região
    API Vertex AI CPUs de veiculação de modelos personalizados por região
    API Vertex AI Modelo personalizado que atende GPUs Nvidia T4 por região
    API Vertex AI GPUs Nvidia T4 de treinamento personalizado do modelo por região
    API Vertex AI Gerar solicitações de conteúdo por minuto, por projeto, por modelo base, por minuto, por região e por base_model
    API Vertex AI

    Solicitações de previsão on-line regionais por modelo base, por minuto, por região e por base_model

    Observação: para conferir a lista completa de dimensões disponíveis, abra esta entrada no console do Google Cloud.

    API Vertex AI Solicitações (CRUD) de gerenciamento de recursos por minuto e região
    API Vertex AI Núcleos do pod da TPU V3 de treinamento de imagens restritos por região

Ativar o ajustador de cotas

Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para ativar o ajustador de cotas no projeto do console do Google Cloud, selecione a guia apropriada e siga as instruções:

Console

Para ativar o ajustador de cotas no projeto Google Cloud no console do Google Cloud, siga estas etapas:

  1. No console do Google Cloud, acesse a página IAM e administrador > Cuotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar.

Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar o uso de recursos e emitir solicitações de ajuste de cota quando o uso se aproximar do limite da cota.

REST

  1. Para ativar o ajustador de cotas no projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajustador de cota e defina o campo enablement como ENABLED. Também é possível especificar um ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID ou número do projeto em que você quer ativar o ajustador de cota.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cota.

    Isso atualiza o status de ativação para enabled.

gcloud

Para ativar o ajustador de cotas no projeto Google Cloud usando a CLI gcloud (pré-lançamento), siga estas etapas:

  1. Faça a autenticação usando a CLI gcloud:

    gcloud auth login
    
  2. Ative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID ou número do projeto que você quer ativar o ajustador de cota.

  3. Verifique o status de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Se você tiver as permissões necessárias, o status será retornado como enabled.

Conferir solicitações de ajuste de cota

Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas:

  1. No console do Google Cloud, acesse a página IAM e administrador > Cuotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
  3. Clique no campo Filtro.
  4. Selecione Tipo no menu e digite Auto. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.

Configurar alertas do ajustador de cotas

Para receber alertas do ajustador de cotas:

  1. No console do Google Cloud, acesse a página IAM e administrador > Cuotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique em Criar alerta.
  4. Selecione um dos modelos de alerta ou ambos:
    1. A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste para o projeto.
    2. A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue fazer isso.
  5. Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
  6. Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
  7. Clique em Criar.

Editar ou excluir alertas do ajustador de cotas

É possível editar ou excluir os alertas do ajustador de cotas no console do Google Cloud:

  1. Acesse a página Políticas no console do Cloud Monitoring.

    Acessar as políticas

  2. Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Na linha que mostra a política de alertas do ajustador de cotas, clique em Ver mais.

  4. Clique em Editar ou Excluir.

Desativar o ajustador de cotas

Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Para desativar o ajustador de cotas no projeto do console do Google Cloud, selecione a guia apropriada e siga as instruções:

Console

  1. No console do Google Cloud, acesse a página IAM e administrador > Cuotas e limites do sistema:

    Acesse "Cotas e limites do sistema

  2. Clique na guia Configurações.
  3. Clique no botão para Ativar. O botão fica cinza.

Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.

REST

  1. Para desativar o ajustador de cotas no projeto Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador de cotas:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. No corpo da solicitação, especifique o recurso de configurações do ajustador de cota e defina o campo enablement como DISABLED. Também é possível especificar um ETag, mas isso é opcional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Substitua:

    • PROJECT_ID_OR_NUMBER: o ID ou número do projeto em que você quer desativar o ajustador de cota.
    • OPTIONAL_ETAG: uma string ETag opcional para as configurações do ajustador de cota.

    Isso atualiza o status de ativação para disabled.

gcloud

Para desativar o ajustador de cotas no projeto Google Cloud usando a CLI gcloud (pré-lançamento), siga estas etapas:

  1. Faça a autenticação na gcloud CLI:

    gcloud auth login
    
  2. Desative as configurações do ajustador de cotas:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Substitua PROJECT_ID_OR_NUMBER pelo ID ou número do projeto que você quer desativar o ajustador de cota.

  3. Verifique o estado de ativação:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Se você tiver as permissões necessárias, o status será retornado como disabled.

Solução de problemas que negam aumento de cota

É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando o Google Cloud não consegue aumentar a cota de um projeto, recurso ou região específica além de um determinado valor. Nesses casos, ainda é possível solicitar um aumento de cota manual.

Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador é negada, configure alertas do ajustador de cotas.