Neste documento, descrevemos como ajustar cotas usando o sistema do ajustador de cotas.
O ajustador de cotas observa seu consumo de recursos e envia solicitações de ajuste de cota em seu nome. Ao monitorar seu uso de recursos e enviar solicitações de ajuste de cota de modo proativo, ele ajuda a evitar interrupções causadas ao atingir o limite da cota. Ao usar o ajustador de cotas, você se preocupa menos com o monitoramento de aumentos não planejados no uso de recursos e envia menos solicitações manuais de ajustes de cota.
Como o ajustador de cotas funciona
Quando você ativa o ajustador de cotas, ele monitora todas as cotas aplicáveis e adota a seguinte lógica:
- O ajustador de cotas verifica se o pico de uso se aproximou do limite de cota durante um determinado período.
- Se isso aconteceu, ele tenta aumentar o limite de cota. Em geral, esse aumento é em torno de 10 a 20%.
Quando é possível aumentar o limite da cota, o aumento é aprovado e o valor ajustado. Você sempre pode solicitar manualmente aumentos de limite de cota, independentemente da ativação do ajustador de cotas.
O ajustador de cotas só envia solicitações de ajuste de cota para aumentar o limite de uma cota. Ele não tenta diminuir esse valor. No caso de cotas com um limite manual, o ajustador não envia solicitações de ajuste.
É possível conferir as solicitações feitas pelo ajustador de cotas na página Cotas e limites do sistema no console doGoogle Cloud . Também é possível configurar alertas para monitorar as mudanças iniciada pelo ajustador.
Limitações
O ajustador de cotas tem as seguintes limitações:
- As configurações do ajustador de cotas estão disponíveis com base no projeto.
- Essas configurações só podem ser acessadas no console doGoogle Cloud .
- O ajuste de cotas não está disponível para todas as cotas. Para saber mais, consulte Disponibilidade neste documento.
Disponibilidade
A disponibilidade do ajustador de cotas depende do projeto do Google Cloud e só está disponível para algumas cotas do Google Cloud .
Qualificação com base no histórico de uso
O ajustador de cotas requer um volume suficiente de dados de uso históricos para determinar com precisão quando solicitar mais cotas. Por isso, a opção de ativar o ajustador de cotas só está disponível em projetos com um histórico de atividades suficiente para permitir previsões exatas.
Cotas aceitas
O ajustador de cotas não está disponível para todas as cotas doGoogle Cloud . Um serviço do Google Cloud pode aceitar o uso do ajustador de cotas para todas, algumas ou nenhuma das cotas. Se você ativar o ajustador de cotas em um projeto, ele será aplicado a todas as cotas aceitas.
Quando um serviço do Google Cloud adiciona ou expande o suporte ao ajustador para as próprias cotas, o ajustador monitora e ajusta automaticamente essas cotas que agora são aceitas para o projeto. Isso acontece mesmo quando essas cotas específicas não eram aceitas ao ativar inicialmente o ajustador de cotas.
A tabela a seguir lista as cotas aceitas pelo ajustador de cotas.
Serviço | Cotas |
---|---|
API Artifact Registry | Solicitações por projeto na multirregião da Ásia por minuto |
API Artifact Registry | Solicitações por projeto na multirregião da Europa por minuto |
API Artifact Registry | Solicitações por projeto na multirregião dos EUA por minuto |
API Artifact Registry | Solicitações por projeto, por região e por minuto |
API Cloud Build | Solicitações GET de build e de operação por minuto |
API Cloud Build | Solicitações GET de build e de operação por minuto e por usuário |
API Cloud Build | CPUs de builds simultâneos (pool padrão regional) |
API Cloud Build | Builds simultâneos (pool padrão não regional) |
API Cloud Key Management Service | Solicitações de criptografia por minuto |
API Cloud Key Management Service | Solicitações de leitura por minuto |
API Cloud Key Management Service | Solicitações de gravação por minuto |
API Cloud Logging | Bytes de gravação no registro por minuto e por região |
API Cloud Resource Manager | Solicitações de leitura por minuto |
API Cloud Run Admin | Solicitações de execução de jobs por minuto e por região |
API Cloud Run Admin | Solicitações de leitura por minuto e por região |
API Cloud Run Admin | Alocação total de CPUs, em mili vCPU, por projeto e por região |
API Cloud Run Admin | Solicitações de gravação por minuto e por região |
API Cloud Trace | Solicitações de gravação (sem custos) por minuto |
API Compute Engine | Grupos de afinidade |
API Compute Engine | Buckets de back-end |
API Compute Engine | CPUs C2 |
API Compute Engine | CPUs C2D |
API Compute Engine | CPUs C3 |
API Compute Engine | Compromissos |
API Compute Engine | CPUs A2 com compromisso de uso |
API Compute Engine | CPUs com compromisso de uso |
API Compute Engine | Licenças em uso |
API Compute Engine | Disco SSD local reservado com compromisso de uso (GB) |
API Compute Engine | CPUs M3 com compromisso de uso |
API Compute Engine | CPUs com otimização de memória e compromisso de uso |
API Compute Engine | CPUs N2 com compromisso de uso |
API Compute Engine | CPUs N2D com compromisso de uso |
API Compute Engine | CPUs T2D com compromisso de uso |
API Compute Engine | CPUs |
API Compute Engine | CPUs por família de VMs |
API Compute Engine | Projetos do serviço de redes entre projetos |
API Compute Engine | Rotas estáticas personalizadas por rede VPC |
API Compute Engine | Serviços de back-end do balanceador de carga de rede de passagem externo |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem externo |
API Compute Engine | Regras de encaminhamento de protocolo externo |
API Compute Engine | Regras de firewall |
API Compute Engine | Regras de encaminhamento |
API Compute Engine | Serviços de back-end gerenciados externos globais |
API Compute Engine | Regras de encaminhamento gerenciadas externas globais |
API Compute Engine | Serviços de back-end de balanceador de carga de proxy externo global |
API Compute Engine | Serviços de back-end do Traffic Director interno global |
API Compute Engine | Contagem de GPUs por família de GPUs |
API Compute Engine | GPUs (todas as regiões) |
API Compute Engine | Verificações de integridade |
API Compute Engine | Imagens |
API Compute Engine | Endereços IP em uso |
API Compute Engine | Endereços IPv4 externos regionais em uso |
API Compute Engine | Programações de snapshots em uso |
API Compute Engine | Grupos de instâncias |
API Compute Engine | Modelos de instância |
API Compute Engine | Instâncias por grupo de peering |
API Compute Engine | Instâncias por rede VPC |
API Compute Engine | Endereços IP internos |
API Compute Engine | Serviços de back-end do balanceador de carga de rede de passagem interno |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem interno por grupo de peering |
API Compute Engine | Regras de encaminhamento do balanceador de carga de rede de passagem interno por rede VPC |
API Compute Engine | Aliases de IP por grupo de peering |
API Compute Engine | Alias de IP por rede VPC |
API Compute Engine | Disco SSD local por família de VMs (GB) |
API Compute Engine | CPUs M1 |
API Compute Engine | CPUs M2 |
API Compute Engine | CPUs M3 |
API Compute Engine | Grupos gerenciados de instâncias |
API Compute Engine | CPUs N2 |
API Compute Engine | CPUs N2D |
API Compute Engine | Grupos de endpoints de rede |
API Compute Engine | Políticas de firewall de rede |
API Compute Engine | Atributos de regra da política de segurança de balanceamento de carga de rede |
API Compute Engine | Políticas de segurança de balanceamento de carga de rede |
API Compute Engine | Redes |
API Compute Engine | CPUs NVIDIA A2 |
API Compute Engine | Peerings por rede VPC |
API Compute Engine | IOPS do Persistent Disk |
API Compute Engine | SSD do Persistent Disk (GB) |
API Compute Engine | Persistent Disk padrão (GB) |
API Compute Engine | CPUs preemptivas |
API Compute Engine | SSD local preemptivo (GB) |
API Compute Engine | GPUs NVIDIA A100 preemptivas de 80 GB |
API Compute Engine | GPUs NVIDIA A100 preemptivas |
API Compute Engine | GPUs NVIDIA H100 preemptivas |
API Compute Engine | GPUs NVIDIA H100 MEGA preemptivas |
API Compute Engine | GPUs NVIDIA K80 preemptivas |
API Compute Engine | GPUs NVIDIA L4 preemptivas |
API Compute Engine | GPUs NVIDIA L4 preemptivas para estações de trabalho virtuais |
API Compute Engine | GPUs NVIDIA P100 preemptivas |
API Compute Engine | GPUs NVIDIA P100 preemptivas para estações de trabalho virtuais |
API Compute Engine | GPUs NVIDIA P4 preemptivas |
API Compute Engine | GPUs NVIDIA P4 preemptivas para estações de trabalho virtuais |
API Compute Engine | GPUs NVIDIA T4 preemptivas |
API Compute Engine | GPUs NVIDIA T4 preemptivas para estações de trabalho virtuais |
API Compute Engine | GPUs NVIDIA V100 preemptivas |
API Compute Engine | Prefixos públicos anunciados |
API Compute Engine | Serviços de back-end gerenciados externos regionais |
API Compute Engine | Regras de encaminhamento gerenciadas externas regionais por região e por rede VPC |
API Compute Engine | Modelos de instâncias regionais |
API Compute Engine | Serviços de back-end gerenciados internos regionais |
API Compute Engine | Serviços de back-end do Traffic Director interno regional |
API Compute Engine | Grupos gerenciados de instâncias regionais |
API Compute Engine | Políticas de segurança regionais |
API Compute Engine | Regras de política de segurança regional com uma condição de correspondência avançada |
API Compute Engine | Proxies TCP de destino regionais |
API Compute Engine | Roteadores |
API Compute Engine | Rotas |
API Compute Engine | Políticas de segurança |
API Compute Engine | Regras da política de segurança |
API Compute Engine | Regras de linguagem das regras da política de segurança |
API Compute Engine | Snapshots |
API Compute Engine | Certificados SSL |
API Compute Engine | Endereços IP BYOIP estáticos |
API Compute Engine | Endereços IP estáticos |
API Compute Engine | Intervalos de sub-redes por grupo de peering |
API Compute Engine | Intervalos de sub-redes por rede VPC |
API Compute Engine | CPUs T2A |
API Compute Engine | CPUs T2D |
API Compute Engine | Proxies HTTP de destino |
API Compute Engine | Proxies HTTPS de destino |
API Compute Engine | Proxies SSL de destino |
API Compute Engine | Proxies TCP de destino |
API Compute Engine | Gateways VPN de destino |
API Compute Engine | Total do disco SSD local reservado (GB) |
API Compute Engine | Mapas de URL |
API Compute Engine | Instâncias de VM |
API Compute Engine | Gateways VPN |
API Compute Engine | Túneis VPN |
API Connect Gateway | Solicitações de conexão de gateway por minuto |
API Dialogflow | Todas as outras solicitações por minuto |
API Filestore | Backups por região |
API Filestore | Capacidade do HDD básico (padrão) por região (GB) |
API Filestore | Capacidade do SSD básico (Premium) por região (GB) |
API Filestore | Capacidade zonal e regional de 1 a 10 TiB (Enterprise) por região (GB) |
API Filestore | Capacidade zonal e regional de 10 a 100 TiB (alta escala) por região (GB) |
API Memorystore for Redis doGoogle Cloud | Capacidade total do Redis por região (GB) |
API Memorystore for Redis doGoogle Cloud | Total de unidades do cluster do Redis por projeto e por região |
API Memorystore | Total de unidades do Memorystore por projeto e por região |
API Vertex AI | CPUs personalizadas de disponibilização de modelos por região |
API Vertex AI | GPUs NVIDIA T4 personalizadas de disponibilização de modelos por região |
API Vertex AI | GPUs NVIDIA T4 personalizadas de treinamento de modelos por região |
API Vertex AI | Solicitações de geração de conteúdo por minuto, por projeto e por modelo de base |
API Vertex AI | Solicitações regionais de previsão on-line por minuto, por projeto e por modelo de base Observação: para conferir a lista completa de dimensões disponíveis, expanda esta entrada no console do Google Cloud . |
API Vertex AI | Solicitações de gerenciamento de recursos (CRUD) por minuto e por região |
API Vertex AI | Núcleos de pod TPU V3 de treinamento de imagens restritos por região |
Ativar o ajustador de cotas
Para ativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para ativar o ajustador de cotas no projeto usando o console do Google Cloud , selecione a guia apropriada e siga as instruções:
Console
Para ativar o ajustador de cotas no projeto do Google Cloud usando o console do Google Cloud , siga estas etapas:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar.
Quando a coluna Status mostrar Ativado, o ajustador de cotas vai monitorar seu uso de recursos e emitir solicitações de ajuste de cota quando esse uso se aproximar do limite.
REST
Para ativar o ajustador de cotas no projeto do Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo da solicitação, especifique o recurso de configurações do ajustador de cotas e defina o campo
enablement
comoENABLED
. Também é possível especificar uma ETag, mas isso é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Substitua:
PROJECT_ID_OR_NUMBER
: o ID ou número do projeto em que você quer ativar o ajustador de cotas.OPTIONAL_ETAG
: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para
enabled
.
gcloud
Para ativar o ajustador de cotas no projeto do Google Cloud usando a gcloud CLI (pré-lançamento), siga estas etapas:
Faça a autenticação usando a gcloud CLI:
gcloud auth login
Ative as configurações do ajustador de cotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID ou número do projeto em que você quer ativar o ajustador de cotas.Verifique o status de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Se você tiver as permissões necessárias, o status será retornado como
enabled
.
Conferir solicitações de ajuste de cota
Para conferir as solicitações de ajuste de cota, você precisa das seguintes permissões do IAM:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
Para conferir as solicitações de ajuste de cota emitidas pelo ajustador de cotas, faça o seguinte:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Solicitações de aumento. A visualização Solicitações de aumento mostra as solicitações de aumento do projeto, incluindo aumentos solicitados manualmente e solicitações emitidas pelo ajustador de cotas.
- Clique no campo Filtro.
- Selecione Tipo no menu e digite
Auto
. Com isso, será possível filtrar as solicitações feitas pelo ajustador de cotas.
Configurar alertas do ajustador de cotas
Para receber alertas do ajustador de cotas, faça o seguinte:
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique em Criar alerta.
- Selecione um dos modelos de alerta ou ambos:
- A opção Todos os ajustes feitos pelo ajustador de cotas envia um alerta sempre que o ajustador emite uma solicitação de ajuste de cotas para o projeto.
- A opção Erros e falhas do ajustador de cotas envia alertas somente quando o ajustador tenta aumentar um limite de cota e não consegue.
- Opcional: clique em Mostrar opções para ajustar os valores padrão de tempo mínimo entre alertas e a duração até o encerramento automático do incidente.
- Selecione Canal de notificação para receber alertas. Para ajustar as configurações do canal de notificação ou criar um canal, clique em Gerenciar canais de notificação.
- Clique em Criar.
Editar ou excluir alertas do ajustador de cotas
É possível editar ou excluir os alertas do ajustador de cotas no console doGoogle Cloud :
Acesse a página Políticas no console do Cloud Monitoring.
Pesquise a política de alertas do ajustador de cotas. Essas políticas têm os seguintes nomes:
Quota adjuster errors and failures
All adjustments by quota adjuster
Na linha que mostra a política de alertas do ajustador de cotas, clique em
Ver mais.Clique em Editar ou em Excluir.
Desativar o ajustador de cotas
Para desativar o ajustador de cotas, é necessário ter as seguintes permissões do IAM:
cloudquotas.quotas.update
cloudquotas.quotas.get
Para desativar o ajustador de cotas no projeto do console do Google Cloud , selecione a guia apropriada e siga as instruções:
Console
- No console do Google Cloud , acesse a página IAM e administrador > Cotas e limites do sistema:
- Clique na guia Configurações.
- Clique no botão para Ativar. O botão fica cinza.
Quando o botão fica cinza e a coluna de status mostra Não ativado, o ajustador de cotas não monitora mais o uso nem emite solicitações de ajuste de cota.
REST
Para desativar o ajustador de cotas no projeto do Google Cloud usando a API REST (pré-lançamento), faça uma solicitação HTTP para atualizar as configurações do ajustador:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
No corpo da solicitação, especifique o recurso de configurações do ajustador de cotas e defina o campo
enablement
comoDISABLED
. Também é possível especificar uma ETag, mas isso é opcional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Substitua:
PROJECT_ID_OR_NUMBER
: o ID ou número do projeto em que você quer desativar o ajustador de cotas.OPTIONAL_ETAG
: uma string ETag opcional para as configurações do ajustador de cotas.
Isso atualiza o status de ativação para
disabled
.
gcloud
Para desativar o ajustador de cotas no projeto do Google Cloud usando a gcloud CLI (pré-lançamento), siga estas etapas:
Autentique-se na gcloud CLI:
gcloud auth login
Desative as configurações do ajustador de cotas:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Substitua
PROJECT_ID_OR_NUMBER
pelo ID ou número do projeto em que você quer desativar o ajustador de cotas.Verifique o estado de ativação:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Se você tiver as permissões necessárias, o status será retornado como
disabled
.
Resolver problemas de negação do aumento de cota
É possível que um aumento de cota iniciado pelo ajustador seja negado. Às vezes, isso ocorre quando o Google Cloud não consegue aumentar o limite de cota em um projeto, recurso ou região além de um determinado valor. Nesses casos, ainda é possível solicitar um aumento manual de cota.
Para receber notificações quando uma solicitação de ajuste de cota feita pelo ajustador for negada, configure os alertas do ajustador de cotas.