Outil d'ajustement de quota

Ce document explique comment ajuster les quotas à l'aide du système d'ajustement des quotas.

L'outil d'ajustement des quotas observe votre consommation de ressources et envoie de manière proactive des demandes d'ajustement de quota en votre nom. La surveillance de votre utilisation des ressources et l'envoi proactif de demandes d'ajustement de quota permettent d'éviter les pannes causées par l'atteinte de la valeur de votre quota. L'outil d'ajustement de quota vous permet de ne pas avoir à surveiller les augmentations non planifiées de votre utilisation des ressources et de réduire le nombre de demandes manuelles d'ajustement de quota.

Fonctionnement de l'outil d'ajustement de quota

Lorsque vous activez l'outil d'ajustement de quota, il surveille tous les quotas applicables et applique la logique suivante :

  • L'outil d'ajustement de quota vérifie si l'utilisation maximale s'est approchée de la valeur de quota pendant une durée spécifiée.
  • Si tel est le cas, l'outil d'ajustement de quota tente d'augmenter la valeur de quota (généralement d'environ 10 à 20 %).

S'il est possible d'augmenter la valeur de quota, l'augmentation est approuvée et la valeur est ajustée. Vous pouvez toujours demander à tout moment d'augmenter les valeurs de quota, que l'outil d'ajustement de quota soit activé ou non.

L'outil d'ajustement des quotas n'envoie des demandes d'ajustement de quota que pour augmenter la valeur d'un quota. Il ne tente pas de réduire la valeur. Pour les quotas qui ont une limite de quota manuelle, l'outil d'ajustement de quota n'envoie pas de demandes d'ajustement de quota.

Vous pouvez consulter les demandes effectuées par l'outil d'ajustement de quota sur la page "Quotas et limites du système" de la consoleGoogle Cloud . Vous pouvez également configurer des alertes pour surveiller les modifications apportées par l'outil d'ajustement de quota.

Limites

L'outil d'ajustement de quota présente les limites suivantes :

  • Les paramètres de l'outil d'ajustement de quota ne sont disponibles que pour chaque projet.
  • Les paramètres de l'outil d'ajustement des quotas ne sont accessibles que depuis la consoleGoogle Cloud .
  • L'outil d'ajustement des quotas n'est pas disponible pour tous les quotas. Pour en savoir plus, consultez la section Disponibilité de ce document.

Disponibilité

La disponibilité de l'outil d'ajustement de quota dépend de votre projet Google Cloud et n'est disponible que pour certains quotas Google Cloud .

Éligibilité basée sur l'historique d'utilisation

L'outil d'ajustement de quota nécessite un volume suffisant de données d'historique d'utilisation afin de déterminer précisément quand demander un quota supplémentaire. Pour cette raison, l'option d'activation de l'outil d'ajustement de quota n'est disponible que pour les projets dont l'activité historique est suffisante pour permettre des prédictions précises.

Quotas acceptés

L'outil d'ajustement des quotas n'est pas disponible pour tous les quotasGoogle Cloud . Un service A Google Cloud peut être compatible avec l'ajusteur de quota pour tout ou partie de ses quotas, ou pour aucun d'entre eux. Si vous activez l'outil d'ajustement de quota sur votre projet, il s'applique à tous les quotas compatibles.

Lorsqu'un service Google Cloud ajoute ou étend la prise en charge de l'outil d'ajustement de quota pour ses quotas, l'outil d'ajustement de quota surveille et ajuste automatiquement ces nouveaux quotas compatibles pour votre projet. Cela se produit même si ces quotas spécifiques n'étaient pas pris en charge lorsque vous avez activé l'ajusteur de quota.

Le tableau suivant répertorie les quotas compatibles avec l'outil d'ajustement des quotas.

Service Quotas
API Artifact Registry Requêtes par projet dans la multirégion Asie par minute
API Artifact Registry Requêtes par projet dans la multirégion Europe par minute
API Artifact Registry Requêtes par projet dans la multirégion des États-Unis par minute
API Artifact Registry Requêtes par projet et par région, par minute et par région
API Cloud Build Requêtes GET de compilation et d'opération par minute
API Cloud Build Requêtes GET de compilation et d'opération par minute et par utilisateur
API Cloud Build Processeurs de compilation simultanée (pool régional par défaut)
API Cloud Build Compilations simultanées (pool par défaut non régional)
API Cloud Key Management Service Requêtes de chiffrement par minute
API Cloud Key Management Service Requêtes de lecture par minute
API Cloud Key Management Service Requêtes d'écriture par minute
API Cloud Logging Octets d'écriture de journaux par minute et par région
API Cloud Resource Manager Requêtes de lecture par minute
API Cloud Run Admin Requêtes d'exécution de job par minute et par région
API Cloud Run Admin Requêtes de lecture par minute et par région
API Cloud Run Admin Allocation totale de processeurs, en millièmes de vCPU, par projet et par région
API Cloud Run Admin Requêtes d'écriture par minute et par région
API Cloud Trace Requêtes d'écriture (gratuites) par minute
API Compute Engine Groupes d'affinité
API Compute Engine Buckets backend
API Compute Engine Processeurs C2
API Compute Engine Processeurs C2D
API Compute Engine Processeurs C3
API Compute Engine Engagements
API Compute Engine Processeurs A2 faisant l'objet d'un engagement
API Compute Engine Processeurs faisant l'objet d'un engagement
API Compute Engine Licences souscrites
API Compute Engine Espace réservé du disque SSD local avec engagement (Go)
API Compute Engine Processeurs M3 avec engagement
API Compute Engine Processeurs à mémoire optimisée avec engagement
API Compute Engine Processeurs N2 avec engagement
API Compute Engine Processeurs N2D avec engagement
API Compute Engine Processeurs T2D faisant l'objet d'un engagement
API Compute Engine Processeurs
API Compute Engine Processeurs par famille de VM
API Compute Engine Projets de service de mise en réseau inter-projets
API Compute Engine Routes statiques personnalisées par réseau VPC
API Compute Engine Services de backend pour les équilibreurs de charge réseau passthrough externes
API Compute Engine Règles de transfert pour l'équilibreur de charge réseau passthrough externe
API Compute Engine Règles de transfert de protocole externe
API Compute Engine Règles de pare-feu
API Compute Engine Règles de transfert
API Compute Engine Services de backend gérés externes globaux
API Compute Engine Règles de transfert gérées externes globales
API Compute Engine Services de backend d'équilibreur de charge proxy externes globaux
API Compute Engine Services de backend Traffic Director internes globaux
API Compute Engine Nombre de GPU par famille de GPU
API Compute Engine GPU (toutes les régions)
API Compute Engine Vérifications d'état
API Compute Engine Images
API Compute Engine Adresses IP en cours d'utilisation
API Compute Engine Adresses IPv4 externes régionales en cours d'utilisation
API Compute Engine Programmations d'instantanés en cours d'utilisation
API Compute Engine Groupes d'instances
API Compute Engine Modèles d'instances
API Compute Engine Instances par groupe d'appairage
API Compute Engine Instances par réseau VPC
API Compute Engine Adresses IP internes
API Compute Engine Services de backend pour les équilibreurs de charge réseau passthrough internes
API Compute Engine Règles de transfert pour les équilibreurs de charge réseau passthrough internes, applicables par groupe d'appairage
API Compute Engine Règles de transfert par réseau VPC pour l'équilibreur de charge réseau passthrough interne
API Compute Engine Alias d'adresses IP par groupe d'appairage
API Compute Engine Alias d'adresses IP par réseau VPC
API Compute Engine Disque SSD local par famille de VM (Go)
API Compute Engine Processeurs M1
API Compute Engine Processeurs M2
API Compute Engine Processeurs M3
API Compute Engine Groupes d'instances gérés
API Compute Engine Processeurs N2
API Compute Engine Processeurs N2D
API Compute Engine Groupes de points de terminaison du réseau
API Compute Engine Stratégies de pare-feu réseau
API Compute Engine Attributs des règles de stratégie de sécurité de l'équilibrage de charge réseau
API Compute Engine Règles de sécurité pour l'équilibrage de charge réseau
API Compute Engine Réseaux
API Compute Engine Processeurs NVIDIA A2
API Compute Engine Appairages par réseau VPC
API Compute Engine IOPS Persistent Disk
API Compute Engine Disque persistant SSD (Go)
API Compute Engine Disque persistant standard (Go)
API Compute Engine Processeurs préemptifs
API Compute Engine SSD local préemptif (Go)
API Compute Engine GPU NVIDIA A100 80 Go préemptifs
API Compute Engine GPU NVIDIA A100 préemptifs
API Compute Engine GPU NVIDIA H100 préemptifs
API Compute Engine GPU NVIDIA H100 MEGA préemptifs
API Compute Engine GPU NVIDIA K80 préemptifs
API Compute Engine GPU NVIDIA L4 préemptifs
API Compute Engine GPU de poste de travail virtuel NVIDIA L4 préemptifs
API Compute Engine GPU NVIDIA P100 préemptifs
API Compute Engine GPU de poste de travail virtuel NVIDIA P100 préemptifs
API Compute Engine GPU NVIDIA P4 préemptifs
API Compute Engine GPU de poste de travail virtuel NVIDIA P4 préemptifs
API Compute Engine GPU NVIDIA T4 préemptifs
API Compute Engine GPU de poste de travail virtuel NVIDIA T4 préemptifs
API Compute Engine GPU NVIDIA V100 préemptifs
API Compute Engine Préfixes annoncés publics
API Compute Engine Services de backend gérés externes régionaux
API Compute Engine Règles de transfert gérées externes régionales par région et par réseau VPC
API Compute Engine Modèles d'instances régionaux
API Compute Engine Services de backend gérés internes régionaux
API Compute Engine Services de backend Traffic Director internes régionaux
API Compute Engine Groupes d'instances gérés régionaux
API Compute Engine Règles de sécurité régionales
API Compute Engine Règles de stratégie de sécurité régionales avec une condition de correspondance avancée
API Compute Engine Proxys TCP cibles régionaux
API Compute Engine Routeurs
API Compute Engine Routes
API Compute Engine Règles de sécurité
API Compute Engine Règles relatives aux règles de sécurité
API Compute Engine Règles de langage des règles de stratégie de sécurité
API Compute Engine Instantanés
API Compute Engine Certificats SSL
API Compute Engine Adresses IP BYOIP statiques
API Compute Engine Adresses IP statiques
API Compute Engine Plages de sous-réseaux par groupe d'appairage
API Compute Engine Plages de sous-réseaux par réseau VPC
API Compute Engine Processeurs T2A
API Compute Engine Processeurs T2D
API Compute Engine Proxys HTTP cibles
API Compute Engine Proxys HTTPS cibles
API Compute Engine Proxys SSL cibles
API Compute Engine Proxys TCP cibles
API Compute Engine Passerelles VPN cibles
API Compute Engine Espace total réservé du disque SSD local (Go)
API Compute Engine Mappages d'URL
API Compute Engine Instances de VM
API Compute Engine Passerelles VPN
API Compute Engine Tunnels VPN
API Connect Gateway Requêtes de connexion à la passerelle par minute
API Dialogflow Toutes les autres requêtes par minute
API Filestore Sauvegardes par région
API Filestore Capacité HDD de base (Standard) (Go) par région
API Filestore Capacité (Go) des SSD de base (Premium) par région
API Filestore Capacité zonale et régionale de 1 à 10 Tio (Enterprise) (Go) par région
API Filestore Capacité (Go) par région pour les instances zonales et régionales de 10 à 100 Tio (grande échelle)
Google Cloud API Memorystore pour Redis Capacité Redis totale (Go) par région
Google Cloud API Memorystore pour Redis Nombre total d'unités Redis Cluster par projet et par région
API Memorystore Nombre total d'unités Memorystore par projet et par région
API Vertex AI Processeurs de diffusion de modèles personnalisés par région
API Vertex AI GPU Nvidia T4 pour la diffusion de modèles personnalisés par région
API Vertex AI GPU Nvidia T4 pour l'entraînement de modèles personnalisés par région
API Vertex AI Requêtes de génération de contenu par minute, par projet et par modèle de base
API Vertex AI

Requêtes de prédiction en ligne régionales par minute, par projet et par modèle de base

Remarque : Pour afficher la liste complète des dimensions disponibles, développez cette entrée dans la console Google Cloud .

API Vertex AI Requêtes de gestion des ressources (CRUD) par minute et par région
API Vertex AI Cœurs de pods TPU V3 d'entraînement d'image restreint par région

Activer l'outil d'ajustement de quota

Pour activer l'outil d'ajustement de quota, vous devez disposer des autorisations IAM suivantes :

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Pour activer l'outil d'ajustement de quota sur votre projet de console Google Cloud , sélectionnez l'onglet approprié et suivez les instructions :

Console

Pour activer l'outil d'ajustement de quota sur votre Google Cloud projet à partir de la console Google Cloud , procédez comme suit :

  1. Dans la console Google Cloud , accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

  2. Cliquez sur l'onglet Configurations.
  3. Cliquez sur le bouton Activer.

Lorsque la colonne État indique Activé, l'outil d'ajustement de quota surveille votre utilisation et envoie des demandes d'ajustement de quota lorsque l'utilisation de la ressource approche de sa valeur de quota.

REST

  1. Pour activer l'outil d'ajustement de quota sur votre projet Google Cloud à l'aide de l'API REST (preview), envoyez une requête HTTP pour mettre à jour les paramètres de l'outil d'ajustement de quota :

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Dans le corps de la requête, spécifiez la ressource des paramètres de l'ajusteur de quota et définissez le champ enablement sur ENABLED. Vous pouvez également spécifier une ETag, mais cela est facultatif :

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Remplacez les éléments suivants :

    • PROJECT_ID_OR_NUMBER : ID ou numéro du projet pour lequel vous souhaitez activer l'ajusteur de quota.
    • OPTIONAL_ETAG : chaîne ETag facultative pour les paramètres de l'ajusteur de quota.

    L'état d'activation passe alors à enabled.

gcloud

Pour activer l'outil d'ajustement de quota sur votre projet Google Cloud à l'aide de la gcloud CLI (aperçu), procédez comme suit :

  1. Authentifiez-vous à l'aide de gcloud CLI :

    gcloud auth login
    
  2. Activez les paramètres de l'outil d'ajustement de quota :

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Remplacez PROJECT_ID_OR_NUMBER par l'ID ou le numéro du projet pour lequel vous souhaitez activer l'outil d'ajustement des quotas.

  3. Vérifiez l'état d'activation :

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Tant que vous disposez des autorisations requises, l'état renvoyé est enabled.

Afficher les demandes d'ajustement de quota

Pour afficher les demandes d'augmentation de quota, vous devez disposer des autorisations IAM suivantes :

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Pour afficher les demandes d'ajustement de quota émises par l'outil d'ajustement de quota :

  1. Dans la console Google Cloud , accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

  2. Cliquez sur l'onglet Augmenter les demandes. La vue Augmenter les demandes affiche les demandes d'augmentation pour votre projet, y compris les augmentations demandées manuellement et les demandes émises par l'outil d'ajustement de quota.
  3. Cliquez sur le champ Filtre.
  4. Sélectionnez Type dans le menu, puis saisissez Auto. Ce filtre permet d'afficher les demandes effectuées par l'outil d'ajustement de quota.

Configurer des alertes de l'outil d'ajustement de quota

Pour recevoir des alertes de l'outil d'ajustement de quota :

  1. Dans la console Google Cloud , accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

  2. Cliquez sur l'onglet Configurations.
  3. Cliquez sur Créer l'alerte.
  4. Choisissez l'un des modèles d'alerte, ou les deux :
    1. L'option Tous les ajustements de l'outil d'ajustement de quota envoie une alerte chaque fois que l'outil d'ajustement de quota émet une demande d'ajustement de quota pour le projet.
    2. L'option Erreurs et échecs de l'outil d'ajustement de quota n'envoie des alertes que lorsque l'outil d'ajustement de quota tente d'augmenter une valeur de quota et qu'il ne peut pas le faire.
  5. Facultatif : Ajustez les valeurs par défaut pour la durée minimale entre les alertes et la durée de la fermeture automatique de l'incident en cliquant sur Afficher les options.
  6. Sélectionnez le canal de notification pour recevoir les alertes. Pour ajuster les paramètres de votre canal de notification ou en créer un, cliquez sur Gérer les canaux de notification.
  7. Cliquez sur Créer.

Modifier ou supprimer des alertes de l'outil d'ajustement de quota

Vous pouvez modifier ou supprimer les alertes de l'outil d'ajustement des quotas dans la consoleGoogle Cloud  :

  1. Accédez à la page Règles dans la console Cloud Monitoring.

    Accéder à la page "Règles"

  2. Recherchez votre règle d'alerte de l'outil d'ajustement de quota. Ces règles d'alerte portent les noms suivants :

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Dans la ligne affichant votre règle d'alerte de l'outil d'ajustement de quota, cliquez sur Afficher plus.

  4. Cliquez sur Modifier ou sur Supprimer.

Désactiver l'outil d'ajustement de quota

Pour désactiver l'outil d'ajustement de quota, vous devez disposer des autorisations IAM suivantes :

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Pour désactiver l'outil d'ajustement de quota sur votre projet de console Google Cloud , sélectionnez l'onglet approprié et suivez les instructions :

Console

  1. Dans la console Google Cloud , accédez à la page IAM et administration > Quotas et limites du système :

    Accéder à la page Quotas et limites du système

  2. Cliquez sur l'onglet Configurations.
  3. Cliquez sur le bouton Activer. Le bouton bascule devient gris.

Lorsque le bouton est gris et que la colonne d'état indique Non activé, l'outil d'ajustement de quota ne surveille plus votre utilisation ni n'émet de demandes d'ajustement de quota.

REST

  1. Pour désactiver l'outil d'ajustement de quota dans votre projet Google Cloud à l'aide de l'API REST (preview), envoyez une requête HTTP pour mettre à jour les paramètres de l'outil d'ajustement de quota :

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Dans le corps de la requête, spécifiez la ressource des paramètres de l'ajusteur de quota et définissez le champ enablement sur DISABLED. Vous pouvez également spécifier une ETag, mais cela est facultatif :

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Remplacez les éléments suivants :

    • PROJECT_ID_OR_NUMBER : ID ou numéro du projet pour lequel vous souhaitez désactiver l'ajusteur de quota.
    • OPTIONAL_ETAG : chaîne ETag facultative pour les paramètres de l'ajusteur de quota.

    L'état d'activation passe alors à disabled.

gcloud

Pour désactiver l'outil d'ajustement de quota sur votre projet Google Cloud à l'aide de la gcloud CLI (version Preview), procédez comme suit :

  1. Authentifiez-vous sur la gcloud CLI :

    gcloud auth login
    
  2. Désactivez les paramètres de l'outil d'ajustement de quota :

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Remplacez PROJECT_ID_OR_NUMBER par l'ID ou le numéro du projet pour lequel vous souhaitez désactiver l'ajusteur de quota.

  3. Vérifiez l'état d'activation :

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Tant que vous disposez des autorisations requises, l'état renvoyé est disabled.

Résoudre les problèmes d'augmentation de quota

Il est possible qu'une augmentation de quota initiée par l'outil d'ajustement de quota soit refusée. Cela se produit parfois lorsque Google Cloud ne peut pas augmenter la valeur de quota pour un projet, une ressource ou une région spécifique. Vous pouvez toujours demander une augmentation manuelle du quota dans ces scénarios.

Pour recevoir des notifications lorsqu'une demande d'ajustement de quota effectuée par l'outil d'ajustement de quota est refusée, configurez des alertes de l'outil d'ajustement de quota.