Cette page a été traduite par l'API Cloud Translation.

Quotas de débit de Compute Engine

Ce document liste les quotas de débit de Compute Engine, qui définissent le nombre de requêtes que vous pouvez envoyer aux méthodes de l'API Compute Engine.

Les quotas de débit

Les quotas de débit (également appelés limites de débit des API ou quotas d'API) définissent le nombre de requêtes pouvant être envoyées à l'API Compute Engine. Ces quotas s'appliquent par projet. Chaque quota s'applique à un groupe d'une ou plusieurs méthodes de l'API Compute Engine. Lorsque vous utilisez la gcloud CLI ou la console Google Cloud , vous envoyez également des requêtes à l'API. Ces requêtes sont comptabilisées dans votre quota de débit. Si vous utilisez des comptes de service pour accéder à l'API, ils sont également pris en compte dans votre quota de débit.

Google applique des quotas de débit en respectant un intervalle d'une minute (60 secondes) pour chaque groupe. Cela signifie que si votre projet atteint le nombre maximal de requêtes API au cours d'un délai de 60 secondes, vous devez attendre que le quota de débit soit réinitialisé avant d'effectuer d'autres requêtes dans ce groupe. Si votre projet dépasse un quota de débit, vous recevez une erreur 403 associée au motif suivant : rateLimitExceeded. Pour résoudre cette erreur, attendez une minute, puis relancez votre requête. Le quota devrait être réinitialisé au début de l'intervalle suivant.

Le nombre de requêtes que vous pouvez envoyer à l'API Compute Engine est défini par des quotas d'API, comme décrit dans les tableaux suivants. Chaque groupe est comptabilisé séparément, ce qui vous permet d'atteindre simultanément le quota maximal dans chaque groupe.

Quotas de débit pour les méthodes globales

Les sections suivantes listent les quotas qui définissent le nombre de requêtes que vous pouvez envoyer aux méthodes de l'API Compute Engine globale.

Quotas d'API simplifiés pour les méthodes globales

Pour améliorer la visibilité et la gestion des quotas de l'API Compute Engine,Google Cloud a réduit le nombre de métriques de quota en les regroupant dans moins de quotas. Ces métriques de quota simplifiées offrent également des limites plus élevées pour chaque quota.

Pour obtenir la liste complète des méthodes globales et des métriques de quota qui suivent le coût de chaque méthode, consultez la documentation de référence sur les métriques de quota de l'API Compute Engine.

Le tableau suivant répertorie toutes les métriques de quota d'API simplifiées pour l'API Compute Engine:

Quota Description du quota	Nom de la métrique
Requêtes de lecture par minute (`GlobalReadsPerMinutePerProject`) Quota pour les méthodes `get` et `list` globales.	`compute.googleapis.com/global_reads`
Requêtes d'écriture par minute (`GlobalWritesPerMinutePerProject`) Quota pour les méthodes d'écriture globales qui ne sont pas incluses dans d'autres métriques de quota.	`compute.googleapis.com/global_writes`
Requêtes utilisables par minute (`GlobalListUsablePerMinutePerProject`) Quota pour les méthodes `ListUsable` globales.	`compute.googleapis.com/list_usable_requests`
Requêtes d'invalidation de cache par minute (`GlobalCacheInvalidationRequestsPerMinutePerProject`) Quota pour les méthodes `UrlMapsService.InvalidateCache` globales.	`compute.googleapis.com/global_cache_invalidation_requests`
Frais généraux associés aux coûts catalogue filtrés (`ListRequestsFilterCostOverheadPerMinutePerProject`) Quota pour les méthodes globales `.list` et `.aggregatedList` avec des filtres. Google Cloud facture l'utilisation du quota pour cette métrique, en plus des quotas sur la métrique `compute.googleapis.com/global_reads`. Des frais de quota vous sont facturés si plus de 10 000 ressources sont filtrées dans les requêtes de liste. L'API Compute Engine rejette les requêtes de liste si vous dépassez cette limite de quota.	`compute.googleapis.com/filtered_list_cost_overhead` Débit par projet : 750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous demandez cette limite de quota dans la console Google Cloud . Remarque:Vous ne pouvez pas demander de limite plus élevée pour ce quota. Pour éviter les problèmes de quota, optimisez vos filtres de requêtes de liste ou utilisez des filtres de liste côté client.
Requêtes par minute (`GlobalRequestsPerMinutePerProject`) Quota pour toutes les requêtes de lecture et d'écriture globales.	`compute.googleapis.com/global_requests` Remarque:Vous ne pouvez pas demander de limite plus élevée pour ce quota.

Quotas d'anciennes API pour les méthodes globales

Le tableau suivant répertorie tous les quotas de l'API Compute Engine pour les méthodes globales.

Quota Description du quota	Nom de la métrique
Requêtes par minute (`defaultPerMinutePerProject`) Quota pour les méthodes de liste et de mutation globales qui ne sont pas incluses dans d'autres métriques de quota. Les méthodes `get` suivantes utilisent également cette métrique `default` : `networkFirewallPolicies.get` `projects.getXpnHost` `projects.getXpnResources`	`compute.googleapis.com/default`
Requêtes de lecture (anciennes) (`ReadRequestsPerMinutePerProject`) Quota pour les méthodes `*.get` globales.	`compute.googleapis.com/read_requests`
Requêtes de liste (`ListRequestsPerMinutePerProject`) Quota pour les méthodes `*.list` globales.	`compute.googleapis.com/list_requests`
Requêtes de lecture d'opérations (`OperationReadRequestsPerMinutePerProject`) Quota pour la méthode `globalOperations.get`.	`compute.googleapis.com/operation_read_requests`
Requêtes de mutation de ressources globales (`GlobalResourceWriteRequestsPerMinutePerProject`) Quota pour les méthodes `images.delete`, `images.deprecate`, `images.insert`, `images.setLabels`, `snapshots.delete`, `snapshots.insert`, `snapshots.setLabels`, `machineImages.insert` et `machineImages.delete`.	`compute.googleapis.com/global_resource_write_requests`
Requêtes de mutation intensive (`HeavyWeightWriteRequestsPerMinutePerProject`) Quota pour les méthodes `patch`, `delete` et `insert` pour les ressources `interconnects`.	`compute.googleapis.com/heavy_weight_write_requests`
Requêtes de lecture intensive (`HeavyWeightReadRequestsPerMinutePerProject`) Quota pour les méthodes `*.aggregatedList`.	`compute.googleapis.com/heavy_weight_read_requests`

Les quotas suivants s'appliquent aux API globales avec des quotas par méthode:

Quota Description du quota	Nom de la métrique	Limite par défaut
Requêtes d'insertion de licence Quotas pour la méthode `licenses.insert`.	`compute.googleapis.com/license_insert_requests`	Quota par projet (`LicenseInsertRequestsPerMinutePerProject`) : 2,5 requêtes/seconde (150 requêtes/minute) Quota par jour et par projet (`LicenseInsertRequestsPerDayPerProject`) : 30 requêtes/jour
Requêtes de métadonnées d'instance communes définies au niveau du projet Quota pour la méthode `projects.setCommonInstanceMetadata`.	`compute.googleapis.com/project_set_common_instance_metadata_requests`	Quota par projet (`ProjectSetCommonInstanceMetadataRequestsPerMinutePerProject`) : 36 requêtes/minute

Quotas de débit pour les méthodes régionales et zonales

Les sections suivantes répertorient tous les quotas qui s'appliquent aux méthodes qui utilisent des métriques régionales.

Quotas d'API simplifiés pour les méthodes régionales et zonales

Le tableau suivant répertorie tous les quotas simplifiés pour les méthodes régionales et zonales de l'API Compute Engine. Pour obtenir la liste complète des méthodes régionales et zonales, ainsi que les métriques de quota qui suivent l'utilisation de chaque méthode, consultez la documentation de référence sur les métriques de quota de l'API Compute Engine.

Quota Description du quota	Nom de la métrique
Requêtes de lecture par minute et par région (`ReadRequestsPerMinutePerProjectPerRegion`) Quota pour les méthodes régionales et zonales "get" et "list".	`compute.googleapis.com/reads_per_region`
Requêtes d'écriture par région (`WritesPerMinutePerProjectPerRegion`) Quota pour les méthodes d'écriture régionales et zonales qui ne sont pas incluses dans d'autres métriques de quota.	`compute.googleapis.com/writes_per_region`
Liste des requêtes utilisables par région (`ListUsablePerMinutePerProjectPerRegion`) Quota pour les méthodes `ListUsable` régionales et zonales.	`compute.googleapis.com/list_usable_requests_per_region`
Frais généraux associés aux coûts catalogue filtrés par région Quota pour les méthodes régionales et zonales `.list` et `.aggregatedList` avec des filtres. Google Cloud facture l'utilisation du quota pour cette métrique, en plus des quotas sur la métrique `compute.googleapis.com/reads_per_region`. Des frais de quota vous sont facturés si plus de 10 000 ressources sont filtrées dans les requêtes de liste. L'API Compute Engine rejette les requêtes de liste si vous dépassez cette limite de quota.	`compute.googleapis.com/filtered_list_cost_overhead_per_region` Débit par projet (`ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion`) : 750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous demandez cette limite de quota dans la console Google Cloud . Remarque:Vous ne pouvez pas demander de limite plus élevée pour ce quota. Pour éviter les problèmes de quota, optimisez vos filtres de requêtes de liste ou utilisez des filtres de liste côté client.
Requêtes par minute et par région (`RequestsPerMinutePerProjectPerRegion`) Quota pour toutes les requêtes de lecture et d'écriture régionales.	`compute.googleapis.com/requests_per_region` Remarque:Vous ne pouvez pas demander de limite plus élevée pour ce quota.

Anciens quotas d'API pour les méthodes régionales

Le tableau suivant répertorie tous les quotas de l'API Compute Engine pour les méthodes régionales et zonales.

Quota Description du quota	Nom de la métrique
Requêtes (`QueriesPerMinutePerRegion`) Quota pour les méthodes régionales et zonales qui créent, modifient ou suppriment des ressources Compute Engine. Par exemple, les méthodes `instances.insert`, `disks.update` et `instances.delete`. Les méthodes `get`, `list` et `patch` suivantes utilisent également cette métrique `default_per_region` : `projects.listXpnHosts` `instances.getScreenshot` `instances.getGuestAttributes` `instances.getShieldedInstanceIdentity` `instances.getEffectiveFirewalls` `projects.listXpnHosts` `instanceGroupManagers.listManagedInstances` `instanceGroupManagers.listErrors` `instanceGroupManagers.listPerInstanceConfigs` `regionInstanceGroupManagers.listManagedInstances` `regionInstanceGroupManagers.listErrors` `regionInstanceGroupManagers.listPerInstanceConfigs` `resourcePolicies.patch`	`compute.googleapis.com/default_per_region`
Requêtes de lecture (anciennes) (`ReadRequestsPerMinutePerRegion`) Quota pour les méthodes `get` régionales et zonales telles que `autoscalers.get`, `disks.get`, `instances.get` et `machineTypes.get`.	`compute.googleapis.com/read_requests_per_region`
Requêtes de liste (`ListRequestsPerMinutePerRegion`) Quota pour les méthodes `list` régionales et zonales telles que `autoscalers.list`, `disks.list`, `instances.list` et `machineTypes.list`.	`compute.googleapis.com/list_requests_per_region`
Frais généraux associés aux coûts catalogue filtrés Quota pour les méthodes `.list` et `.aggregatedList` avec des filtres. Google Cloud facture l'utilisation du quota pour cette métrique, en plus des quotas sur les métriques `compute.googleapis.com/list_requests_per_region` et `compute.googleapis.com/heavy_weight_read_requests_per_region`. Des frais de quota vous sont facturés si plus de 10 000 ressources sont filtrées dans les requêtes de liste. L'API Compute Engine rejette les requêtes de liste si vous dépassez cette limite de quota.	`compute.googleapis.com/filtered_list_cost_overhead_per_region` Débit par projet (`ListRequestsFilterCostOverheadPerMinutePerProjectPerRegion`) : 750 000 ressources filtrées dans les requêtes de liste par région et par minute. Étant donné que le quota est facturé toutes les 10 000 ressources, vous voyez la limite de 75 (750 000/10 000) lorsque vous demandez cette limite de quota dans la console Google Cloud . Remarque:Vous ne pouvez pas demander de limite plus élevée pour ce quota. Pour éviter les problèmes de quota, optimisez vos filtres de requêtes de liste ou utilisez des filtres de liste côté client.
Requêtes de lecture d'opérations (`OperationReadRequestsPerMinutePerRegion`) Quota pour les méthodes `regionOperations.get` et `zoneOperations.get`.	`compute.googleapis.com/operation_read_requests_per_region`
Requêtes de mutation de ressources globales par région (`GlobalResourceWriteRequestsPerMinutePerProjectPerRegion`) Quota pour les méthodes `disks.createSnapshot` et `regionDisks.createSnapshot`.	`compute.googleapis.com/global_resource_write_requests_per_region`
Requêtes d'obtention de sortie du port série d'instance (`GetSerialPortOutputRequestsPerMinutePerProjectPerRegion`) Quota pour la méthode `instances.getSerialPortOutput`.	`compute.googleapis.com/get_serial_port_output_requests_per_region`
Requêtes de lecture intensive (`HeavyWeightReadRequestsPerMinutePerRegion`) Quota pour les méthodes `regionOperations.wait`, `zoneOperations.wait` et `regionNetworkFirewallPolicies.getEffectiveFirewalls`.	`compute.googleapis.com/heavy_weight_read_requests_per_region`
Requêtes de mutation intensive par région `HeavyWeightWriteRequestsPerMinutePerProjectPerRegion` Quota pour les méthodes `patch`, `delete` et `insert` pour la ressource `interconnectAttachments` et pour la méthode `networks.updatePeering`.	`compute.googleapis.com/heavy_weight_write_requests_per_region`
Requêtes de simulation d'événements de maintenance d'instance (`SimulateMaintenanceEventRequestsPerMinutePerProjectPerRegion`) Quota pour la méthode `instances.simulateMaintenanceEvent`.	`compute.googleapis.com/simulate_maintenance_event_requests_per_region`
Requêtes d'URL de provenance de liste d'instances `InstanceListReferrersRequestsPerMinutePerProjectPerRegion` Quota pour la méthode `instances.listReferrers`.	`compute.googleapis.com/instance_list_referrers_requests_per_region`
Requêtes d'écriture de point de terminaison du réseau `NetworkEndpointWriteRequestsPerMinutePerProjectPerRegion` Quota pour les méthodes `networkEndpointGroups.attachNetworkEndpoints` et `networkEndpointGroups.detachNetworkEndpoints`.	`compute.googleapis.com/network_endpoint_write_requests_per_region`
Requêtes de liste de points de terminaison du réseau (`NetworkEndpointListRequestsPerMinutePerProjectPerRegion`) Quota pour la méthode `networkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/network_endpoint_list_requests_per_region`
Requêtes d'écriture de point de terminaison du réseau régional (`RegionalNetworkEndpointWriteRequestsPerMinutePerProjectPerRegion`) Quota pour les méthodes `regionNetworkEndpointGroups.attachNetworkEndpoints` et `regionNetworkEndpointGroups.detachNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_write_requests_per_region`
Requêtes de liste de points de terminaison du réseau régional (`RegionalNetworkEndpointListRequestsPerMinutePerProjectPerRegion`) Quota pour la méthode `regionNetworkEndpointGroups.listNetworkEndpoints`.	`compute.googleapis.com/regional_network_endpoint_list_requests_per_region`

Demander une augmentation des quotas de débit

Si vous avez besoin d'un quota plus élevé pour effectuer des requêtes API, vous pouvez demander une augmentation du quota d'API à partir de la console Google Cloud . Pour obtenir des instructions, consultez Demander un ajustement de quota.

Bonnes pratiques

Suivez les bonnes pratiques de l'API Compute Engine pour maîtriser votre consommation des quotas de débit, afin de limiter les effets s'y rapportant.

Étapes suivantes

Découvrez comment surveiller l'utilisation des API.
Découvrez comment configurer des alertes de quotas.