Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Neste documento, descrevemos as cotas de operações simultâneas do Compute Engine.
Cotas de operação simultânea
As cotas de operações simultâneas definem o número de operações
simultâneas ou em andamento que podem ocorrer a qualquer momento. Qualquer solicitação de API que cria,
modifica ou exclui um recurso do Compute Engine está sujeita a uma verificação de limite de operação
simultânea para garantir que o número total de operações em trânsito
em qualquer ponto não exceda o limite especificado para essa operação.
Erro de limite de operação simultânea excedido
Se o projeto exceder o limite de operações simultâneas para qualquer operação em trânsito, você receberá um erro 403 com o motivo rateLimitExceededs
OPERATION_TYPE: a operação global ou regional para
a qual a cota excede o limite. Para ver uma lista de operações, consulte
Grupos de cota de operações simultâneas.
O location pode ser um dos seguintes:
global: especifica que o limite foi excedido para a cota de operação global.
REGION: especifica a região onde o limite foi excedido
para a cota de operação.
Os registros detalhados de erros são retornados somente pela resposta da API. O erro na Análise de registros é semelhante ao seguinte:
O METHOD_NAME no erro representa
o método de API em que o limite de taxa foi excedido. Por exemplo, v1.compute.instances.stop.
Grupos de cotas de operações simultâneas
Nesta seção, descrevemos os limites de várias operações em trânsito ou
em tempo real do Compute Engine.
Cotas de operação globais
Operações globais simultâneas consomem um limite global especificado
para os tipos de operação por projeto. A tabela a seguir lista as cotas globais para
operações em andamento e as métricas correspondentes.
É possível visualizar a cota de operações globais usando o console Google Cloud ,
a Google Cloud CLI e a API Service Usage. Para mais informações, consulte
Visualizar cotas e limites de operações simultâneas.
Nome da cota
Descrição
Nome da métrica
Métodos que consomem esta cota
Concurrent global operations per project
Limita o número total de operações globais simultâneas de um projeto.
Operações regionais simultâneas consomem um limite regional especificado
para os tipos de operação por projeto em uma determinada região.
A tabela a seguir lista as cotas regionais para operações em andamento e
as métricas correspondentes.
É possível visualizar a cota de operações regionais
usando o console Google Cloud ,
a Google Cloud CLI e a API Service Usage. Para mais informações, consulte
Visualizar cotas e limites de operações simultâneas.
Nome da cota
Descrição
Nome da métrica
Métodos que consomem esta cota
Concurrent regional operations per project
Limita o número total de operações globais simultâneas de um projeto.
O URL da solicitação HTTP contém regions ou zones para esses métodos.
Por exemplo, o método instances.insert: POST /compute/v1/projects/{project}/zones/{zone}/instances
Concurrent regional operations per project operation type
Limita o número de operações regionais simultâneas por projeto por tipo de operação.
A cota padrão de operações simultâneas é de 500 operações em andamento
por projeto e por região, exceto pelos métodos a seguir, que têm
limites padrão diferentes:
A página Cotas lista todo o uso e os limites das cotas para seu projeto.
A lista é classificada por padrão para mostrar primeiramente as cotas mais usadas,
o que ajuda a ver os limites que correm risco de serem excedidos.
Para filtrar a lista e ver o uso e o limite de uma cota específica,
selecione a Cota ou a Métrica no campo Filtro.
Por exemplo, selecione a Cota Concurrent global operations per project operation type
para saber o uso da cota para métodos globais por tipo de operação.
Para filtrar a cota de uma operação específica, adicione Dimensões à consulta de filtro
e selecione operation_type. Por exemplo, selecione firewalls_insert
para ver o uso da cota e o limite da operação firewalls.insert.
gcloud
Use a CLI do Google Cloud para ver o uso e o limite de cotas de
operação simultânea.
Para usar essa abordagem, instale
o componente
de comandos alfa. Se você estiver usando o Cloud Shell para interagir com Google Cloud, a
Google Cloud CLI será instalada.
Para conferir a cota, use o seguinte comando:
gcloud alpha services quota list \
--service=compute.googleapis.com \
--consumer=projects/PROJECT_ID
Substitua PROJECT_ID pelo ID do projeto com a cota que você
quer visualizar.
Práticas recomendadas
A lista de verificação a seguir resume as práticas recomendadas para reduzir erros de limite de operações simultâneas insuficientes:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[[["\u003cp\u003eConcurrent operation quotas define the maximum number of in-flight operations allowed for creating, modifying, or deleting Compute Engine resources at any given time.\u003c/p\u003e\n"],["\u003cp\u003eExceeding these concurrent operation limits results in a \u003ccode\u003e403\u003c/code\u003e error with the reason \u003ccode\u003erateLimitExceeded\u003c/code\u003e, indicating the project has surpassed the allowed number of simultaneous operations.\u003c/p\u003e\n"],["\u003cp\u003eGlobal and regional operation quotas limit concurrent operations, and each can be viewed in the Google Cloud console or using the Google Cloud CLI.\u003c/p\u003e\n"],["\u003cp\u003eThe error details provide information such as the project ID, the quota metric exceeded, the quota limit name, the operation type, and the location, which are only available through the API response.\u003c/p\u003e\n"],["\u003cp\u003eBest practices for reducing concurrent operation errors include waiting for operations to complete, minimizing client-side retries, and implementing exponential backoff for retries.\u003c/p\u003e\n"]]],[],null,["# Compute Engine concurrent operation quotas\n\n*** ** * ** ***\n\nThis document describes the concurrent operation quotas for Compute Engine.\n\nConcurrent operation quotas\n---------------------------\n\nConcurrent operation quotas define the number of in-flight or concurrent\noperations that can occur at any point of time. Any API request that creates,\nmodifies, or deletes a Compute Engine resource is subject to a concurrent\noperation limit check to ensure that the total number of in-flight operations\nat any point of time does not exceed the limit specified for that operation.\n\n### Concurrent operation limit exceeded error\n\nIf your project exceeds the concurrent operation limit for any in-flight\noperation, you receive a `403` error with the reason `rateLimitExceeded`.\n\nThe API response of the error looks similar to the following:\n\n\u003cbr /\u003e\n\n```\n \"error\": {\n \"code\": 403,\n \"message\": \"Rate Limit Exceeded\",\n \"errors\": [\n {\n \"message\": \"Rate Limit Exceeded\",\n \"domain\": \"usageLimits\",\n \"reason\": \"rateLimitExceeded\",\n ...\n ...\n }\n ],\n \"details\": [\n {\n \"@type\": \"type.googleapis.com/google.rpc.ErrorInfo\",\n \"reason\": \"CONCURRENT_OPERATIONS_QUOTA_EXCEEDED\",\n \"domain\": \"compute.googleapis.com\",\n \"metadata\": {\n \"containerType\": \"PROJECT\",\n \"containerId\": \"PROJECT_ID\",\n \"quotaMetric\": \"QUOTA_METRIC\",\n \"quotaLimit\": \"QUOTA_LIMIT\",\n \"operationType\": \"OPERATION_TYPE\",\n \"location\": \"global | REGION\"\n }\n },\n {\n \"@type\": \"type.googleapis.com/google.rpc.Help\",\n \"links\": [\n {\n \"description\": \"Concurrent operations quota documentation.\",\n \"url\": \"https://cloud.google.com/compute/operations-quota#concurrent_operation_limits\"\n }\n ]\n },\n ...\n ... \n```\n\n\u003cbr /\u003e\n\nThe error details contain the following values:\n\n- \u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e: the ID of the project in which\n the quota exceeds the limit.\n\n- \u003cvar translate=\"no\"\u003eQUOTA_METRIC\u003c/var\u003e: the metric for the concurrent quota\n that exceeds the limit. It can be one of the following:\n\n - `compute.googleapis.com/global_concurrent_operations`\n - `compute.googleapis.com/regional_concurrent_operations`\n- \u003cvar translate=\"no\"\u003eQUOTA_LIMIT\u003c/var\u003e: the limit name of the concurrent quota.\n It can be one of the following:\n\n - `GlobalConcurrentOperationsPerProject`\n - `GlobalConcurrentOperationsPerProjectOperationType`\n - `RegionalConcurrentOperationsPerProject`\n - `RegionalConcurrentOperationsPerProjectOperationType`\n- \u003cvar translate=\"no\"\u003eOPERATION_TYPE\u003c/var\u003e: the global or regional operation for\n which the quota exceeds the limit. For a list of operations, see\n [Concurrent operation quota groups](#operation_groups).\n\n- The `location` can be one of the following:\n\n - `global`: specifies that the limit exceeded for global operation quota\n - \u003cvar translate=\"no\"\u003eREGION\u003c/var\u003e: specifies the region where the limit exceeded for the operation quota\n\nThe detailed error logs are returned only through API response. Error in Logs Explorer is similar to the following:\n\n\u003cbr /\u003e\n\n```\n \"protoPayload\":{\n \"@type\": \"type.googleapis.com/google.cloud.audit.AuditLog\",\n \"status\": {\n \"message\": \"Rate Limit Exceeded\"\n }\n \"serviceName\": \"compute.googleapis.com\",\n \"methodName\": \"METHOD_NAME\",\n ...\n ...\n \"response\": {\n \"error\": {\n \"message\": \"Rate Limit Exceeded\",\n \"code\": 403,\n \"errors\": [\n {\n \"message\": \"Rate Limit Exceeded\",\n \"reason\": \"rateLimitExceeded\",\n \"domain\": \"usageLimits\"\n }\n ]\n },\n \"@type\": \"type.googleapis.com/error\"\n },\n ...\n ... \n```\n\n\u003cbr /\u003e\n\nThe \u003cvar translate=\"no\"\u003eMETHOD_NAME\u003c/var\u003e in the error represents the\nAPI method for which the rate limit exceeded. For example, `v1.compute.instances.stop`.\n\n### Concurrent operation quota groups\n\nThis section describes the limits for various Compute Engine in-flight or\nconcurrent operations.\n\n#### Global operation quotas\n\nConcurrent global operations consume a global limit that is specified\nfor operation types per project. The following table lists the global quotas for\nin-flight operations and the corresponding metrics.\n\nYou can view the quota for global operations by using the Google Cloud console,\nGoogle Cloud CLI, and Service Usage API. For more information, see\n[View concurrent operation quotas and limits](#view_quota_limits).\n\n\u003cbr /\u003e\n\n\u003cbr /\u003e\n\n#### Regional operation quotas\n\nConcurrent regional operations consume a regional limit that is specified\nfor operation types per project in a given region.\n\nThe following table lists the regional quotas for in-flight operations and\nthe corresponding metrics.\n\nYou can view the quota for regional operations\nby using the Google Cloud console,\nGoogle Cloud CLI, and Service Usage API. For more information, see\n[View concurrent operation quotas and limits](#view_quota_limits).\n\n\u003cbr /\u003e\n\n\u003cbr /\u003e\n\n### View concurrent operation quotas and limits\n\nTo view the quota usage and limits in a project, do the following: \n\n### Console\n\n1. In the Google Cloud console, go to the **Quotas** page.\n\n [Go to Quotas](https://console.cloud.google.com/iam-admin/quotas)\n\n The **Quotas** page lists all quota usage and limits for your project.\n By default, the list is sorted to show your most used quotas first,\n which helps you see limits that are at risk of being exceeded.\n2. To filter the list and to view the usage and limit for any specific quota,\n select the **Quota** or **Metric** in the **Filter** field.\n\n For example, select the Quota `Concurrent global operations per project operation type`\n to see the quota usage for global methods per operation type.\n\n To filter the quota for a specific operation, add **Dimensions** to the filter query\n and select the **operation_type** . For example, select `firewalls_insert`\n to see the quota usage and limit for `firewalls.insert` operation.\n\n### gcloud\n\n\n| **Preview**\n|\n|\n| This product or feature is subject to the \"Pre-GA Offerings Terms\" in the General Service Terms section\n| of the [Service Specific Terms](/terms/service-terms#1).\n|\n| Pre-GA products and features are available \"as is\" and might have limited support.\n|\n| For more information, see the\n| [launch stage descriptions](/products#product-launch-stages).\n\n\u003cbr /\u003e\n\nYou can use the Google Cloud CLI to view the usage and limit of concurrent\noperation quotas.\n\nTo use this approach, ensure that you have installed\nthe [alpha commands](/sdk/docs/components#alpha_and_beta_components)\ncomponent. If you're using Cloud Shell to interact with Google Cloud, the\nGoogle Cloud CLI is installed for you.\n\nTo view the quota, use the following command: \n\n gcloud alpha services quota list \\\n --service=compute.googleapis.com \\\n --consumer=projects/\u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e\n\nReplace \u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e with the ID of the project for which you\nwant to view the quota.\n\n### Best practices\n\nThe following checklist summarizes the best practices for reducing insufficient\nconcurrent operation limit errors:\n\n- [Wait for operations to be done](/compute/docs/api/best-practices#wait-for-operations)\n- [Rely on error codes, not error messages](/compute/docs/api/best-practices#rely-on-errors-not-messages)\n- [Minimize client-side retries to preserve API rate limits](/compute/docs/api/best-practices#preserve-API-rate-limits)\n - [Avoid short polling](/compute/docs/api/best-practices#avoid-short-polling)\n - [Use bursting sparingly and selectively](/compute/docs/api/best-practices#limit-bursting)\n - [Always make your calls in a retry loop with exponential backoff](/compute/docs/api/best-practices#retry-with-exponential-backoff)\n - [Use a client-side rate limiter](/compute/docs/api/best-practices#use-client-side-rate-limiter)\n - [Split up your applications across multiple projects](/compute/docs/api/best-practices#multiple-projects)\n\nWhat's next\n-----------\n\n- Read about [Cloud Quotas](/docs/quotas/overview)."]]