Cotas de operação simultânea do Compute Engine,Cotas de operação simultânea do Compute Engine


Este documento descreve as cotas de operação simultânea do Compute Engine.

Cotas de operação simultânea

As cotas de operações simultâneas definem o número de operações em andamento ou simultâneas que podem ocorrer a qualquer momento. Qualquer solicitação de API que crie, modifique ou exclua um recurso do Compute Engine está sujeita a uma verificação de limite de operação simultânea para garantir que o número total de operações em andamento em qualquer momento não exceda o limite especificado para essa operação.

Erro de limite de operação simultânea excedido

Se o seu projeto exceder o limite de operação simultânea para qualquer operação em andamento, você receberá um erro 403 com o motivo rateLimitExceeded .

A resposta da API do erro é semelhante a esta:

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Os detalhes do erro contêm os seguintes valores:

  • PROJECT_ID : o ID do projeto em que a cota excede o limite.

  • QUOTA_METRIC : a métrica da cota simultânea que excede o limite. Pode ser um dos seguintes:

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT : o nome do limite da cota simultânea. Pode ser um dos seguintes:

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE : a operação global ou regional para a qual a cota excede o limite. Para obter uma lista de operações, consulte Grupos de cotas de operações simultâneas .

  • A location pode ser uma das seguintes:

    • global : especifica que o limite foi excedido para a cota de operação global
    • REGION : especifica a região onde o limite foi excedido para a cota de operação

Os logs de erros detalhados são retornados somente por meio da resposta da API. O erro no Logs Explorer é semelhante a este:

   "protoPayload":{
    "@type": "type.googleapis.com/google.cloud.audit.AuditLog",
    "status": {
      "message": "Rate Limit Exceeded"
    }
    "serviceName": "compute.googleapis.com",
    "methodName": "METHOD_NAME",
    ...
    ...
    "response": {
      "error": {
        "message": "Rate Limit Exceeded",
        "code": 403,
        "errors": [
          {
            "message": "Rate Limit Exceeded",
            "reason": "rateLimitExceeded",
            "domain": "usageLimits"
          }
        ]
      },
      "@type": "type.googleapis.com/error"
    },
    ...
    ... 

O METHOD_NAME no erro representa o método API para o qual o limite de taxa foi excedido. Por exemplo, v1.compute.instances.stop .

Grupos de cotas de operação simultânea

Esta seção descreve os limites para várias operações simultâneas ou em andamento do Compute Engine.

Cotas de operação global

As operações globais simultâneas consomem um limite global especificado para tipos de operação por projeto. A tabela a seguir lista as cotas globais para operações em andamento e as métricas correspondentes.

Você pode visualizar a cota para operações globais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para obter mais informações, consulte Exibir cotas e limites de operações simultâneas .

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent global operations per project
Limita o número total de operações globais simultâneas para um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

O URL da solicitação HTTP contém global para esses métodos. Por exemplo, o método networks.insert :
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Limita o número de operações simultâneas por projeto e por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

A cota padrão de operações simultâneas é 500 operações em andamento por projeto, exceto para os métodos a seguir, que têm limites padrão diferentes:

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Cotas de operação regional

As operações regionais simultâneas consomem um limite regional especificado para tipos de operação por projeto em uma determinada região.

A tabela a seguir lista as cotas regionais para operações em voo e as métricas correspondentes.

Você pode visualizar a cota para operações regionais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para obter mais informações, consulte Exibir cotas e limites de operações simultâneas .

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent regional operations per project
Limita o número total de operações regionais simultâneas para um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

O URL de solicitação HTTP contém regions ou zones para esses métodos.
Por exemplo, o método instances.insert :
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Limita o número de operações regionais simultâneas por projeto e por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

A cota padrão de operações simultâneas é 500 operações em andamento por projeto e por região, exceto para os métodos a seguir, que têm limites padrão diferentes:

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Visualizar cotas e limites de operação simultânea

Para visualizar o uso e os limites da cota em um projeto, faça o seguinte:

Console

  1. No console do Google Cloud, acesse a página Cotas .

    Ir para cotas

    A página Cotas lista todo o uso e limites de cotas do seu projeto. Por padrão, a lista é classificada para mostrar primeiro as cotas mais usadas, o que ajuda a ver os limites que correm o risco de serem excedidos.

  2. Para filtrar a lista e visualizar o uso e o limite de qualquer cota específica, selecione a Cota ou a Métrica no campo Filtro .

    Por exemplo, selecione Cota Concurrent global operations per project operation type para ver o uso da cota para métodos globais por tipo de operação.

    Para filtrar a cota de uma operação específica, adicione Dimensões à consulta de filtro e selecione operation_type . Por exemplo, selecione firewalls_insert para ver o uso da cota e o limite para a operação firewalls.insert .

gcloud

Você pode usar a CLI do Google Cloud para visualizar o uso e o limite de cotas de operações simultâneas.

Para usar essa abordagem, certifique-se de ter instalado o componente de comandos alfa . Se você estiver usando o Cloud Shell para interagir com Google Cloud, a CLI do Google Cloud será instalada para você.

Para visualizar a cota, use o seguinte comando:

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Substitua PROJECT_ID pelo ID do projeto para o qual você deseja visualizar a cota.

Melhores práticas

A lista de verificação a seguir resume as melhores práticas para reduzir erros de limite de operação simultânea insuficiente:

O que vem a seguir

,

Este documento descreve as cotas de operação simultânea do Compute Engine.

Cotas de operação simultânea

As cotas de operações simultâneas definem o número de operações em andamento ou simultâneas que podem ocorrer a qualquer momento. Qualquer solicitação de API que crie, modifique ou exclua um recurso do Compute Engine está sujeita a uma verificação de limite de operação simultânea para garantir que o número total de operações em andamento em qualquer momento não exceda o limite especificado para essa operação.

Erro de limite de operação simultânea excedido

Se o seu projeto exceder o limite de operação simultânea para qualquer operação em andamento, você receberá um erro 403 com o motivo rateLimitExceeded .

A resposta da API do erro é semelhante a esta:

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Os detalhes do erro contêm os seguintes valores:

  • PROJECT_ID : o ID do projeto em que a cota excede o limite.

  • QUOTA_METRIC : a métrica da cota simultânea que excede o limite. Pode ser um dos seguintes:

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT : o nome do limite da cota simultânea. Pode ser um dos seguintes:

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE : a operação global ou regional para a qual a cota excede o limite. Para obter uma lista de operações, consulte Grupos de cotas de operações simultâneas .

  • A location pode ser uma das seguintes:

    • global : especifica que o limite foi excedido para a cota de operação global
    • REGION : especifica a região onde o limite foi excedido para a cota de operação

Os logs de erros detalhados são retornados somente por meio da resposta da API. O erro no Logs Explorer é semelhante a este:

   "protoPayload":{
    "@type": "type.googleapis.com/google.cloud.audit.AuditLog",
    "status": {
      "message": "Rate Limit Exceeded"
    }
    "serviceName": "compute.googleapis.com",
    "methodName": "METHOD_NAME",
    ...
    ...
    "response": {
      "error": {
        "message": "Rate Limit Exceeded",
        "code": 403,
        "errors": [
          {
            "message": "Rate Limit Exceeded",
            "reason": "rateLimitExceeded",
            "domain": "usageLimits"
          }
        ]
      },
      "@type": "type.googleapis.com/error"
    },
    ...
    ... 

O METHOD_NAME no erro representa o método API para o qual o limite de taxa foi excedido. Por exemplo, v1.compute.instances.stop .

Grupos de cotas de operação simultânea

Esta seção descreve os limites para várias operações simultâneas ou em andamento do Compute Engine.

Cotas de operação global

As operações globais simultâneas consomem um limite global especificado para tipos de operação por projeto. A tabela a seguir lista as cotas globais para operações em andamento e as métricas correspondentes.

Você pode visualizar a cota para operações globais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para obter mais informações, consulte Exibir cotas e limites de operações simultâneas .

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent global operations per project
Limita o número total de operações globais simultâneas para um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

O URL da solicitação HTTP contém global para esses métodos. Por exemplo, o método networks.insert :
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Limita o número de operações simultâneas por projeto e por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/global_concurrent_operations

Todos os métodos globais.

A cota padrão de operações simultâneas é 500 operações em andamento por projeto, exceto para os métodos a seguir, que têm limites padrão diferentes:

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Cotas de operação regional

As operações regionais simultâneas consomem um limite regional especificado para tipos de operação por projeto em uma determinada região.

A tabela a seguir lista as cotas regionais para operações em voo e as métricas correspondentes.

Você pode visualizar a cota para operações regionais usando o console do Google Cloud, a CLI do Google Cloud e a API Service Usage. Para obter mais informações, consulte Exibir cotas e limites de operações simultâneas .

Nome da cota
Descrição
Nome da métrica Métodos que consomem esta cota
Concurrent regional operations per project
Limita o número total de operações regionais simultâneas para um projeto.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

O URL de solicitação HTTP contém regions ou zones para esses métodos.
Por exemplo, o método instances.insert :
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Limita o número de operações regionais simultâneas por projeto e por tipo de operação.

Veja esta cota no console do Google Cloud

compute.googleapis.com/regional_concurrent_operations

Todos os métodos regionais.

A cota padrão de operações simultâneas é 500 operações em andamento por projeto e por região, exceto para os métodos a seguir, que têm limites padrão diferentes:

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Visualizar cotas e limites de operação simultânea

Para visualizar o uso e os limites da cota em um projeto, faça o seguinte:

Console

  1. No console do Google Cloud, acesse a página Cotas .

    Ir para cotas

    A página Cotas lista todo o uso e limites de cotas do seu projeto. Por padrão, a lista é classificada para mostrar primeiro as cotas mais usadas, o que ajuda a ver os limites que correm o risco de serem excedidos.

  2. Para filtrar a lista e visualizar o uso e o limite de qualquer cota específica, selecione a Cota ou a Métrica no campo Filtro .

    Por exemplo, selecione Cota Concurrent global operations per project operation type para ver o uso da cota para métodos globais por tipo de operação.

    Para filtrar a cota de uma operação específica, adicione Dimensões à consulta de filtro e selecione operation_type . Por exemplo, selecione firewalls_insert para ver o uso da cota e o limite para a operação firewalls.insert .

gcloud

Você pode usar a CLI do Google Cloud para visualizar o uso e o limite de cotas de operações simultâneas.

Para usar essa abordagem, certifique-se de ter instalado o componente de comandos alfa . Se você estiver usando o Cloud Shell para interagir com Google Cloud, a CLI do Google Cloud será instalada para você.

Para visualizar a cota, use o seguinte comando:

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Substitua PROJECT_ID pelo ID do projeto para o qual você deseja visualizar a cota.

Melhores práticas

A lista de verificação a seguir resume as melhores práticas para reduzir erros de limite de operação simultânea insuficiente:

O que vem a seguir