Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Cotas
Confira neste documento os limites da cota de funções do Cloud Run.
As cotas de funções do Cloud Run incluem 4 áreas:
Limites de recursos
Afetam a quantidade total de recursos que as funções podem consumir.
Limites do tempo
Afetam o tempo em que algo pode ser executado.
Limites de taxas
Afetam a frequência em que você pode chamar a API Cloud Run Functions
para gerenciar suas funções.
Limites de rede
Afetam os limites de conexão e de instâncias de saída.
Veja abaixo mais detalhes sobre os diferentes tipos de limites.
As diferenças entre os limites das funções do Cloud Run (1ª geração) e
das funções do Cloud Run (2ª geração) são observadas quando aplicável.
Limites de recursos
Os limites de recursos afetam a quantidade total de recursos que as funções podem consumir.
O escopo regional é definido por projeto, e cada projeto mantém limites próprios.
Cota
Descrição
Limite (1ª geração)
Limite (2ª geração)
Pode aumentar?
Escopo
Número de funções
O número total de funções que podem ser implantadas por região.
1.000
1.000 menos o número de serviços do Cloud Run implantados
Não
por região
Tamanho máximo da implantação
O tamanho máximo da implantação de uma única função.
100 MB (compactado) para fontes
500 MB (descompactado) para a soma de fontes com módulos
N/A
Não
Por função
Tamanho máximo da solicitação HTTP descompactada
Os dados enviados a funções HTTP em uma solicitação HTTP.
10 MB
32 MB
Não
Por invocação
Tamanho máximo da resposta HTTP descompactada
Os dados enviados a partir de funções HTTP em uma resposta HTTP.
10 MB
10 MB para respostas de streaming.
32 MB para respostas que não sejam de streaming.
Não
Por invocação
Tamanho máximo dos eventos de funções orientadas a eventos
Os dados enviados nos eventos para funções em segundo plano.
10 MB
512 KB para eventos Eventarc.
10 MB para eventos legados.
Não
Por evento
Memória máxima da função
Quantidade de memória que cada instância de função pode usar
8GiB
32GiB
Não
Por função
Memória máxima do projeto
Quantidade de memória, em By, que um projeto pode usar. É medida pela soma total da memória solicitada pelo usuário em instâncias de função em um período de 1 minuto.
Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente.
N/A
Sim
por projeto e região
CPU máxima do projeto
Quantidade de CPU, em mili vCPU, que um projeto pode usar. Ela é medida pela soma total da CPU solicitada pelo usuário em todas as instâncias de função em um período de 1 minuto.
Depende da região selecionada. Esse limite pode ser maior em regiões de alta capacidade ou menor em regiões abertas recentemente.
N/A
Sim
por projeto e região
Limites do tempo
Cota
Descrição
Limite (1ª geração)
Limite (2ª geração)
Pode aumentar?
Escopo
Duração máxima da função
A quantidade máxima de tempo em que uma função pode ser executada antes de ser encerrada à força
540 segundos
60 minutos para funções HTTP.
60 minutos para funções orientadas a eventos.
Não
Por invocação
Limites de taxas
Cota
Descrição
Limite (1ª geração)
Limite (2ª geração)
Pode aumentar?
Escopo
Chamadas de API (READ)
Chamadas para descrever ou listar funções pela API Cloud Run Functions.
5.000 a cada 100 segundos
1.200 a cada 60 segundos
Somente para a 1ª geração
por projeto (1ª geração)
por região (2ª geração)
Chamadas de API (WRITE)
Chamadas para implantar ou excluir funções pela API Cloud Run Functions.
Para informações sobre a solicitação de rede e
os limites de largura de banda do Cloud Run functions (2ª geração), consulte Limites de rede.
Os limites de rede a seguir se aplicam às funções do Cloud Run (1ª geração):
Conexões de saída por segundo por instância: 500 (não pode ser aumentado)
Resoluções de DNS de saída por segundo por instância: 100 (não é possível aumentar)
Máximo de pacotes por segundo por instância: 80.000
Máximo de bits por segundo por instância: 100.000.000
Escalonabilidade
As funções do Cloud Run invocadas por HTTP são escalonadas rapidamente para lidar com o tráfego de entrada, enquanto as funções em segundo plano têm um escalonamento mais gradual. O escalonamento de uma função é determinado por alguns fatores, incluindo:
o tempo necessário para a execução da função ser concluída. O escalonamento vertical de funções de curta duração geralmente acontece para que seja possível lidar com solicitações simultâneas;
o tempo necessário para uma função ser inicializada em uma
inicialização a frio;
a taxa de erros da sua função;
Fatores temporários, como a carga regional e a capacidade do data center.
Funções de segundo plano apresentam também os limites explicados abaixo. Esses limites não se aplicam a funções
HTTP de 1ª geração. O limite máximo de instâncias padrão para funções HTTP de 2ª geração é 100 e pode ser aumentado para 1.000. Não há limite máximo de instâncias padrão para funções HTTP
de 1ª geração.
Para evitar eventos de escalonamento ilimitado com funções HTTP de 1ª geração, recomendamos
definir um limite de,
por exemplo, 3.000.
Outras cotas para funções de segundo plano
Cota
Descrição
Limite
Pode aumentar?
Escopo
Versão do produto
Máximo de invocações simultâneas
O número máximo de invocações simultâneas de uma única função Exemplo: se o processamento de cada evento demorar 100 segundos, a taxa de invocação
será limitada a 30 por segundo em média.
3.000
Sim
Por função
Somente 1ª geração
Taxa de invocação máxima
A taxa máxima de eventos sendo processados por uma única função Exemplo: se o processamento de um evento demorar 100 ms, a taxa de invocação será limitada a 1.000 por segundo, mesmo que apenas 100 solicitações, em média, sejam processadas em paralelo.
1.000 por segundo
Não
Por função
Somente 1ª geração
Máximo de dados de eventos simultâneos
O tamanho máximo total de eventos recebidos para invocações simultâneas de uma única função Exemplo: se os eventos tiverem 1 MB e o processamento deles levar 10 segundos, em média, a taxa será de 1 evento por segundo, porque o 11º evento não será processado até que seja concluído o processamento de um dos 10 primeiros eventos.
10 MB
Não
Por função
1ª e 2ª geração
Capacidade máxima de eventos recebidos
A capacidade máxima de eventos recebidos para uma única função Exemplo: se os eventos tiverem 1 MB, a taxa de invocação poderá ser no máximo 10 por segundo, mesmo se as funções forem concluídas com 100 ms.
10 MB por segundo
Não
Por função
1ª e 2ª geração
Quando você atingir um limite de cota
Quando todo o recurso alocado é consumido por uma função, ele fica indisponível até que você renove ou aumente a cota. Isso significa que a função não será executada enquanto isso, assim como todas as outras funções no mesmo projeto.
Uma função retorna um código de erro HTTP 500 quando um dos recursos excede a cota, e a função não pode ser executada.
Para aumentar as cotas acima dos padrões listados nesta página, acesse a
Página de cotas de funções do Cloud Run e selecione as cotas que você quer modificar. Em seguida, clique em Editar cotas, forneça as informações do usuário se for necessário e insira o novo limite para cada cota.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-03 UTC."],[[["\u003cp\u003eCloud Run functions have various quota limits spanning resource, time, rate, and networking categories, which define the operational boundaries for these functions.\u003c/p\u003e\n"],["\u003cp\u003eResource limits, such as the number of functions, deployment size, memory, and CPU, constrain the total resources a project's functions can use, with some differences between 1st and 2nd generation functions.\u003c/p\u003e\n"],["\u003cp\u003eTime limits, such as the maximum function duration, dictate how long a function can run before being forcibly terminated, with different limits for HTTP and event-driven functions in 2nd generation.\u003c/p\u003e\n"],["\u003cp\u003eRate limits regulate the frequency of API calls for managing Cloud Run functions, with different limits for read, write, and call operations, and while write and call API quotas cannot be increased, it is possible for 1st gen to increase the READ quota.\u003c/p\u003e\n"],["\u003cp\u003eNetworking limits, including outbound connections, DNS resolutions, and data transfer rates, set the parameters for how Cloud Run functions can interact with external networks, and they vary between 1st and 2nd generation functions.\u003c/p\u003e\n"]]],[],null,["# Quotas\n======\n\nThis document describes the quota limits for Cloud Run functions.\n| To increase quotas above the defaults listed here, go to the [Cloud Run functions Quotas Page](https://console.cloud.google.com/iam-admin/quotas?service=cloudfunctions.googleapis.com&usage=ALL&project=_), select the quotas you want to modify, click **Edit quotas**, supply your user information if prompted, and enter the new quota limit for each quota you selected.\n\nQuotas for Cloud Run functions encompass 4 areas:\n\n- Resource Limits\n\n These affect the total amount of resources your functions can consume.\n- Time Limits\n\n These affect how long things can run.\n- Rate Limits\n\n These affect the rate at which you can call the Cloud Run functions API\n to manage your functions.\n- Networking Limits\n\n These affect outbound connection and instance limits.\n\nThe different types of limits are described in more detail below.\nDifferences between limits for Cloud Run functions (1st gen) and\nCloud Run functions (2nd gen) are noted where applicable.\n\nResource Limits\n---------------\n\nResource limits affect the total amount of resources your functions can consume.\nThe regional scope is per project, and each project maintains its own limits.\n\n| **Note:** If you are triggering a function using Pub/Sub, either via [event-driven functions](/functions/docs/writing#event-driven_functions) or as the [HTTP target](/functions/docs/writing#http_functions) of a push subscription, be aware that Pub/Sub messages are base64-encoded. A 10 MB Pub/Sub message - the [maximum size](/pubsub/quotas) supported - is larger than 10 MB once it is encoded, and can thus exceed the Cloud Run functions max size limit.\n\nTime Limits\n-----------\n\nRate Limits\n-----------\n\n| ^1^ You cannot increase the WRITE quota. Insufficient quota generally occurs due to one of the following:\n|\n| - Use of a CI/CD system that deploys many functions concurrently or sequentially at a high rate.\n| - Use of the Firebase CLI to deploy multiple functions simultaneously.\n|\n| In each case, you can avoid hitting this quota by changing the rate of\n| deployments. For example, if you are deploying using the Firebase CLI,\n| [use\n| the `--only` flag to deploy individual functions](https://firebase.google.com/docs/cli/#deploy_specific_functions).\n| ^2^ The CALL API only applies to Cloud Run functions (1st gen). You cannot increase the CALL quota. Insufficient quota generally occurs if you mistakenly use this API to invoke your functions in production. Please keep in mind that this API is meant for testing with the Google Cloud console or [`gcloud functions call`](//cloud.google.com/sdk/gcloud/reference/functions/call) CLI, and it cannot handle heavy traffic.\n\nNetworking limits\n-----------------\n\nFor information about Cloud Run functions (2nd gen) networking request and\nbandwidth limits, see [Networking limits](https://cloud.google.com/run/quotas#networking_limits).\n\nThe following networking limits apply to Cloud Run functions (1st gen):\n\n- Outbound connections per second per instance: 500 (cannot be increased)\n- Outbound DNS resolutions per second per instance: 100 (cannot be increased)\n- Maximum packets per second per instance: 80,000\n- Maximum bits per second per instance: 100,000,000\n\nScalability\n-----------\n\nCloud Run functions invoked by HTTP scale up quickly to handle incoming traffic,\nwhile background functions scale more gradually. A function's ability to scale\nup is dictated by a few factors, including:\n\n- The amount of time it takes for a function's execution to complete (short-running functions can generally scale up to handle more concurrent requests).\n- The amount of time it takes for a function to initialize on [cold start](/functions/docs/bestpractices/tips#use_dependencies_wisely).\n- Your function's error rate.\n- Transient factors, such as regional load and data center capacity.\n\n- Your configuration as defined by\n [minimum instances](/functions/docs/configuring/min-instances),\n [maximum instances](/functions/docs/configuring/max-instances), and\n [concurrency](/functions/docs/configuring/concurrency) (concurrency is 2nd gen\n only).\n\n[Background functions](/functions/docs/writing/background) have additional limits, as explained below. These limits do not apply to 1st gen [HTTP\nfunctions](/functions/docs/writing/http). The default [maximum instances limit](/functions/docs/configuring/max-instances) for 2nd gen HTTP functions is 100 and can be increased to 1,000. There is no default maximum instances limit for 1st gen HTTP functions. To avoid unbounded scaling events with 1st gen HTTP functions, we recommend [setting a limit](/functions/docs/configuring/max-instances#setting_maximum_instances_limits), for example, 3000.\n\n\u003cbr /\u003e\n\n### Additional quotas for background functions\n\nWhen you reach a quota limit\n----------------------------\n\nWhen a function consumes all of an allocated resource, the resource becomes\nunavailable until the quota is refreshed or increased. This may mean that your\nfunction and all other functions in the same project will not work until then.\nA function returns an HTTP 500 error code when one of the resources is\nover quota and the function cannot execute.\n\nTo increase quotas above the defaults listed here, go to the\n[Cloud Run functions Quotas page](https://console.cloud.google.com/iam-admin/quotas?service=cloudfunctions.googleapis.com&usage=ALL&project=_), select the quotas you want to modify, click\n**Edit quotas**, supply your user information if prompted, and enter the new\nquota limit for each quota you selected."]]