Esta página contém a quota de utilização e os limites que se aplicam quando usa o Cloud Run.
O número de recursos do Cloud Run é limitado. As quotas do Cloud Run abrangem limites de taxa da API, que afetam a taxa à qual pode chamar a Cloud Run Admin API.
Não existe um limite direto para:
- O tamanho das imagens de contentores que pode implementar.
- O número de pedidos simultâneos publicados por um serviço do Cloud Run.
Limites de recursos para o Cloud Run
Para ultrapassar os limites que podem ser aumentados, peça um aumento da quota. Para ir além dos limites por projeto que não podem ser aumentados, crie novos recursos num Google Cloud projeto ou numa região diferente.
Recurso | Âmbito | Descrição | Limite | Pode ser aumentado |
---|---|---|---|---|
Serviço | por projeto e região | Número máximo de serviços | 1000 | Não |
Emprego | por projeto e região | Número máximo de tarefas | 1000 | Não |
Execução de tarefas | por projeto e região | Número máximo de execuções de tarefas em execução | 1000 | Não |
Revisão | por serviço | Número máximo de revisões por serviço. Quando o limite é atingido, as revisões que não estão a ser publicadas são eliminadas automaticamente por ordem cronológica | 1000 | Não |
Revisão | por projeto e região | Número máximo de revisões que publicam tráfego | 4000 | Não |
Etiqueta de revisão | por projeto e região | Número máximo de etiquetas de revisão. Quando o limite de etiquetas de revisão é excedido, o Cloud Run executa a limpeza de etiquetas no serviço. Para o serviço para o qual está a ser criada uma nova etiqueta, as etiquetas que não tenham uma percentagem de tráfego especificada são eliminadas automaticamente por ordem cronológica. | 2000 | Não |
Execução de tarefas | por trabalho | Limite de retenção para execuções de trabalhos concluídas. Quando o número de execuções concluídas de uma tarefa atinge este limite, as execuções são eliminadas automaticamente por ordem cronológica | 1000 | Não |
Tarefa de execução de tarefas1 | por execução de tarefa | Número máximo de tarefas em execução em paralelo | Depende da região selecionada e das configurações de CPU e memória. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. Pode ver a sua quota na página da consola Quotas e limites do sistema. | Sim |
Tarefa de execução de tarefas | por execução de tarefa | Valor de limite de tempo máximo de tarefas | 168 horas (7 dias)2 | Não |
Tarefa de execução de tarefas | por execução de tarefa | Número máximo de tarefas num único trabalho | 10 000 | Não |
Tarefa de execução de tarefas | por execução de tarefa | Número máximo de novas tentativas de tarefas num trabalho | 10 | Não |
Variáveis de ambiente | por trabalho ou por serviço | Número máximo de variáveis de ambiente para cada contentor | 1000 | Não |
Argumentos de comandos | por trabalho ou por serviço | Número máximo de argumentos de comandos para cada contentor | 1000 | Não |
Instância do contentor1 | por revisão | Número máximo de instâncias de contentores | Depende da região selecionada e das configurações de CPU e memória. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. Por predefinição, as revisões do Cloud Run estão configuradas para serem dimensionadas até um máximo de 100 instâncias. Pode ver a sua quota na página da consola Quotas e limites do sistema. | Sim |
Instância do contentor1 | por projeto e região | Número máximo de instâncias de contentores de todas as execuções de tarefas em execução | Depende da região selecionada e das configurações de CPU e memória. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. Pode ver a sua quota na página da consola Quotas e limites do sistema. | Sim |
Instância do contentor3 | por revisão e região | Número máximo de instâncias de contentores que usam a saída da VPC direta | 100 a 200, consoante as configurações da região selecionada. | Sim |
Instância do contentor | por instância do contentor | Limite de tempo de início, em minutos | 4 | Não |
Memória | por instância do contentor | Tamanho máximo da memória, em GiB | 32 | Não |
CPU | por instância do contentor | Número máximo de vCPUs | 8 | Não |
CPU1 | por projeto e região | CPU total máxima, em milivCPU, atribuída a todas as instâncias durante um período de 1 minuto. | Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. | Sim |
Memória1 | por projeto e região | Memória total máxima, em bytes, alocada em todas as instâncias durante um período de 1 minuto. | Depende da região selecionada. Este limite pode ser superior em regiões de alta capacidade ou inferior em regiões abertas recentemente. Pode ver a sua quota na página da consola Quotas e limites do sistema. | Sim |
Instância de GPU sem garantia de redundância zonal1, 4 | por projeto por região | Número máximo de instâncias de contentores com GPU | 04 | Sim |
Instância de GPU com garantia de redundância zonal1, 4 | por projeto por região | Número máximo de instâncias de contentores com GPU | 04 | Sim |
Disco | por instância do contentor | Máximo de sistema de ficheiros gravável na memória, limitado pela memória da instância, em GiB | 32 | Não |
Variável de ambiente | por variável | Comprimento máximo da variável, em KB | 32 | Não |
Mapeamento de domínio | por domínio principal e por semana | Número máximo de certificados SSL | 50 | Não |
Mapeamento de domínio | por domínio principal e por semana | Número máximo de certificados SSL duplicados | 5 | Não |
Chave de acesso | por instância de contentor por segundo | Número máximo de tokens de acesso únicos gerados | 50 | Não |
Token de identidade | por instância de contentor por segundo | Número máximo de tokens de identidade únicos gerados | 50 | Não |
Ficheiros abertos | por instância do contentor | Número máximo de ficheiros que podem ser abertos em simultâneo. Corresponde a /proc/sys/fs/file-max . |
25000 | Não |
1Estas quotas regionais são usadas em alguns casos em que cada uma controla:
O valor máximo que pode ser escolhido para o atributo maximum instance de uma revisão. Uma vez concedido numa determinada região, todas as revisões nessa região podem atingir o limite concedido.
O paralelismo máximo de uma tarefa. Depois de ser concedido numa determinada região, todos os trabalhos nessa região podem atingir o limite concedido.
O total de instâncias de contentores para executar execuções de tarefas numa região.
2 O suporte para tempos limite superiores a 24 horas está disponível na pré-visualização.
3Esta quota regional é usada em alguns casos:
Controla o valor máximo que pode ser escolhido para o atributo maximum instance de uma revisão através da saída da VPC direta. Uma vez concedido numa determinada região, todas as revisões nessa região podem atingir o limite concedido.
Controla o paralelismo máximo de uma tarefa que usa a saída do VPC direto. Assim que for concedido numa determinada região, todas as tarefas nessa região podem atingir o limite concedido.
4 Para aceder à GPU, tem de pedir um aumento da quota NvidiaL4GpuAllocPerProjectRegion ou NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Se a sua utilização máxima da GPU não estiver perto da sua quota, a Google pode diminuir a quota.
Limites de rede para o Cloud Run
Limites de pedidos para o Cloud Run
Descrição | Limite | Notas |
---|---|---|
Número máximo de pedidos simultâneos por instância | 1000 | |
Número máximo de streams simultâneas por ligação de cliente HTTP/2 | 100 | |
Tempo máximo antes do limite de tempo por pedido | 60 minutos | |
Tamanho máximo do pedido HTTP/1 | 32 MiB se usar um servidor HTTP/1. Não existe limite se usar um servidor HTTP/2. | |
Tamanho máximo da resposta HTTP/1 | 32 MiB se não usar Transfer-Encoding: chunked ou mecanismos de streaming |
|
Ligações de saída por segundo por instância | 700 | Não se aplica ao tráfego de saída da VPC direta enviado para a rede da VPC, que não é limitado. |
Resoluções de DNS de saída por segundo por instância | 1000 | |
Pedidos de entrada por segundo para uma porta de contentor HTTP/1 por instância | 800 | Não se aplica a portas de contentores HTTP/2. |
Limites de largura de banda para o Cloud Run
Os seguintes limites de largura de banda aplicam-se às instâncias do Cloud Run:
Descrição | Limite | Notas |
---|---|---|
Máximo de bits por instância para saída através da VPC direta | 1 Gbps | Saída através da saída da VPC direta para destinos na rede da VPC. |
Máximo de bits por instância, excluindo a saída através da VPC direta | 600 Mbps | Com base na soma dos bits de entrada e saída, excluindo a saída através da saída direta da VPC para destinos na rede da VPC. |
Taxa total máxima de pacotes por instância, excluindo a saída através da VPC direta | 64 000 pacotes por segundo | Com base na soma dos pacotes de entrada e dos pacotes de saída, excluindo a saída através da saída da VPC direta para destinos na rede da VPC. |
Se atingir um dos dois limites, a instância do Cloud Run tem uma largura de banda limitada.
Limites de taxa da Cloud Run Admin API
Os seguintes limites de taxa aplicam-se à API Cloud Run Admin. Não se aplicam aos pedidos que chegam aos seus serviços do Cloud Run implementados.
Quota | Descrição | Limite | Pode ser aumentado | Âmbito |
---|---|---|---|---|
Pedidos de leitura da Cloud Run Admin API | O número de leituras da API por 60 segundos por região. Este não é o número de pedidos de leitura aos seus serviços do Cloud Run, que não é limitado. | 3000 por 60 segundos | Sim | por projeto e região |
Pedidos de escrita da API Cloud Run Admin | O número de escritas da API por 60 segundos por região. Este não é o número de pedidos de gravação nos seus serviços do Cloud Run, que não é limitado. | 180 por 60 segundos | Sim | por projeto e região |
Execução de tarefas | Número máximo de vezes que uma tarefa pode ser executada por 60 segundos por região. | 180 por 60 segundos | Sim | por projeto e região |
Como aumentar a quota
Os pedidos de ajuste de quotas do Google Cloud estão sujeitos a revisão. Se o seu pedido de ajuste da quota exigir revisão, recebe um email a acusar a receção do pedido. Se precisar de mais assistência, responda ao email. Depois de rever o seu pedido, recebe uma notificação por email a indicar se o pedido foi aprovado.
Consola
Para ajustar um valor de quota, siga estes passos:
Na Google Cloud consola, aceda à página IAM e administração > Quotas e limites do sistema:
Encontre o valor da quota que quer atualizar na coluna Quota e selecione a caixa de verificação junto à quota que quer atualizar.
Se necessário, use a caixa de pesquisa Filtrar para pesquisar a sua quota.
Clique em
Editar e é apresentada a caixa de diálogo Alterações de quota.Introduza o valor da quota pretendido no campo Valor novo. Alguns valores de quota têm uma unidade de medida. Se for o caso, selecione a unidade que quer na lista adjacente. Clique em Concluído.
Opcional: se vir uma caixa de verificação com o texto
I understand that this request will remove any overrides
, significa que ajustar o valor da quota para um número igual ou superior ao predefinido remove a substituição da quota anterior. Se é isto que quer, selecione a caixa de verificação e continue.Para aumentar o valor da quota para um número superior ao indicado na caixa de diálogo, selecione Candidatar-se a uma quota mais elevada.
No formulário Alterações de quota, introduza o valor da quota atualizado que quer no campo Valor novo. Se aparecer um campo Descrição do pedido, introduza uma descrição. Clique em Concluído.
Se for apresentado um botão Seguinte, clique em Seguinte e preencha os detalhes de contacto no ecrã seguinte.
Clique em Enviar pedido.
Se não conseguir pedir um ajuste na consola, peça o aumento ao Cloud Customer Care.
Para saber como funciona o processo de aumento da quota, consulte o artigo Acerca dos ajustes de quota.
Agrupar pedidos para valores de quota mais elevados
Pode processar pedidos em lote para uma quota mais elevada selecionando a caixa de verificação junto a cada quota que quer incluir. No entanto, o processamento em lote de pedidos pode aumentar o tempo necessário para Google Cloud rever o seu pedido.
Para reduzir o tempo de revisão, agrupe os pedidos de ajuste da quota por produto e área. Por exemplo, se quiser pedir ajustes às quotas de rede e de VMs do Compute Engine, crie um pedido para as quotas de rede e outro para as quotas de VMs do Compute Engine.