Esta página foi traduzida pela API Cloud Translation.

Cotas e limites

Neste documento, listamos as cotas e os limites do sistema que se aplicam à Media CDN.

As cotas especificam a quantidade de um recurso compartilhado e mensurável que pode ser usado. Elas são definidas por serviços do Google Cloud , como o Media CDN.
Os limites do sistema são valores fixos que não podem ser alterados.

OGoogle Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe a alocação de um recurso doGoogle Cloud para uso do seu projeto do Google Cloud . As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, elas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários doGoogle Cloud , impedindo a sobrecarga de serviços. Elas também ajudam você a gerenciar seus próprios recursos do Google Cloud .

O sistema de cotas do Cloud faz o seguinte:

Monitora o consumo de produtos e serviços do Google Cloud .
Restringe o consumo desses recursos.
Possibilita a solicitação de mudanças no valor das cotas e a automatização de ajustes de cotas.

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso, e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao nível do projeto do Google Cloud . O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud , as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Também há limites de sistema para os recursos da Media CDN. Os limites do sistema não podem ser alterados.

Limites

Os limites a seguir se aplicam à Media CDN.

Configuração

Item	Limites	Observações
Número máximo de `EdgeCacheService`	20 por projeto	Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de `EdgeCacheOrigin`	30 por projeto	Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de `EdgeCacheKeyset`	10 por projeto	Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de `RouteRules` por `EdgeCacheService`	2000	Cada `EdgeCacheService` pode definir até 10 `PathMatchers`, e cada `PathMatcher` pode definir até 200 `RouteRules`. Esse limite não pode ser aumentado.
Número máximo de certificados SSL por serviço	5	Esse limite não pode ser aumentado. Consulte também a cota por projeto para certificados SSL.
Número máximo de chaves públicas por `EdgeCacheKeyset`	3	Esse limite não pode ser aumentado. Várias chaves em um Keyset são projetadas para permitir a rotação de chaves: remova as chaves mais antigas e não usadas com o tempo.
Número máximo de chaves compartilhadas de validação por `EdgeCacheKeyset`	3	Esse limite não pode ser aumentado. Várias chaves em um Keyset são projetadas para permitir a rotação de chaves: remova as chaves mais antigas e não usadas com o tempo.

Cabeçalhos, solicitações e respostas HTTP

Item	Limites	Observações
Tamanho máximo do cabeçalho da solicitação	Aproximadamente 11 KiB	Esse limite não pode ser aumentado. O tamanho combinado do URL e do cabeçalho da solicitação é limitado a 15 KiB. As solicitações são rejeitadas com uma resposta HTTP 431 para conexões HTTP/1.1. As conexões HTTP/2 são encerradas sem que um código de resposta seja gravado. Essas solicitações são registradas com um `statusDetails` de `headers_too_long`, se a geração de registros estiver ativada.
Tamanho máximo do corpo da solicitação	16 KiB	As solicitações com um corpo acima desse limite são rejeitadas com um código de status HTTP `413 Content Too Large`.
Tamanho máximo do cabeçalho de resposta	Aproximadamente 128 KiB	Esse limite não pode ser aumentado. Respostas de origem com cabeçalhos que excedem esse limite resultam em um HTTP 502 sendo enviado ao cliente. Eles são registrados com um `statusDetails` de `backend_response_headers_too_long`, se a geração de registros estiver ativada.
Tamanho máximo do objeto armazenável em cache	100 GiB	Esse limite não pode ser aumentado. Este é o tamanho máximo dos objetos na origem que o Media CDN pode armazenar em cache. Objetos maiores são tratados como não armazenáveis em cache.
Tamanho máximo da resposta não armazenável em cache	500 MiB	Esse limite não pode ser aumentado. Este é o número máximo de bytes em um corpo de resposta que o proxy da Media CDN quando um objeto não pode ser armazenado em cache. As respostas não armazenáveis em cache são truncadas depois que atingem o limite.
Conversão de cabeçalhos para minúsculas	Sempre, para Media CDN	A Media CDN segue as convenções do HTTP/2 para uso de maiúsculas e minúsculas nos cabeçalhos de solicitação e resposta. Seja qual for o protocolo utilizado, todos os cabeçalhos são convertidos em minúsculas. Por exemplo, `Host` se torna `host` e `Keep-Alive` se torna `keep-alive`. O uso de maiúsculas e minúsculas nos valores de cabeçalho não é alterado.

Limites de taxa de solicitação da API

Se você precisar de uma limitação de taxa mais alta para as solicitações de API, analise o uso atual e solicite um aumento.

Item	Limites
Invalidações	10 por minuto em cada `EdgeCacheService`
Todas as chamadas que não estão no namespace `networkservices`	1.200 chamadas por minuto por projeto
*Somente leitura: `GetEdgeCache`, `ListEdgeCache`*	100 por minuto em cada projeto
Leitura/gravação: tudo no namespace `networkservices` que não estiver marcado como somente leitura	100 por minuto em cada projeto

Tempos limite do cliente

Tempo limite	Duração máxima	Código de resposta	Descrição
Maximum request duration	5 minutos	HTTP 408 (Request Timeout)	A duração máxima de uma única solicitação-resposta.
Header timeout	10 segundos	HTTP 408 (Request Timeout)	Por quanto tempo o cliente precisa enviar o conjunto completo de cabeçalhos de solicitação.

Tempos limite de origem

connectTimeout e maxAttemptsTimeout limitam o tempo que a Media CDN leva para encontrar uma resposta utilizável.

Os dois tempos limite incluem o tempo que a origem leva para retornar cabeçalhos e determinar se é necessário usar um failover ou redirecionamento. connectTimeout é aplicado de forma independente para cada tentativa de origem, enquanto maxAttemptsTimeout inclui o tempo necessário para se conectar em todas as tentativas de origem, incluindo failovers e redirecionamentos. Seguir um redirecionamento conta como uma tentativa adicional de se conectar à origem e contribui para o maxAttempts definido para a origem configurada.

Quando a Media CDN encontra uma resposta que não é de redirecionamento, como de uma origem de redirecionamento ou failover, os valores readTimeout e responseTimeout são aplicados. As origens redirecionadas usam os valores connectTimeout, readTimeout e responseTimeout configurados para o EdgeCacheOrigin que encontrou o redirecionamento.
responseTimeout e readTimeout controlam quanto tempo uma resposta transmitida pode levar. Depois que a Media CDN determina que vai usar uma resposta de upstream, nem connectTimeout nem maxAttemptsTimeout importam. Nesse momento, readTimeout e responseTimeout entram em vigor.

A CDN de mídia faz no máximo quatro tentativas de origem em todas as origens, independente do maxAttempts definido por cada EdgeCacheOrigin. O Media CDN usa o valor maxAttemptsTimeout do EdgeCacheOrigin principal. Os valores de tempo limite por tentativa (connectTimeout, readTimeout e responseTimeout) são configurados para o EdgeCacheOrigin de cada tentativa.

A tabela a seguir descreve os campos de tempo limite:

Campo	Padrão	Descrição
connectTimeout	5 segundos	O tempo máximo que a Media CDN pode levar desde o início da solicitação até a origem até que ela determine se a resposta é utilizável. Na prática, `connectTimeout` cobre o tempo desde a criação da solicitação, passando por buscas DNS, handshakes de TLS, estabelecimento de conexão TCP/QUIC até a obtenção dos cabeçalhos de resposta que contêm o código de status HTTP. O tempo limite precisa ser um valor entre 1 e 15 segundos.
maxAttemptsTimeout	15 segundos	O tempo máximo em todas as tentativas de conexão com a origem, incluindo origens de failover, antes de retornar um erro ao cliente. Um HTTP 504 será retornado se o tempo limite for atingido antes que uma resposta seja retornada. O tempo limite precisa ser um valor entre 1 e 30 segundos. Essa configuração define a duração total de todas as tentativas de conexão com a origem, incluindo origens de failover, para limitar o tempo total que os clientes precisam esperar para que o conteúdo comece a ser transmitido. Apenas o primeiro valor `maxAttemptsTimeout` é usado, em que o primeiro é definido pela origem configurada para a rota.
readTimeout	15 segundos	A duração máxima de espera entre as leituras de uma única resposta HTTP. O `readTimeout` é limitado pelo `responseTimeout`. Todas as leituras da resposta HTTP precisam ser concluídas até o prazo definido pelo `responseTimeout`. O tempo limite precisa ser um valor entre 1 e 30 segundos. Se esse tempo limite for atingido antes da conclusão da resposta, ela será truncada e registrada.
responseTimeout	30 segundos	A duração máxima permitida para a conclusão de uma resposta. O tempo limite precisa ser um valor entre 1 e 120 segundos. A duração é medida a partir do momento em que os primeiros bytes do corpo são recebidos. Se esse tempo limite for atingido antes da conclusão da resposta, ela será truncada e registrada.

Gerenciar cotas

OMedia CDN aplica cotas no uso de recursos por vários motivos. Por exemplo, as cotas protegem a comunidade de usuários Google Cloud , impedindo picos de uso inesperados. As cotas também ajudam os usuários que estão explorando o Google Cloud com o nível gratuito a permanecer na avaliação.

Todos os projetos começam com as mesmas cotas, que podem ser alteradas com uma solicitação de cota extra. Algumas cotas podem aumentar automaticamente dependendo do uso de um produto.

Permissões

Para ver cotas ou solicitar aumentos de cotas, os membros do gerenciamento de identidade e acesso (IAM, na sigla em inglês) precisam ter um dos papéis a seguir:

Tarefa	Papel necessário
Verificar cotas para um projeto	Uma das seguintes opções: Proprietário do projeto (`roles/owner`) Editor do projeto (`roles/editor`) Visualizador de cotas (`roles/servicemanagement.quotaViewer`)
Modificar cotas, solicitar cota extra	Uma das seguintes opções: Proprietário do projeto (`roles/owner`) Editor do projeto (`roles/editor`) Administrador de cotas (`roles/servicemanagement.quotaAdmin`) Um papel personalizado com a permissão `serviceusage.quotas.update`

Verificar sua cota

Console

No console Google Cloud , acesse a página Cotas.
Acesse Cotas
Para pesquisar a cota a ser atualizada, use a tabela de filtros. Se você não souber o nome da cota, use os links desta página.

gcloud

Com a Google Cloud CLI, execute o comando a seguir para verificar suas cotas. Substitua PROJECT_ID pelo seu código do projeto:

    gcloud compute project-info describe --project PROJECT_ID

Para verificar a cota utilizada em uma região, execute o comando a seguir:

    gcloud compute regions describe example-region

Erros ao exceder a cota

Se você exceder uma cota com um comando gcloud, o gcloud emitirá uma mensagem de erro quota exceeded e retornará com o código de saída 1.

Se você exceder uma cota com uma solicitação de API, Google Cloud vai retornar o seguinte código de status HTTP: 413 Request Entity Too Large.

Solicitar cota adicional

Para ajustar a maioria das cotas, use o console Google Cloud . Para mais informações, consulte Solicitar um ajuste de cota.

Disponibilidade de recursos

Cada cota representa um número máximo para um tipo específico de recurso que é possível criar, desde que o recurso esteja disponível. É importante observar que as cotas não garantem a disponibilidade de recursos. Mesmo que você tenha cota disponível, não será possível criar um novo recurso se ele não estiver disponível.

Por exemplo, você pode ter cota suficiente para criar um novo endereço IP externo regional em uma determinada região. No entanto, isso não é possível se não houver endereços IP externos disponíveis naquela região. A disponibilidade de recursos zonais também pode afetar sua capacidade de criar um novo recurso.

São raras as situações em que os recursos não estão disponíveis em uma região inteira. No entanto, os recursos dentro de uma zona podem ser usados periodicamente, normalmente sem impacto no contrato de nível de serviço (SLA) para o tipo de recurso. Para mais informações, leia o SLA relevante do recurso.

Cotas e limites Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.