Cuotas y límites

En este documento se indican las cuotas y los límites del sistema que se aplican a Media CDN.

  • Las cuotas especifican la cantidad de un recurso compartido y contable que puedes usar. Las cuotas se definen por Google Cloud servicios como Media CDN.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.

El sistema de cuotas de Cloud hace lo siguiente:

En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.

Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También hay límites del sistema en los recursos de Media CDN. Los límites del sistema no se pueden cambiar.

Límites

A continuación se muestran los límites que se aplican a Media CDN.

Configuración

Elemento Límites Notas
Número máximo de EdgeCacheService 20 por proyecto Ponte en contacto con tu Google Cloud equipo de ventas si necesitas aumentar este límite.
Número máximo de EdgeCacheOrigin 30 por proyecto Ponte en contacto con tu Google Cloud equipo de ventas si necesitas aumentar este límite.
Número máximo de EdgeCacheKeyset 10 por proyecto Ponte en contacto con tu Google Cloud equipo de Ventas si necesitas aumentar este límite.
Número máximo de RouteRules por EdgeCacheService 2000

Cada EdgeCacheService puede definir hasta 10 PathMatchers y cada PathMatcher puede definir hasta 200 RouteRules.

Este límite no se puede aumentar.

Número máximo de certificados SSL por servicio 5 Este límite no se puede aumentar. Consulta también la cuota por proyecto de certificados SSL.
Número máximo de claves públicas por EdgeCacheKeyset 3 Este límite no se puede aumentar. Se han diseñado varias claves en un conjunto de claves para permitir la rotación de claves: debes eliminar las claves antiguas y sin usar con el tiempo.
Número máximo de claves compartidas de validación por EdgeCacheKeyset 3 Este límite no se puede aumentar. Se han diseñado varias claves en un conjunto de claves para permitir la rotación de claves: debes eliminar las claves antiguas y sin usar con el tiempo.

Encabezados, solicitudes y respuestas HTTP

Elemento Límites Notas
Tamaño máximo del encabezado de solicitud Aprox. 11 KiB Este límite no se puede aumentar.

El tamaño combinado de la URL y del encabezado de la solicitud no puede superar los 15 KiB.

Las solicitudes se rechazan con una respuesta HTTP 431 para las conexiones HTTP/1.1.

Las conexiones HTTP/2 se cierran sin que se escriba un código de respuesta.

Estas solicitudes se registran con un statusDetails de headers_too_long si el registro está habilitado.

Tamaño máximo del cuerpo de la solicitud 16 KiB Las solicitudes con un cuerpo que supere este límite se rechazan con un código de estado HTTP 413 Content Too Large.
Tamaño máximo del encabezado de respuesta Aprox. 128 KiB Este límite no se puede aumentar.

Las respuestas de origen con encabezados que superen este límite darán como resultado el envío de un error HTTP 502 al cliente. Se registran con un statusDetails de backend_response_headers_too_long, si el registro está habilitado.

Tamaño máximo de objeto que se puede almacenar en caché 100 GiB Este límite no se puede aumentar.

Es el tamaño máximo de los objetos del origen que Media CDN puede almacenar en caché. Los objetos más grandes se tratan como no almacenables en caché.

Tamaño máximo de respuesta no almacenable en caché 500 MiB Este límite no se puede aumentar.

Es el número máximo de bytes del cuerpo de una respuesta que Media CDN proxyiza cuando un objeto no se puede almacenar en caché. Las respuestas que no se pueden almacenar en caché se truncan cuando alcanzan el límite.

Conversión a letras minúsculas en los encabezados Siempre, en Media CDN Media CDN sigue las convenciones de HTTP/2 en lo que respecta al uso de mayúsculas y minúsculas en los encabezados de solicitud y respuesta.

Independientemente del protocolo utilizado, todos los encabezados se convierten a minúsculas.

Por ejemplo, Host se convierte en host y Keep-Alive se convierte en keep-alive.

No se cambia el uso de mayúsculas y minúsculas de los valores de los encabezados.

Límites de frecuencia de solicitudes a la API

Si necesitas un límite de frecuencia mayor para las solicitudes a APIs, puedes consultar el uso actual y solicitar un aumento.

Elemento Límites
Invalidaciones 10 por minuto y EdgeCacheService
Todas las llamadas que no estén en el espacio de nombres networkservices 1200 llamadas por minuto y proyecto
Solo lectura: GetEdgeCache*, ListEdgeCache* 100 por minuto y proyecto
Lectura y escritura: todo lo que esté en el espacio de nombres networkservices y no esté marcado como de solo lectura 100 por minuto y proyecto

Tiempo de espera del cliente

Tiempo de espera Duración máxima Código de respuesta Descripción
Maximum request duration 5 minutos HTTP 408 (Request Timeout) Duración máxima de una sola solicitud-respuesta.
Header timeout 10 segundos HTTP 408 (Request Timeout) Tiempo que tiene el cliente para enviar el conjunto completo de encabezados de solicitud.

Tiempos de espera de origen

  • connectTimeout y maxAttemptsTimeout limitan el tiempo que tarda Media CDN en encontrar una respuesta útil.

    Ambos tiempos de espera incluyen el tiempo que tarda el origen en devolver las cabeceras y en determinar si se debe usar una conmutación por error o una redirección. connectTimeout se aplica de forma independiente a cada intento de origen, mientras que maxAttemptsTimeout incluye el tiempo necesario para conectarse en todos los intentos de origen, incluidas las conmutaciones por error y las redirecciones. Seguir una redirección cuenta como un intento adicional de conectarse al origen y se tiene en cuenta para el maxAttempts definido para el origen configurado.

    Cuando Media CDN recibe una respuesta que no es una redirección, como la de un origen de redirección o de failover, se aplican los valores readTimeout y responseTimeout. Los orígenes redirigidos usan los valores connectTimeout, readTimeout y responseTimeout configurados para el EdgeCacheOrigin que ha encontrado la redirección.

  • responseTimeout y readTimeout controlan cuánto tiempo puede tardar una respuesta transmitida. Una vez que Media CDN determina que va a usar una respuesta upstream, ni connectTimeout ni maxAttemptsTimeout importan. En este punto, se aplican readTimeout y responseTimeout.

Media CDN hace como máximo cuatro intentos de origen en todos los orígenes, independientemente del maxAttempts definido por cada EdgeCacheOrigin. Media CDN usa el valor maxAttemptsTimeout del primario EdgeCacheOrigin. Los valores de tiempo de espera por intento (connectTimeout, readTimeout y responseTimeout) se configuran para el EdgeCacheOrigin de cada intento.

En la siguiente tabla se describen los campos de tiempo de espera:

Campo Predeterminado Descripción
connectTimeout 5 segundos

El tiempo máximo que puede tardar Media CDN desde que se inicia la solicitud al origen hasta que Media CDN determina si la respuesta se puede usar. En la práctica, connectTimeout abarca el tiempo que transcurre desde que se crea la solicitud hasta que se obtienen los encabezados de respuesta que contienen el código de estado HTTP, pasando por las búsquedas de DNS, los handshakes TLS y el establecimiento de la conexión TCP/QUIC.

El tiempo de espera debe ser un valor entre 1 y 15 segundos.

maxAttemptsTimeout 15 segundos

Tiempo máximo de todos los intentos de conexión al origen, incluidos los orígenes de conmutación por error, antes de devolver un error al cliente. Se devuelve un error HTTP 504 si se alcanza el tiempo de espera antes de que se devuelva una respuesta.

El tiempo de espera debe ser un valor entre 1 y 30 segundos.

Este ajuste define la duración total de todos los intentos de conexión de origen, incluidos los orígenes de conmutación por error, para limitar el tiempo total que tienen que esperar los clientes para que empiece a transmitirse el contenido. Solo se usa el primer valor de maxAttemptsTimeout, donde first se define mediante el origen configurado para la ruta en cuestión.

readTimeout 15 segundos

Duración máxima que se espera entre lecturas de una única respuesta HTTP. El readTimeout está limitado por el responseTimeout. Todas las lecturas de la respuesta HTTP deben completarse antes de la fecha límite establecida por el responseTimeout. El tiempo de espera debe ser un valor entre 1 y 30 segundos. Si se alcanza este tiempo de espera antes de que se complete la respuesta, esta se trunca y se registra.

responseTimeout 30 segundos

Duración máxima que se permite para completar una respuesta.

El tiempo de espera debe ser un valor entre 1 segundo y 120 segundos.

La duración se mide desde el momento en que se reciben los primeros bytes del cuerpo. Si se alcanza este tiempo de espera antes de que se complete la respuesta, esta se trunca y se registra.

Gestionar cuotas

EnMedia CDN se aplican cuotas al uso de recursos por varios motivos. Por ejemplo, las cuotas protegen a la comunidad de usuarios de Google Cloud al evitar que se produzcan picos de uso imprevistos. Las cuotas también ayudan a los usuarios que están explorando Google Cloud con el nivel gratuito a mantenerse dentro de su prueba.

Todos los proyectos comienzan con las mismas cuotas, pero puedes solicitar un aumento para cambiarlas. Hay cuotas que pueden aumentar automáticamente en función del uso que hagas de un producto.

Permisos

Para ver las cuotas o solicitar un aumento de estas, las principales de Gestión de Identidades y Accesos (IAM) necesitan uno de los siguientes roles.

Tarea Rol necesario
Consultar las cuotas de un proyecto Una de las siguientes:
Modificar cuotas y solicitar un aumento de cuotas Una de las siguientes:

Consultar tu cuota

Consola

  1. En la Google Cloud consola, ve a la página Cuotas.

    Ir a Cuotas

  2. Para buscar la cuota que quieras actualizar, usa la opción Filtrar tabla. Si no conoces su nombre, usa los enlaces de esta página.

gcloud

En la CLI de Google Cloud, ejecuta el comando que aparece a continuación para comprobar las cuotas. Tienes que sustituir PROJECT_ID por el ID de tu proyecto.

    gcloud compute project-info describe --project PROJECT_ID

Para ver la cuota que has utilizado en una región, ejecuta el siguiente comando:

    gcloud compute regions describe example-region
    

Errores al superar tu cuota

Si superas tu cuota con un comando gcloud, gcloud genera un mensaje de error quota exceeded y muestra el código de salida 1.

Si superas tu cuota con una solicitud a la API, Google Cloud devuelve el siguiente código de estado HTTP: 413 Request Entity Too Large.

Solicitar cuota adicional

Para ajustar la mayoría de las cuotas, usa la Google Cloud consola. Para obtener más información, consulta Solicitar un ajuste de cuota.

Disponibilidad de recursos

Cada cuota representa el número máximo de un tipo de recurso concreto que puedes crear, siempre que ese recurso esté disponible. Es importante tener en cuenta que las cuotas no aseguran la disponibilidad de recursos. Aunque dispongas de una cuota, no podrás crear un nuevo recurso si este no está disponible.

Por ejemplo, puede que tengas una cuota suficiente para crear una nueva dirección IP externa regional en una región determinada. Sin embargo, esto no es posible si no hay direcciones IP externas disponibles en esa región. La disponibilidad de recursos de zona también puede afectar a tu capacidad para crear recursos nuevos.

No es habitual que falte disponibilidad de recursos en toda una región. Sin embargo, los recursos dentro de una zona pueden agotarse ocasionalmente, aunque no suele afectar al acuerdo de nivel de servicio (SLA) para el tipo de recurso. Para obtener más información, revisa el acuerdo de nivel de servicio relevante para el recurso.