En esta página se detallan los límites y las cuotas de uso que se aplican al usar Cloud Run.
El número de recursos de Cloud Run está limitado. Las cuotas de Cloud Run incluyen límites de frecuencia de API, que afectan a la frecuencia con la que puedes llamar a la API Admin de Cloud Run.
No se aplica ningún límite directo respecto a lo siguiente:
- El tamaño de las imágenes de contenedor que puedes desplegar.
- El número de solicitudes simultáneas que atiende un servicio de Cloud Run.
Límites de recursos de Cloud Run
Para superar los límites que se pueden aumentar, solicita un aumento de cuota. Para superar los límites por proyecto que no se pueden aumentar, crea recursos en otro proyecto o región. Google Cloud
Recurso | Ámbito | Descripción | Límite | Posibilidad de aumento |
---|---|---|---|---|
Servicio | por proyecto y región | Número máximo de servicios | 1000 | No |
Tarea | por proyecto y región | Número máximo de trabajos | 1000 | No |
Ejecución de tareas | por proyecto y región | Número máximo de ejecuciones de trabajos en curso | 1000 | No |
Revisión | Por servicio | Número máximo de revisiones por servicio. Cuando se alcance este límite, las revisiones que no sirvan tráfico se eliminarán automáticamente según el orden del historial | 1000 | No |
Revisión | por proyecto y región | Número máximo de revisiones sirviendo tráfico | 4000 | No |
Etiqueta de revisión | por proyecto y región | Número máximo de etiquetas de revisión. Cuando se supera el límite de etiquetas de revisión, Cloud Run ejecuta una limpieza de etiquetas en el servicio. En el servicio para el que se está creando una etiqueta, las etiquetas que no tengan un porcentaje de tráfico especificado se eliminarán automáticamente según el orden del historial. | 2000 | No |
Ejecución de tareas | por trabajo | Límite de conservación de las ejecuciones de trabajos completadas. Cuando el número de ejecuciones completadas de un trabajo alcance este límite, las ejecuciones se eliminarán automáticamente según el orden del historial | 1000 | No |
Tarea de ejecución de trabajo1 | por ejecución de tarea | Número máximo de tareas que se ejecutan en paralelo | Depende de la región seleccionada y de las configuraciones de CPU y memoria. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
Tarea de ejecución de trabajos | por ejecución de tarea | Valor de tiempo de espera máximo de las tareas | 168 horas (7 días)2 | No |
Tarea de ejecución de trabajos | por ejecución de tarea | Número máximo de tareas en un solo trabajo | 10.000 | No |
Tarea de ejecución de trabajos | por ejecución de tarea | Número máximo de reintentos de tareas en un trabajo | 10 | No |
Variables de entorno | por trabajo o por servicio | Número máximo de variables de entorno por contenedor | 1000 | No |
Argumentos de comandos | por trabajo o por servicio | Número máximo de argumentos de comando por contenedor | 1000 | No |
Instancia de contenedor1 | por revisión | Número máximo de instancias de contenedor | Depende de la región seleccionada y de las configuraciones de CPU y memoria. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. De forma predeterminada, las revisiones de Cloud Run se configuran para escalar hasta un máximo de 100 instancias. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
Instancia de contenedor1 | por proyecto y región | Número máximo de instancias de contenedor de todas las ejecuciones de trabajos en curso | Depende de la región seleccionada y de las configuraciones de CPU y memoria. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
Instancia de contenedor3 | por revisión y región | Número máximo de instancias de contenedor que usan la salida de VPC directa | Entre 100 y 200, en función de las configuraciones de región seleccionadas. | Sí |
Instancia de contenedor | Por instancia de contenedor | Tiempo de espera de inicio, en minutos | 4 | No |
Memoria | Por instancia de contenedor | Tamaño máximo de la memoria, en GiB | 32 | No |
CPU | Por instancia de contenedor | Número máximo de vCPU | 8 | No |
CPU1 | por proyecto y región | CPU total máxima, en milivCPUs, asignada a todas las instancias durante un periodo de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. | Sí |
Memoria1 | por proyecto y región | Memoria total máxima, en bytes, asignada en todas las instancias durante un periodo de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. Puedes ver tu cuota en la página de la consola Cuotas y límites del sistema. | Sí |
Instancia de GPU sin garantía de redundancia zonal1, 4 | por proyecto y región | Número máximo de instancias de contenedor con GPU | 04 | Sí |
Instancia de GPU con garantía de redundancia zonal1, 4 | por proyecto y región | Número máximo de instancias de contenedor con GPU | 04 | Sí |
Disco | Por instancia de contenedor | Número máximo de sistemas de archivos editables en memoria, limitados por la memoria de la instancia, en GiB | 32 | No |
Variable de entorno | Por variable | Longitud variable máxima, en kB | 32 | No |
Asignación de dominios | Por dominio superior y semana | Número máximo de certificados SSL | 50 | No |
Asignación de dominios | Por dominio superior y semana | Número máximo de certificados SSL duplicados | 5 | No |
Token de acceso | Por instancia de contenedor por segundo | Número máximo de tokens de acceso únicos generados | 50 | No |
Token de identidad | Por instancia de contenedor por segundo | Número máximo de tokens de identidad únicos generados | 50 | No |
Archivos abiertos | Por instancia de contenedor | Número máximo de archivos que se pueden abrir al mismo tiempo. Corresponde a /proc/sys/fs/file-max . |
25000 | No |
1Estas cuotas regionales se usan en algunos casos en los que cada una controla lo siguiente:
El valor máximo que se puede elegir para el atributo maximum instance de una revisión. Una vez que se concede en una región determinada, todas las revisiones de esa región pueden alcanzar el límite concedido.
El paralelismo máximo de un trabajo. Una vez que se concede en una región determinada, todos los trabajos de esa región pueden alcanzar el límite concedido.
Número total de instancias de contenedor para ejecutar trabajos en una región.
2La compatibilidad con tiempos de espera superiores a 24 horas está disponible en la vista previa.
3Esta cuota regional se usa en algunos casos:
Controla el valor máximo que se puede elegir para el atributo maximum instance de una revisión que usa la salida de VPC directa. Una vez que se concede en una región determinada, todas las revisiones de esa región pueden alcanzar el límite concedido.
Controla el paralelismo máximo de un trabajo que usa la salida directa de VPC. Una vez que se concede en una región determinada, todos los trabajos de esa región pueden alcanzar el límite concedido.
4 Para acceder a la GPU, debes solicitar un aumento de la cuota NvidiaL4GpuAllocPerProjectRegion o NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Si el uso máximo de GPU no se acerca a tu cuota, Google podría reducirla.
Límites de redes de Cloud Run
Límites de solicitudes de Cloud Run
Descripción | Límite | Notas |
---|---|---|
Número máximo de solicitudes simultáneas por instancia | 1000 | |
Número máximo de transmisiones simultáneas por conexión de cliente HTTP/2 | 100 | |
Tiempo máximo antes de que finalice el tiempo de espera por solicitud | 60 minutos | |
Tamaño máximo de solicitud HTTP/1 | 32 MiB si se usa un servidor HTTP/1. No hay límite si se usa un servidor HTTP/2. | |
Tamaño máximo de respuesta HTTP/1 | 32 MiB si no se usan Transfer-Encoding: chunked ni mecanismos de streaming |
|
Conexiones salientes por segundo por instancia | 700 | No se aplica al tráfico de salida de VPC directa enviado a la red de VPC, que no está limitado. |
Resoluciones de DNS salientes por segundo por instancia | 1000 | |
Solicitudes entrantes por segundo a un puerto de contenedor HTTP/1 por instancia | 800 | No se aplica a los puertos de contenedor HTTP/2. |
Límites de ancho de banda de Cloud Run
Se aplican los siguientes límites de ancho de banda a las instancias de Cloud Run:
Descripción | Límite | Notas |
---|---|---|
Número máximo de bits por instancia para el tráfico de salida a través de VPC directa | 1 Gb/s | Salida a través de la salida de VPC directa a destinos de la red de VPC. |
Número máximo de bits por instancia, sin incluir la salida a través de Direct VPC | 600 Mbps | Se basa en la suma de los bits de entrada y salida, sin incluir la salida a través de la salida de VPC directa a destinos de la red de VPC. |
Frecuencia máxima total de paquetes por instancia, sin incluir la salida a través de Direct VPC | 64.000 paquetes por segundo | Se basa en la suma de los paquetes de entrada y salida, sin incluir la salida a través de la salida de VPC directa a destinos de la red de VPC. |
Si se alcanza alguno de los dos límites, la instancia de Cloud Run tendrá un ancho de banda limitado.
Límites de frecuencia de la API Admin de Cloud Run
Los siguientes límites de frecuencia se aplican a la API Admin de Cloud Run, pero no a las solicitudes que reciben tus servicios de Cloud Run desplegados.
Cuota | Descripción | Límite | Posibilidad de aumento | Ámbito |
---|---|---|---|---|
Solicitudes de lectura de la API Admin de Cloud Run | Número de lecturas de la API cada 60 segundos por región. No representa el número de solicitudes de lectura que reciben tus servicios de Cloud Run, que es ilimitado. | 3000 cada 60 segundos | Sí | por proyecto y región |
Solicitudes de escritura de la API Admin de Cloud Run | Número de escrituras de la API cada 60 segundos por región. No representa el número de solicitudes de escritura que reciben tus servicios de Cloud Run, que es ilimitado. | 180 cada 60 segundos | Sí | por proyecto y región |
Ejecución de la tarea | Número máximo de veces que se puede ejecutar un trabajo por región cada 60 segundos. | 180 cada 60 segundos | Sí | por proyecto y región |
Aumentar las cuotas
Las solicitudes de ajuste de cuotas de Cloud están sujetas a revisión. Si tu solicitud de ajuste de cuota requiere una revisión, recibirás un correo en el que se te confirmará que la hemos recibido. Si necesitas más ayuda, responde al correo. Después de revisar tu solicitud, recibirás una notificación por correo electrónico en la que se indicará si se ha aprobado.
Consola
Para ajustar un valor de cuota, sigue estos pasos:
En la Google Cloud consola, ve a la página IAM y administración > Cuotas y límites del sistema:
Busca el valor de la cuota que quieras actualizar en la columna Cuota y selecciona la casilla situada junto a la cuota que quieras actualizar.
Si es necesario, usa el cuadro de búsqueda Filtrar para buscar tu cuota.
Haga clic en
Editar y aparecerá el cuadro de diálogo Cambios en la cuota.En el campo Valor nuevo, introduce el valor de cuota que quieras. Algunos valores de cuota tienen una unidad de medida. Si es el caso, selecciona la unidad que quieras en la lista adyacente. Haz clic en Listo.
Opcional: Si ves una casilla con el texto
I understand that this request will remove any overrides
, significa que, si ajustas el valor de la cuota a un número igual o superior al predeterminado, se eliminará la anulación de cuota anterior. Si es lo que quieres, selecciona la casilla y continúa.Para aumentar el valor de la cuota por encima del número indicado en el cuadro de diálogo, seleccione Solicitar una cuota superior.
En el formulario Cambios en la cuota, introduce el valor de cuota actualizado que quieras en el campo Valor nuevo. Si aparece el campo Descripción de la solicitud, introduce una descripción. Por último, haz clic en Listo.
Si aparece el botón Siguiente, haz clic en él y rellena tus datos de contacto en la pantalla siguiente.
Haz clic en Enviar solicitud.
Si no puedes solicitar un ajuste desde la consola, solicita el aumento a Customer Care de Cloud.
Para obtener más información sobre cómo funciona el proceso de aumento de cuota, consulta Acerca de los ajustes de cuota.
Organizar solicitudes por lotes para obtener valores de cuota más altos
Puede agrupar solicitudes para aumentar la cuota marcando la casilla situada junto a cada cuota que quiera incluir. Sin embargo, agrupar solicitudes puede aumentar el tiempo que tarda Google Cloud en revisar tu solicitud.
Para reducir el tiempo de revisión, agrupa las solicitudes de ajuste de cuota por producto y área. Por ejemplo, si quieres solicitar ajustes en las cuotas de redes y de máquinas virtuales de Compute Engine, crea una solicitud para las cuotas de redes y otra para las cuotas de máquinas virtuales de Compute Engine.