Cuotas
En este documento se describen los límites de las cuotas de Cloud Run Functions.
Las cuotas de Cloud Run Functions abarcan cuatro áreas:
Límites de recursos
Afectan a la cantidad total de recursos que pueden consumir tus funciones.
Límites de tiempo
Afectan a la cantidad de tiempo durante el cual pueden ejecutarse las funciones.
Límites de frecuencia
Afectan a la frecuencia con la que puedes llamar a la API de funciones de Cloud Run para gestionar tus funciones.
Límites de redes
Estos límites afectan a las conexiones salientes y a las instancias.
A continuación, se describen en profundidad todos los tipos de límites. Cuando proceda, se indicarán las diferencias entre los límites de Cloud Run Functions (1.ª gen.) y Cloud Run Functions (2.ª gen.).
Límites de recursos
Los límites de recursos afectan a la cantidad total de recursos que pueden consumir tus funciones. El ámbito regional es por proyecto y cada proyecto mantiene sus propios límites.
Cuota | Descripción | Límite (1.ª gen.) | Limit (2.ª gen.) | Posibilidad de aumento | Permiso |
---|---|---|---|---|---|
Número de funciones | Número total de funciones que se pueden desplegar por región | 1000 | 1000 menos el número de servicios de Cloud Run desplegados | No | Por región |
Tamaño máximo de despliegue | Tamaño máximo del despliegue de una sola función | 100 MB (comprimido) para fuentes 500 MB (sin comprimir) para fuentes y módulos |
N/A | No | Por función |
Tamaño máximo de solicitud HTTP sin comprimir | Datos que se envían a funciones HTTP en una solicitud HTTP | 10 MB | 32 MB | No | Por invocación |
Tamaño máximo de respuesta HTTP sin comprimir | Datos que se envían desde funciones HTTP en una respuesta HTTP | 10 MB | 10 MB para respuestas graduales. 32 MB para respuestas que no son de streaming. |
No | Por invocación |
Tamaño máximo de evento en funciones basadas en eventos | Datos que se envían en eventos a funciones en segundo plano | 10 MB | 512 KB para eventos de Eventarc. 10 MB para eventos antiguos. |
No | Por evento |
Memoria máxima de una función | Cantidad de memoria que puede usar cada instancia de función | 8 GiB | 32 GiB | No | Por función |
Memoria máxima de un proyecto | Cantidad de memoria, en bytes, que puede usar un proyecto. Se mide mediante la suma total de la memoria solicitada por los usuarios en las instancias de funciones durante un periodo de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. | N/A | Sí | por proyecto y región |
CPU máxima del proyecto | Cantidad de CPU, en milivCPU, que puede usar un proyecto. Se mide mediante la suma total de la CPU solicitada por los usuarios en todas las instancias de la función durante un periodo de 1 minuto. | Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. | N/A | Sí | por proyecto y región |
Límites de tiempo
Cuota | Descripción | Límite (1.ª gen.) | Limit (2.ª gen.) | Posibilidad de aumento | Permiso |
---|---|---|---|---|---|
Duración máxima de una función | Cantidad máxima de tiempo durante el cual puede ejecutarse una función antes de que se fuerce su detención | 540 segundos | 60 minutos para las funciones HTTP. 60 minutos para funciones basadas en eventos. |
No | Por invocación |
Límites de frecuencia
Cuota | Descripción | Límite (1.ª gen.) | Limit (2.ª gen.) | Posibilidad de aumento | Permiso |
---|---|---|---|---|---|
Llamadas a la API (función "READ") | Llamadas para describir o mostrar funciones a través de la API de Cloud Run functions | 5000 por cada 100 segundos | 1200 cada 60 segundos | Solo para la 1.ª gen. | por proyecto (1.ª gen.) por región (2.ª gen.) |
Llamadas a la API (función "WRITE") | Llamadas para desplegar o eliminar funciones a través de la API de Cloud Run Functions | 80 por cada 100 segundos | 60 cada 60 segundos | No1 | por proyecto (1.ª gen.) por región (2.ª gen.) |
Llamadas a la API (función "CALL") | Llamadas a la API "CALL" | 16 por cada 100 segundos | N/A | No2 | Por proyecto |
Límites de redes
Para obtener información sobre los límites de solicitudes y ancho de banda de las redes de las funciones de Cloud Run (2.ª gen.), consulta Límites de redes.
Los siguientes límites de redes se aplican a las funciones de Cloud Run (1.ª gen.):
- Conexiones salientes por segundo por instancia: 500 (no se puede aumentar)
- Resoluciones de DNS salientes por segundo por instancia: 100 (no se puede aumentar)
- Número máximo de paquetes por segundo y por instancia: 80.000
- Número máximo de bits por segundo por instancia: 100.000.000
Escalabilidad
Las funciones de Cloud Run que se invoquen mediante HTTP se escalan rápidamente para gestionar el tráfico entrante, mientras que las funciones en segundo plano se escalan de forma más gradual. La capacidad de escalar de forma vertical de una función depende de factores como los siguientes:
- El tiempo que tarda una función en ejecutarse (normalmente, las que tardan poco se pueden escalar para gestionar más solicitudes simultáneas)
- El tiempo que tarda una función en inicializarse con un arranque en frío
- La tasa de errores de la función.
Factores transitorios, como la carga regional y la capacidad del centro de datos.
Tu configuración, definida por el número mínimo de instancias, el número máximo de instancias y la simultaneidad (la simultaneidad solo está disponible en la segunda generación).
Cuotas de las funciones en segundo plano
Cuota | Descripción | Límite | Posibilidad de aumento | Ámbito | Versión del producto |
---|---|---|---|---|---|
Número máximo de invocaciones simultáneas | Número máximo de invocaciones simultáneas de una función concreta Ejemplo: si se tarda 100 segundos en procesar cada evento, la frecuencia de invocación se limitará a 30 por segundo (de media). |
3000 | Sí | Por función | Solo 1.ª gen. |
Frecuencia de invocación máxima | Frecuencia máxima de eventos que una sola función puede gestionar Ejemplo: si se tarda 100 ms en procesar un evento, la frecuencia de invocación se limitará a 1000 por segundo aunque solo se procesen 100 solicitudes (de media) en paralelo. |
1000 por segundo | No | Por función | Solo 1.ª gen. |
Tamaño máximo de los datos de los eventos simultáneos | Tamaño total máximo de los eventos de entrada de las invocaciones simultáneas de una función determinada Ejemplo: si los eventos tienen un tamaño de 1 MB y tardan 10 segundos en procesarse, la frecuencia de procesamiento media será de 1 evento por segundo, ya que el undécimo evento no se procesará hasta que uno de los 10 primeros termine. |
10 MB | No | Por función | 1.ª y 2.ª gen. |
Rendimiento máximo de los eventos de entrada | Rendimiento máximo de los eventos entrantes con respecto a una sola función Ejemplo: si los eventos tienen un tamaño de 1 MB, la frecuencia de invocación puede ser de un máximo de 10 por segundo, aunque las funciones tarden 100 ms en procesarse. |
10 MB por segundo | No | Por función | 1.ª y 2.ª gen. |
Si alcanzas el límite de una cuota
Cuando una función consume la totalidad de un recurso que tenga asignado, este deja de estar disponible hasta que la cuota correspondiente se actualiza o se aumenta; por tanto, es posible que tu función o el resto de las funciones del proyecto no estén disponibles hasta entonces. Cuando esto ocurre, las funciones devuelven el código de error HTTP 500.
Si necesitas aumentar tus cuotas por encima de los valores predeterminados que se describen en este documento, ve a la página Cuotas de funciones de Cloud Run y selecciona las que quieres modificar. A continuación, haz clic en Editar cuotas, indica tu información de usuario si el sistema te lo pide e introduce el nuevo límite para cada cuota.