Cuotas

En este documento se describen los límites de las cuotas de Cloud Run Functions.

Las cuotas de Cloud Run Functions abarcan cuatro áreas:

Límites de recursos

Afectan a la cantidad total de recursos que pueden consumir tus funciones.
Límites de tiempo

Afectan a la cantidad de tiempo durante el cual pueden ejecutarse las funciones.
Límites de frecuencia

Afectan a la frecuencia con la que puedes llamar a la API de funciones de Cloud Run para gestionar tus funciones.
Límites de redes

Estos límites afectan a las conexiones salientes y a las instancias.

A continuación, se describen en profundidad todos los tipos de límites. Cuando proceda, se indicarán las diferencias entre los límites de Cloud Run Functions (1.ª gen.) y Cloud Run Functions (2.ª gen.).

Límites de recursos

Los límites de recursos afectan a la cantidad total de recursos que pueden consumir tus funciones. El ámbito regional es por proyecto y cada proyecto mantiene sus propios límites.

Cuota	Descripción	Límite (1.ª gen.)	Limit (2.ª gen.)	Posibilidad de aumento	Permiso
Número de funciones	Número total de funciones que se pueden desplegar por región	1000	1000 menos el número de servicios de Cloud Run desplegados	No	Por región
Tamaño máximo de despliegue	Tamaño máximo del despliegue de una sola función	100 MB (comprimido) para fuentes 500 MB (sin comprimir) para fuentes y módulos	N/A	No	Por función
Tamaño máximo de solicitud HTTP sin comprimir	Datos que se envían a funciones HTTP en una solicitud HTTP	10 MB	32 MB	No	Por invocación
Tamaño máximo de respuesta HTTP sin comprimir	Datos que se envían desde funciones HTTP en una respuesta HTTP	10 MB	10 MB para respuestas graduales. 32 MB para respuestas que no son de streaming.	No	Por invocación
Tamaño máximo de evento en funciones basadas en eventos	Datos que se envían en eventos a funciones en segundo plano	10 MB	512 KB para eventos de Eventarc. 10 MB para eventos antiguos.	No	Por evento
Memoria máxima de una función	Cantidad de memoria que puede usar cada instancia de función	8 GiB	32 GiB	No	Por función
Memoria máxima de un proyecto	Cantidad de memoria, en bytes, que puede usar un proyecto. Se mide mediante la suma total de la memoria solicitada por los usuarios en las instancias de funciones durante un periodo de 1 minuto.	Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente.	N/A	Sí	por proyecto y región
CPU máxima del proyecto	Cantidad de CPU, en milivCPU, que puede usar un proyecto. Se mide mediante la suma total de la CPU solicitada por los usuarios en todas las instancias de la función durante un periodo de 1 minuto.	Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente.	N/A	Sí	por proyecto y región

Límites de tiempo

Cuota	Descripción	Límite (1.ª gen.)	Limit (2.ª gen.)	Posibilidad de aumento	Permiso
Duración máxima de una función	Cantidad máxima de tiempo durante el cual puede ejecutarse una función antes de que se fuerce su detención	540 segundos	60 minutos para las funciones HTTP. 60 minutos para funciones basadas en eventos.	No	Por invocación

Límites de frecuencia

Cuota	Descripción	Límite (1.ª gen.)	Limit (2.ª gen.)	Posibilidad de aumento	Permiso
Llamadas a la API (función "READ")	Llamadas para describir o mostrar funciones a través de la API de Cloud Run functions	5000 por cada 100 segundos	1200 cada 60 segundos	Solo para la 1.ª gen.	por proyecto (1.ª gen.) por región (2.ª gen.)
Llamadas a la API (función "WRITE")	Llamadas para desplegar o eliminar funciones a través de la API de Cloud Run Functions	80 por cada 100 segundos	60 cada 60 segundos	No¹	por proyecto (1.ª gen.) por región (2.ª gen.)
Llamadas a la API (función "CALL")	Llamadas a la API "CALL"	16 por cada 100 segundos	N/A	No²	Por proyecto

Límites de redes

Para obtener información sobre los límites de solicitudes y ancho de banda de las redes de las funciones de Cloud Run (2.ª gen.), consulta Límites de redes.

Los siguientes límites de redes se aplican a las funciones de Cloud Run (1.ª gen.):

Conexiones salientes por segundo por instancia: 500 (no se puede aumentar)
Resoluciones de DNS salientes por segundo por instancia: 100 (no se puede aumentar)
Número máximo de paquetes por segundo y por instancia: 80.000
Número máximo de bits por segundo por instancia: 100.000.000

Escalabilidad

Las funciones de Cloud Run que se invoquen mediante HTTP se escalan rápidamente para gestionar el tráfico entrante, mientras que las funciones en segundo plano se escalan de forma más gradual. La capacidad de escalar de forma vertical de una función depende de factores como los siguientes:

El tiempo que tarda una función en ejecutarse (normalmente, las que tardan poco se pueden escalar para gestionar más solicitudes simultáneas)
El tiempo que tarda una función en inicializarse con un arranque en frío
La tasa de errores de la función.
Factores transitorios, como la carga regional y la capacidad del centro de datos.
Tu configuración, definida por el número mínimo de instancias, el número máximo de instancias y la simultaneidad (la simultaneidad solo está disponible en la segunda generación).

Las funciones en segundo plano tienen otros límites, tal como se indica más adelante. Estos límites no se aplican a las funciones de HTTP de 1.ª gen. El límite máximo de instancias predeterminado de las funciones HTTP de segunda generación es 100 y se puede aumentar a 1000. No hay un límite máximo predeterminado de instancias para las funciones HTTP de primera generación. Para evitar eventos de escalado ilimitados con funciones HTTP de 1.ª gen., te recomendamos que establezcas un límite, por ejemplo, 3000.

Cuotas de las funciones en segundo plano

Cuota	Descripción	Límite	Posibilidad de aumento	Ámbito	Versión del producto
Número máximo de invocaciones simultáneas	Número máximo de invocaciones simultáneas de una función concreta Ejemplo: si se tarda 100 segundos en procesar cada evento, la frecuencia de invocación se limitará a 30 por segundo (de media).	3000	Sí	Por función	Solo 1.ª gen.
Frecuencia de invocación máxima	Frecuencia máxima de eventos que una sola función puede gestionar Ejemplo: si se tarda 100 ms en procesar un evento, la frecuencia de invocación se limitará a 1000 por segundo aunque solo se procesen 100 solicitudes (de media) en paralelo.	1000 por segundo	No	Por función	Solo 1.ª gen.
Tamaño máximo de los datos de los eventos simultáneos	Tamaño total máximo de los eventos de entrada de las invocaciones simultáneas de una función determinada Ejemplo: si los eventos tienen un tamaño de 1 MB y tardan 10 segundos en procesarse, la frecuencia de procesamiento media será de 1 evento por segundo, ya que el undécimo evento no se procesará hasta que uno de los 10 primeros termine.	10 MB	No	Por función	1.ª y 2.ª gen.
Rendimiento máximo de los eventos de entrada	Rendimiento máximo de los eventos entrantes con respecto a una sola función Ejemplo: si los eventos tienen un tamaño de 1 MB, la frecuencia de invocación puede ser de un máximo de 10 por segundo, aunque las funciones tarden 100 ms en procesarse.	10 MB por segundo	No	Por función	1.ª y 2.ª gen.

Si alcanzas el límite de una cuota

Cuando una función consume la totalidad de un recurso que tenga asignado, este deja de estar disponible hasta que la cuota correspondiente se actualiza o se aumenta; por tanto, es posible que tu función o el resto de las funciones del proyecto no estén disponibles hasta entonces. Cuando esto ocurre, las funciones devuelven el código de error HTTP 500.

Si necesitas aumentar tus cuotas por encima de los valores predeterminados que se describen en este documento, ve a la página Cuotas de funciones de Cloud Run y selecciona las que quieres modificar. A continuación, haz clic en Editar cuotas, indica tu información de usuario si el sistema te lo pide e introduce el nuevo límite para cada cuota.