Cuotas

En este documento se describen los límites de las cuotas de Cloud Run Functions.

Las cuotas de Cloud Run Functions abarcan cuatro áreas:

  • Límites de recursos

    Afectan a la cantidad total de recursos que pueden consumir tus funciones.

  • Límites de tiempo

    Afectan a la cantidad de tiempo durante el cual pueden ejecutarse las funciones.

  • Límites de frecuencia

    Afectan a la frecuencia con la que puedes llamar a la API de funciones de Cloud Run para gestionar tus funciones.

  • Límites de redes

    Estos límites afectan a las conexiones salientes y a las instancias.

A continuación, se describen en profundidad todos los tipos de límites. Cuando proceda, se indicarán las diferencias entre los límites de Cloud Run Functions (1.ª gen.) y Cloud Run Functions (2.ª gen.).

Límites de recursos

Los límites de recursos afectan a la cantidad total de recursos que pueden consumir tus funciones. El ámbito regional es por proyecto y cada proyecto mantiene sus propios límites.

Cuota Descripción Límite (1.ª gen.) Limit (2.ª gen.) Posibilidad de aumento Permiso
Número de funciones Número total de funciones que se pueden desplegar por región 1000 1000 menos el número de servicios de Cloud Run desplegados No Por región
Tamaño máximo de despliegue Tamaño máximo del despliegue de una sola función 100 MB (comprimido) para fuentes
500 MB (sin comprimir) para fuentes y módulos
N/A No Por función
Tamaño máximo de solicitud HTTP sin comprimir Datos que se envían a funciones HTTP en una solicitud HTTP 10 MB 32 MB No Por invocación
Tamaño máximo de respuesta HTTP sin comprimir Datos que se envían desde funciones HTTP en una respuesta HTTP 10 MB 10 MB para respuestas graduales.
32 MB para respuestas que no son de streaming.
No Por invocación
Tamaño máximo de evento en funciones basadas en eventos Datos que se envían en eventos a funciones en segundo plano 10 MB 512 KB para eventos de Eventarc.
10 MB para eventos antiguos.
No Por evento
Memoria máxima de una función Cantidad de memoria que puede usar cada instancia de función 8 GiB 32 GiB No Por función
Memoria máxima de un proyecto Cantidad de memoria, en bytes, que puede usar un proyecto. Se mide mediante la suma total de la memoria solicitada por los usuarios en las instancias de funciones durante un periodo de 1 minuto. Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. N/A por proyecto y región
CPU máxima del proyecto Cantidad de CPU, en milivCPU, que puede usar un proyecto. Se mide mediante la suma total de la CPU solicitada por los usuarios en todas las instancias de la función durante un periodo de 1 minuto. Depende de la región seleccionada. Este límite puede ser mayor en las regiones de alta capacidad o menor en las regiones que se hayan abierto recientemente. N/A por proyecto y región

Límites de tiempo

Cuota Descripción Límite (1.ª gen.) Limit (2.ª gen.) Posibilidad de aumento Permiso
Duración máxima de una función Cantidad máxima de tiempo durante el cual puede ejecutarse una función antes de que se fuerce su detención 540 segundos 60 minutos para las funciones HTTP.
60 minutos para funciones basadas en eventos.
No Por invocación

Límites de frecuencia

Cuota Descripción Límite (1.ª gen.) Limit (2.ª gen.) Posibilidad de aumento Permiso
Llamadas a la API (función "READ") Llamadas para describir o mostrar funciones a través de la API de Cloud Run functions 5000 por cada 100 segundos 1200 cada 60 segundos Solo para la 1.ª gen. por proyecto (1.ª gen.)
por región (2.ª gen.)
Llamadas a la API (función "WRITE") Llamadas para desplegar o eliminar funciones a través de la API de Cloud Run Functions 80 por cada 100 segundos 60 cada 60 segundos No1 por proyecto (1.ª gen.)
por región (2.ª gen.)
Llamadas a la API (función "CALL") Llamadas a la API "CALL" 16 por cada 100 segundos N/A No2 Por proyecto

Límites de redes

Para obtener información sobre los límites de solicitudes y ancho de banda de las redes de las funciones de Cloud Run (2.ª gen.), consulta Límites de redes.

Los siguientes límites de redes se aplican a las funciones de Cloud Run (1.ª gen.):

  • Conexiones salientes por segundo por instancia: 500 (no se puede aumentar)
  • Resoluciones de DNS salientes por segundo por instancia: 100 (no se puede aumentar)
  • Número máximo de paquetes por segundo y por instancia: 80.000
  • Número máximo de bits por segundo por instancia: 100.000.000

Escalabilidad

Las funciones de Cloud Run que se invoquen mediante HTTP se escalan rápidamente para gestionar el tráfico entrante, mientras que las funciones en segundo plano se escalan de forma más gradual. La capacidad de escalar de forma vertical de una función depende de factores como los siguientes:

  • El tiempo que tarda una función en ejecutarse (normalmente, las que tardan poco se pueden escalar para gestionar más solicitudes simultáneas)
  • El tiempo que tarda una función en inicializarse con un arranque en frío
  • La tasa de errores de la función.
  • Factores transitorios, como la carga regional y la capacidad del centro de datos.

  • Tu configuración, definida por el número mínimo de instancias, el número máximo de instancias y la simultaneidad (la simultaneidad solo está disponible en la segunda generación).

Las funciones en segundo plano tienen otros límites, tal como se indica más adelante. Estos límites no se aplican a las funciones de HTTP de 1.ª gen. El límite máximo de instancias predeterminado de las funciones HTTP de segunda generación es 100 y se puede aumentar a 1000. No hay un límite máximo predeterminado de instancias para las funciones HTTP de primera generación. Para evitar eventos de escalado ilimitados con funciones HTTP de 1.ª gen., te recomendamos que establezcas un límite, por ejemplo, 3000.

Cuotas de las funciones en segundo plano

Cuota Descripción Límite Posibilidad de aumento Ámbito Versión del producto
Número máximo de invocaciones simultáneas Número máximo de invocaciones simultáneas de una función concreta
Ejemplo: si se tarda 100 segundos en procesar cada evento, la frecuencia de invocación se limitará a 30 por segundo (de media).
3000 Por función Solo 1.ª gen.
Frecuencia de invocación máxima Frecuencia máxima de eventos que una sola función puede gestionar
Ejemplo: si se tarda 100 ms en procesar un evento, la frecuencia de invocación se limitará a 1000 por segundo aunque solo se procesen 100 solicitudes (de media) en paralelo.
1000 por segundo No Por función Solo 1.ª gen.
Tamaño máximo de los datos de los eventos simultáneos Tamaño total máximo de los eventos de entrada de las invocaciones simultáneas de una función determinada
Ejemplo: si los eventos tienen un tamaño de 1 MB y tardan 10 segundos en procesarse, la frecuencia de procesamiento media será de 1 evento por segundo, ya que el undécimo evento no se procesará hasta que uno de los 10 primeros termine.
10 MB No Por función 1.ª y 2.ª gen.
Rendimiento máximo de los eventos de entrada Rendimiento máximo de los eventos entrantes con respecto a una sola función
Ejemplo: si los eventos tienen un tamaño de 1 MB, la frecuencia de invocación puede ser de un máximo de 10 por segundo, aunque las funciones tarden 100 ms en procesarse.
10 MB por segundo No Por función 1.ª y 2.ª gen.

Si alcanzas el límite de una cuota

Cuando una función consume la totalidad de un recurso que tenga asignado, este deja de estar disponible hasta que la cuota correspondiente se actualiza o se aumenta; por tanto, es posible que tu función o el resto de las funciones del proyecto no estén disponibles hasta entonces. Cuando esto ocurre, las funciones devuelven el código de error HTTP 500.

Si necesitas aumentar tus cuotas por encima de los valores predeterminados que se describen en este documento, ve a la página Cuotas de funciones de Cloud Run y selecciona las que quieres modificar. A continuación, haz clic en Editar cuotas, indica tu información de usuario si el sistema te lo pide e introduce el nuevo límite para cada cuota.