Cette page a été traduite par l'API Cloud Translation.

Quotas et limites de Cloud Run
Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Cette page présente les limites et quotas d'utilisation applicables lors de l'utilisation de Cloud Run.

Le nombre de ressources Cloud Run est limité. Les quotas pour Cloud Run incluent les limites de débit des API, ce qui affecte la fréquence à laquelle vous pouvez appeler l'API Admin Cloud Run.

Aucune limite directe ne concerne :

la taille des images de conteneurs que vous pouvez déployer ;
le nombre de requêtes simultanées diffusées par un service Cloud Run.

Limites de ressources pour Cloud Run

Pour dépasser les limites pouvant être augmentées, demandez une augmentation de quota. Pour dépasser les limites par projet qui ne peuvent pas être augmentées, créez des ressources dans un autre Google Cloud projet ou une autre région.

Ressource	Champ d'application	Description	Limite	Augmentation possible
Service	Par projet et par région	Nombre maximal de services	1 000	Non
Job	Par projet et par région	Nombre maximal de jobs	1000	Non
Exécution du job	Par projet et par région	Nombre maximal d'exécutions de jobs en cours	1000	Non
Révision	Par service	Nombre maximal de révisions par service. Une fois la limite atteinte, les révisions inactives sont automatiquement supprimées dans l'ordre chronologique	1 000	Non
Révision	Par projet et par région	Nombre maximal de révisions diffusant le trafic	4000	Non
Tag de révision	Par projet et par région	Nombre maximal de tags de révision. Lorsque la limite de tags de révision est dépassée, Cloud Run effectue un nettoyage des tags sur le service. Pour le service pour lequel un nouveau tag est créé, les tags qui ne sont pas associés à un pourcentage de trafic spécifié sont automatiquement supprimés dans l'ordre chronologique.	2000	Non
Exécution du job	par job	Limite de conservation pour les exécutions de jobs terminées. Lorsque le nombre d'exécutions d'un job terminées atteint cette limite, les exécutions sont automatiquement supprimées dans l'ordre chronologique	1 000	Non
Tâche d'exécution de jobs¹	par exécution de job	Nombre maximal de tâches exécutées en parallèle	Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page de la console Quotas et limites du système.	Oui
Job d'exécution du job	par exécution de job	Valeur maximale du délai avant expiration des tâches	168 heures (7 jours)²	Non
Job d'exécution du job	par exécution de job	Nombre maximal d'opérations dans un job unique	10 000	Non
Job d'exécution du job	par exécution de job	Nombre maximal de nouvelles tentatives d'exécution d'une opération dans un job	10	Non
Variables d'environnement	par job ou par service	Nombre maximal de variables d'environnement par conteneur	1000	Non
Arguments de la commande	par job ou par service	Nombre maximal d'arguments de commande par conteneur	1000	Non
Instance de conteneur¹	par révision	Nombre maximal d'instances de conteneur	Dépend de la région sélectionnée, ainsi que des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page de la console Quotas et limites du système.	Oui
Instance de conteneur¹	Par projet et par région	Nombre maximal d'instances de conteneur pour toutes les exécutions de jobs en cours	Dépend de la région sélectionnée, ainsi que des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page de la console Quotas et limites du système.	Oui
Instance de conteneur³	par révision et par région	Nombre maximal d'instances de conteneur utilisant la sortie VPC directe	100 à 200, en fonction des configurations de région sélectionnées.	Oui
Instance de conteneur	Par instance de conteneur	Délai avant expiration du démarrage, en minutes	4	Non
Mémoire	Par instance de conteneur	Taille maximale de la mémoire, en Gio	32	Non
Processeur	Par instance de conteneur	Nombre maximal de processeurs virtuels	8	Non
Processeur	Par projet et par région	Processeur total maximal, en millièmes de vCPU, alloué à toutes les instances sur une période d'une minute.	Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes.	Oui
Mémoire	Par projet et par région	Mémoire totale maximale, en octets, allouée à toutes les instances sur une période d'une minute.	Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. Vous pouvez consulter votre quota sur la page de la console Quotas et limites du système.	Oui
Instance GPU sans garantie de redondance zonale⁴	par projet et par région	Nombre maximal d'instances de conteneur avec GPU	0⁴	Oui
Instance GPU avec garantie de redondance zonale⁴	par projet et par région	Nombre maximal d'instances de conteneur avec GPU	0⁴	Oui
Disque	Par instance de conteneur	Système de fichiers maximal en mémoire, accessible en écriture, limité par la mémoire d'instance, en Gio	32	Non
Variable d'environnement	Par variable	Longueur maximale de la variable, en Ko	32	Non
Mappage de domaine	Par domaine de premier niveau et par semaine	Nombre maximal de certificats SSL	50	Non
Mappage de domaine	Par domaine de premier niveau et par semaine	Nombre maximal de certificats SSL en double	5	Non
Jeton d'accès	Par instance de conteneur et par seconde	Nombre maximal de jetons d'accès uniques générés	50	Non
Jeton d'identité	Par instance de conteneur et par seconde	Nombre maximal de jetons d'identité uniques générés	50	Non
Fichiers ouverts	Par instance de conteneur	Nombre maximal de fichiers pouvant être ouverts en même temps. Correspond à `/proc/sys/fs/file-max`.	25 000	Non

¹Ce quota régional est utilisé dans certains cas précis :

Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.

Pour contrôler le parallélisme maximal d'un job. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.

Pour contrôler le nombre total d'instances de conteneur pour l'exécution de jobs dans une région.

² La prise en charge des délais d'inactivité supérieurs à 24 heures est disponible en version Preview.

³Ce quota régional est utilisé dans certains cas précis:

Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.

Pour contrôler le parallélisme maximal d'un job à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.

⁴ Pour accéder aux GPU, vous devez demander une augmentation de quota NvidiaL4GpuAllocPerProjectRegion ou NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion. Si votre utilisation maximale des GPU n'est pas proche de votre quota, Google peut le réduire.

Limites de mise en réseau pour Cloud Run

Limites de requêtes pour Cloud Run

Description	Limite	Remarques
Nombre maximal de requêtes simultanées par instance	1000
Nombre maximal de flux simultanés par connexion client HTTP/2	100
Délai maximal avant expiration par requête	60 minutes
Taille maximale des requêtes HTTP/1	32 Mio si vous utilisez le serveur HTTP/1. Aucune limite si vous utilisez un serveur HTTP/2.
Taille maximale des réponses HTTP/1	32 Mio si vous n'utilisez pas `Transfer-Encoding: chunked` ni les mécanismes de streaming
Connexions sortantes par seconde et par instance	700	Ne s'applique pas au trafic de sortie VPC directe envoyé au réseau VPC, qui n'est pas limité.
Résolutions DNS sortantes par seconde et par instance	1000
Requêtes entrantes par seconde vers un port de conteneur HTTP/1 par instance	800	Ne s'applique pas aux ports de conteneurs HTTP/2.

Limites de bande passante pour Cloud Run

Les limites de bande passante suivantes s'appliquent aux instances Cloud Run :

Description	Limite	Remarques
Nombre maximal d'octets par instance pour la sortie via un VPC direct	1 Gbit/s	Sortie via un VPC direct vers des destinations situées sur le réseau VPC.
Nombre maximal d'octets par instance, en excluant la sortie via VPC direct	600 Mbit/s	Basé sur la somme des octets d'entrée et des octets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC.
Débit total maximal de paquets par instance, à l'exclusion de la sortie via un VPC direct	64 000 paquets par seconde	Basé sur la somme des paquets d'entrée et des paquets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC.

Si l'une des deux limites est atteinte, la bande passante de l'instance Cloud Run sera limitée.

Limites de débit de l'API Admin Cloud Run

Les limites de débit suivantes s'appliquent à l'API Admin Cloud Run. Elles ne s'appliquent pas aux requêtes qui atteignent vos services Cloud Run déployés.

Quota	Description	Limite	Augmentation possible	Champ d'application
Requêtes de lecture de l'API Admin Cloud Run	Nombre de lectures de l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes de lecture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées.	3 000 pour 60 secondes	Oui	Par projet et par région
Requêtes d'écriture dans l'API Admin Cloud Run	Nombre d'écritures dans l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes d'écriture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées.	180 pour 60 secondes	Oui	Par projet et par région
Exécution de tâche	Nombre maximal d'exécutions d'une tâche par période de 60 secondes et par région.	180 pour 60 secondes	Oui	Par projet et par région

Augmenter le quota

Les demandes d'ajustement de quotas Cloud sont soumises à un examen. Si votre demande d'ajustement de quota nécessite un examen, vous recevez un e-mail confirmant la réception de votre demande. Si vous avez besoin d'aide supplémentaire, répondez à l'e-mail. Après examen de votre demande, vous recevrez une notification par e-mail indiquant si votre demande a été approuvée.

Console

Pour ajuster une valeur de quota, procédez comme suit :

Dans la console Google Cloud, accédez à la page Quotas et limites du système :
Accéder à la page Quotas et limites du système
Recherchez la valeur de quota à modifier dans la colonne Quota, puis cochez la case située à côté du quota à modifier.

Si nécessaire, utilisez le champ de recherche Filtre pour rechercher votre quota.
Cliquez sur Modifier. La boîte de dialogue Modifications de quotas s'affiche.
Saisissez la valeur de quota souhaitée dans le champ Nouvelle valeur. Certaines valeurs de quota sont associées à une unité de mesure. Le cas échéant, sélectionnez l'unité souhaitée dans la liste adjacente. Cliquez sur Done (OK).

Facultatif : Si une case à cocher contenant le texte I understand that this request will remove any overrides s'affiche, cela signifie que si vous ajustez la valeur du quota à un nombre égal ou supérieur à la valeur par défaut, le quota de remplacement précédent sera supprimé. Si c'est ce que vous souhaitez, cochez la case et poursuivez.
Pour augmenter la valeur de votre quota au-delà du nombre indiqué dans la boîte de dialogue, sélectionnez Demander un quota supérieur.
1. Dans le formulaire Modifications de quotas, saisissez la valeur de quota modifiée que vous souhaitez dans le champ Nouvelle valeur. Si un champ Description de la requête s'affiche, saisissez une description. Cliquez sur OK.
2. Si un bouton Suivant s'affiche, cliquez sur Suivant, puis renseignez vos coordonnées sur l'écran suivant.
Cliquez sur Envoyer la requête.

Si vous constatez que vous ne pouvez pas demander un ajustement dans la console, demandez l'augmentation auprès de Cloud Customer Care.

Pour en savoir plus sur le fonctionnement du processus d'augmentation de quota, consultez À propos des ajustements de quota.

Regrouper des requêtes pour des valeurs de quota plus élevées

Vous pouvez regrouper des demandes de quota plus élevé en cochant la case à côté de chaque quota que vous souhaitez inclure. Toutefois, le traitement par lot des demandes peut augmenter le délai nécessaire à Google Cloud pour examiner votre demande.

Pour réduire le temps d'examen, regroupez les demandes d'ajustement de quota par produit et par zone géographique. Par exemple, si vous souhaitez demander des ajustements pour les quotas de réseau et de VM Compute Engine, créez une requête pour les quotas de réseau et une autre pour les quotas de VM Compute Engine.

Quotas et limites de Cloud Run Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.