Cette page présente les limites et quotas d'utilisation applicables lors de l'utilisation de Cloud Run.
Le nombre de ressources Cloud Run est limité. Les quotas pour Cloud Run incluent les limites de débit des API, ce qui affecte la fréquence à laquelle vous pouvez appeler l'API Admin Cloud Run.
Aucune limite directe ne concerne :
- la taille des images de conteneurs que vous pouvez déployer ;
- le nombre de requêtes simultanées diffusées par un service Cloud Run.
Limites de ressources pour Cloud Run
Pour dépasser les limites pouvant être augmentées, demandez une augmentation de quota. Pour dépasser les limites par projet qui ne peuvent pas être augmentées, créez des ressources dans un autre projet ou région Google Cloud.
Ressource | Champ d'application | Description | Limite | Augmentation possible |
---|---|---|---|---|
Service | Par projet et par région | Nombre maximal de services | 1 000 | Non |
Job | Par projet et par région | Nombre maximal de jobs | 1000 | Non |
Exécution du job | Par projet et par région | Nombre maximal d'exécutions de jobs en cours | 1000 | Non |
Révision | Par service | Nombre maximal de révisions par service. Une fois la limite atteinte, les révisions inactives sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non |
Révision | Par projet et par région | Nombre maximal de révisions diffusant le trafic | 4000 | Non |
Tag de révision | Par projet et par région | Nombre maximal de tags de révision. Lorsque la limite de tags de révision est dépassée, Cloud Run effectue un nettoyage des tags sur le service. Pour le service pour lequel un nouveau tag est créé, les tags qui ne sont pas associés à un pourcentage de trafic spécifié sont automatiquement supprimés dans l'ordre chronologique. | 2000 | Non |
Exécution du job | par job | Limite de conservation pour les exécutions de jobs terminées. Lorsque le nombre d'exécutions d'un job terminées atteint cette limite, les exécutions sont automatiquement supprimées dans l'ordre chronologique | 1 000 | Non |
Tâche d'exécution de jobs1 | par exécution de job | Nombre maximal de tâches exécutées en parallèle | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui |
Job d'exécution du job | par exécution de job | Valeur maximale du délai avant expiration des tâches | 168 heures (7 jours)2 | Non |
Job d'exécution du job | par exécution de job | Nombre maximal d'opérations dans un job unique | 10 000 | Non |
Job d'exécution du job | par exécution de job | Nombre maximal de nouvelles tentatives d'exécution d'une opération dans un job | 10 | Non |
Variables d'environnement | par job ou par service | Nombre maximal de variables d'environnement par conteneur | 1000 | Non |
Arguments de la commande | par job ou par service | Nombre maximal d'arguments de commande par conteneur | 1000 | Non |
Instance de conteneur1 | par révision | Nombre maximal d'instances de conteneur | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui |
Instance de conteneur1 | Par projet et par région | Nombre maximal d'instances de conteneur pour toutes les exécutions de jobs en cours | Dépend de la région sélectionnée et des configurations de processeur et de mémoire. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui |
Instance de conteneur3 | par révision et par région | Nombre maximal d'instances de conteneur utilisant la sortie VPC directe | 100 à 200, en fonction des configurations de région sélectionnées. | Oui |
Instance de conteneur | Par instance de conteneur | Délai avant expiration du démarrage, en minutes | 4 | Non |
Mémoire | Par instance de conteneur | Taille maximale de la mémoire, en Gio | 32 | Non |
Processeur | Par instance de conteneur | Nombre maximal de processeurs virtuels | 8 | Non |
Processeur | Par projet et par région | Processeur total maximal, en millièmes de vCPU, alloué à toutes les instances sur une période d'une minute. | Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui |
Mémoire | Par projet et par région | Mémoire totale maximale, en octets, allouée à toutes les instances sur une période d'une minute. | Dépend de la région sélectionnée. Cette limite peut être supérieure dans les régions disposant d'une grande capacité ou inférieure dans les régions récemment ouvertes. | Oui |
Instance de GPU 4 | par projet et par région | Nombre maximal d'instances de conteneur avec GPU | 04 | Oui |
Disque | Par instance de conteneur | Système de fichiers maximal en mémoire, accessible en écriture, limité par la mémoire d'instance, en Gio | 32 | Non |
Variable d'environnement | Par variable | Longueur maximale de la variable, en Ko | 32 | Non |
Mappage de domaine | Par domaine de premier niveau et par semaine | Nombre maximal de certificats SSL | 50 | Non |
Mappage de domaine | Par domaine de premier niveau et par semaine | Nombre maximal de certificats SSL en double | 5 | Non |
Jeton d'accès | Par instance de conteneur et par seconde | Nombre maximal de jetons d'accès uniques générés | 50 | Non |
Jeton d'identité | Par instance de conteneur et par seconde | Nombre maximal de jetons d'identité uniques générés | 50 | Non |
Fichiers ouverts | Par instance de conteneur | Nombre maximal de fichiers pouvant être ouverts en même temps. Correspond à /proc/sys/fs/file-max . |
25 000 | Non |
1Ce quota régional est utilisé dans certains cas précis :
Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.
Pour contrôler le parallélisme maximal d'un job. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.
Pour contrôler le nombre total d'instances de conteneur pour l'exécution de jobs dans une région.
2 La prise en charge des délais d'inactivité supérieurs à 24 heures est disponible en version Preview.
3Ce quota régional est utilisé dans certains cas précis:
Pour contrôler la valeur maximale pouvant être sélectionnée pour l'attribut d'instance maximale d'une révision à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, toutes les révisions de cette région peuvent atteindre la limite accordée.
Pour contrôler le parallélisme maximal d'un job à l'aide de la sortie VPC directe. Une fois ce quota accordé dans une région donnée, tous les jobs de cette région peuvent atteindre la limite accordée.
4
Pour accéder au GPU, vous devez demander une augmentation de quota pour Total Nvidia L4 GPU allocation, per project per region
.
Limites de mise en réseau pour Cloud Run
Limites de requêtes pour Cloud Run
Description | Limite | Remarques |
---|---|---|
Nombre maximal de requêtes simultanées par instance | 1000 | |
Nombre maximal de flux simultanés par connexion client HTTP/2 | 100 | |
Délai maximal avant expiration par requête | 60 minutes | |
Taille maximale des requêtes HTTP/1 | 32 Mio si vous utilisez le serveur HTTP/1. Aucune limite si vous utilisez un serveur HTTP/2. | |
Taille maximale des réponses HTTP/1 | 32 Mio si vous n'utilisez pas Transfer-Encoding: chunked ni les mécanismes de streaming |
|
Connexions sortantes par seconde et par instance | 700 | |
Résolutions DNS sortantes par seconde et par instance | 1000 | |
Requêtes entrantes par seconde vers un port de conteneur HTTP/1 par instance | 800 | Ne s'applique pas aux ports de conteneurs HTTP/2. |
Limites de bande passante pour Cloud Run
Les limites de bande passante suivantes s'appliquent aux instances Cloud Run :
Description | Limite | Remarques |
---|---|---|
Nombre maximal d'octets par instance pour la sortie via un VPC direct | 1 Gbit/s | Sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Nombre maximal d'octets par instance, en excluant la sortie via VPC direct | 600 Mbit/s | Basé sur la somme des octets d'entrée et des octets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Débit total maximal de paquets par instance, à l'exclusion de la sortie via un VPC direct | 64 000 paquets par seconde | Basé sur la somme des paquets d'entrée et des paquets de sortie, à l'exclusion de la sortie via un VPC direct vers des destinations situées sur le réseau VPC. |
Si l'une des deux limites est atteinte, la bande passante de l'instance Cloud Run sera limitée.
Limites de débit de l'API Admin Cloud Run
Les limites de débit suivantes s'appliquent à l'API Admin Cloud Run. Elles ne s'appliquent pas aux requêtes qui atteignent vos services Cloud Run déployés.
Quota | Description | Limite | Augmentation possible | Champ d'application |
---|---|---|---|---|
Requêtes de lecture de l'API Admin Cloud Run | Nombre de lectures de l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes de lecture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 3 000 pour 60 secondes | Oui | Par projet et par région |
Requêtes d'écriture dans l'API Admin Cloud Run | Nombre d'écritures dans l'API pour 60 secondes, par région. Il ne s'agit pas du nombre de requêtes d'écriture adressées à vos services Cloud Run. Ces requêtes ne sont pas limitées. | 180 pour 60 secondes | Oui | Par projet et par région |
Exécution de tâche | Nombre maximal d'exécutions d'une tâche par période de 60 secondes et par région. | 180 pour 60 secondes | Oui | Par projet et par région |
Augmenter le quota
Pour demander une augmentation de quota, procédez comme suit :Accédez à la page Quotas et limites du système :
Recherchez le quota que vous souhaitez augmenter dans la colonne Quota. Vous pouvez utiliser le champ de recherche Filtre pour rechercher votre quota.
Cochez la case à côté du quota que vous souhaitez augmenter.
Cliquez sur
. La boîte de dialogue Modifications de quotas s'affiche. Modifier Facultatif : Si vous souhaitez augmenter la valeur de votre quota au-delà du nombre indiqué à l'écran, sélectionnez Demander un quota supérieur. Remplissez le formulaire, envoyez-le et ignorez les étapes restantes.
Dans le formulaire Modifications de quota, saisissez le quota augmenté que vous souhaitez dans le champ Nouvelle valeur. Si un champ Description de la demande s'affiche, saisissez une description. Cliquez sur OK.
Si une case contenant le texte "Je comprends que cette demande supprimera tous les remplacements" s'affiche, cela signifie que votre quota est inférieur à la valeur par défaut. Si vous ajustez la valeur du quota à la valeur par défaut ou au-delà, le remplacement est supprimé. Pour continuer, cochez la case. En savoir plus sur les quotas de remplacement
Si un bouton Suivant s'affiche, cliquez sur Suivant, puis renseignez vos coordonnées sur l'écran suivant.
Cliquez sur Envoyer la requête.
Si vous constatez que vous ne pouvez pas demander un ajustement dans la console, demandez l'augmentation auprès de Cloud Customer Care.
Les demandes d'ajustement de quotas Cloud sont soumises à un examen. Si votre demande d'ajustement de quota nécessite un examen, vous recevez un e-mail confirmant la réception de votre demande. Si vous avez besoin d'aide supplémentaire, répondez à l'e-mail. Après examen de votre demande, vous recevrez une notification par e-mail indiquant si votre demande a été approuvée.
Pour en savoir plus sur le fonctionnement de l'augmentation de quota, consultez la page À propos des demandes d'augmentation de quota.
Regrouper des requêtes pour des valeurs de quota plus élevées
Vous pouvez regrouper des demandes de quota plus élevé en cochant la case à côté de chaque quota que vous souhaitez inclure. Le traitement par lot des demandes peut augmenter le délai nécessaire à Google Cloud pour examiner votre demande. Pour réduire le temps d'examen, regroupez les demandes d'ajustement de quota par produit et par zone géographique. Par exemple, si vous souhaitez demander des ajustements pour les quotas de réseau et de VM Compute Engine, créez une requête pour les quotas de réseau et une autre pour les quotas de VM Compute Engine.