Kontingente und Limits für Cloud Run

Auf dieser Seite werden die Kontingente und Limits für die Nutzung von Cloud Run erläutert.

Der Umfang der Cloud Run-Ressourcen ist begrenzt. Zu den Kontingenten für Cloud Run gehört auch eine API-Ratenbegrenzung, die bestimmt, mit welcher Rate die Cloud Run Admin API aufgerufen werden kann.

Für Folgendes besteht keine unmittelbare Begrenzung:

  • Die Größe der bereitstellbaren Container-Images.
  • Die Anzahl der gleichzeitigen Anfragen durch einen Cloud Run-Dienst.

Ressourcenlimits für Cloud Run

Wenn Sie über die Limits hinausgehen möchten, die erhöht werden können, fordern Sie eine Kontingenterhöhung an. Wenn Sie die pro Projekt geltenden Limits überschreiten möchten, die nicht erhöht werden können, erstellen Sie neue Ressourcen in einem anderen Google Cloud Projekt oder einer anderen Region.

Ressource Umfang Beschreibung Limit Kann erhöht werden
Dienst pro Projekt und Region Maximale Anzahl von Diensten 1.000 Nein
Job pro Projekt und Region Maximale Anzahl von Jobs 1000 Nein
Jobausführung pro Projekt und Region Maximale Anzahl aktiver Jobausführungen 1000 Nein
Überarbeitung pro Dienst Maximale Anzahl von Überarbeitungen pro Dienst. Wenn das Limit erreicht wird, werden Revisionen, die keinen Traffic bedienen, in der Reihenfolge ihrer Erstellung automatisch gelöscht 1.000 Nein
Überarbeitung pro Projekt und Region Maximale Anzahl an Revisionen, die Traffic bedienen 4000 Nein
Revision-Tag pro Projekt und Region Maximale Anzahl von Revision-Tags. Wenn das Limit für Revision-Tags überschritten wird, führt Cloud Run eine Tag-Bereinigung für den Dienst durch. Für den Dienst, für den ein neues Tag erstellt wird, werden Tags ohne festgelegten Traffic-Prozentsatz automatisch in chronologischer Reihenfolge gelöscht. 2000 Nein
Jobausführung pro Job Aufbewahrungsdauer für abgeschlossene Jobausführungen. Wenn die Anzahl der abgeschlossenen Ausführungen für einen Job dieses Limit erreicht, werden Ausführungen automatisch in der Reihenfolge des Verlaufs gelöscht 1.000 Nein
Jobausführungsaufgabe1 pro Jobausführung Maximale Anzahl von parallel ausgeführten Aufgaben Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie finden Ihr Kontingent auf der Console-Seite Kontingente und Systemlimits. Ja
Jobausführungsaufgabe pro Jobausführung Maximales Zeitlimit für Aufgaben 168 Stunden (7 Tage)2 Nein
Jobausführungsaufgabe pro Jobausführung Maximale Anzahl von Aufgaben in einem einzelnen Job 10.000 Nein
Jobausführungsaufgabe pro Jobausführung Maximale Anzahl von Aufgabenwiederholungen in einem Job 10 Nein
Umgebungsvariablen pro Job oder pro Dienstleistung Maximale Anzahl von Umgebungsvariablen pro Container 1000 Nein
Befehlsargumente pro Auftrag oder pro Dienstleistung Maximale Anzahl von Befehlsargumenten pro Container 1000 Nein
Containerinstanz1 pro Überarbeitung Maximale Anzahl von Containerinstanzen Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie finden Ihr Kontingent auf der Console-Seite Kontingente und Systemlimits. Ja
Containerinstanz1 pro Projekt und Region Maximale Anzahl von Containerinstanzen aller ausgeführten Jobausführungen Hängt von der ausgewählten Region sowie den CPU- und Speicherkonfigurationen ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie finden Ihr Kontingent auf der Console-Seite Kontingente und Systemlimits. Ja
Containerinstanz3 pro Überarbeitung und Region Maximale Anzahl von Containerinstanzen mit ausgehendem Direct VPC-Traffic 100 bis 200, abhängig von den ausgewählten regionalen Konfigurationen. Ja
Containerinstanz pro Containerinstanz Zeitüberschreitung beim Start in Minuten 4 Nein
Speicher pro Containerinstanz Maximale Arbeitsspeichergröße in GiB 32 Nein
CPU pro Containerinstanz Maximale Anzahl von vCPUs 8 Nein
CPU1 pro Projekt und Region Maximale CPU-Kapazität in Milli-vCPUs, die allen Instanzen über einen Zeitraum von einer Minute zugewiesen wurde. Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Ja
Arbeitsspeicher1 pro Projekt und Region Maximaler Gesamtspeicher in Byte, der allen Instanzen über einen Zeitraum von einer Minute zugewiesen wurde. Hängt von der ausgewählten Region ab. Dieses Limit kann in Regionen mit hoher Kapazität höher oder in kürzlich geöffneten Regionen niedriger sein. Sie finden Ihr Kontingent auf der Console-Seite Kontingente und Systemlimits. Ja
GPU-Instanz ohne zonale Redundanzgarantie1, 4 pro Projekt und Region Maximale Anzahl von Containerinstanzen mit GPU 04 Ja
GPU-Instanz mit zonaler Redundanzgarantie1, 4 pro Projekt und Region Maximale Anzahl von Containerinstanzen mit GPU 04 Ja
Laufwerk pro Containerinstanz Maximal großes, beschreibbares In-Memory-Dateisystem, begrenzt durch den Instanzarbeitsspeicher in GiB 32 Nein
Umgebungsvariable pro Variable Maximale Variablenlänge in KB 32 Nein
Domainzuordnung pro übergeordneter Domain und Woche Maximale Anzahl von SSL-Zertifikaten 50 Nein
Domainzuordnung pro übergeordneter Domain und Woche Maximale Anzahl der Duplikate von SSL-Zertifikaten 5 Nein
Zugriffstoken pro Containerinstanz und Sekunde Maximale Anzahl der generierten eindeutigen Zugriffstokens 50 Nein
Identitätstoken pro Containerinstanz und Sekunde Maximale Anzahl der generierten eindeutigen Identitätstokens 50 Nein
Geöffnete Dateien pro Containerinstanz Maximale Anzahl von Dateien, die gleichzeitig geöffnet werden können. Entspricht
/proc/sys/fs/file-max.
25.000 Nein

1Diese regionalen Kontingente werden in einigen Fällen verwendet, wobei jedes Folgendes steuert:

  1. Der Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.

  2. Die maximale Parallelität eines Jobs. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.

  3. Die Gesamtzahl der Containerinstanzen für die Ausführung von Jobausführungen in einer Region.

2 In der Vorabversion wird die Unterstützung für Zeitüberschreitungen von mehr als 24 Stunden angeboten.

3Dieses regionale Kontingent wird in einigen Fällen verwendet:

  1. Es steuert den Höchstwert, der für das Attribut maximale Instanz einer Überarbeitung mit Direct VPC-Ausgang ausgewählt werden kann. Nachdem es in einer bestimmten Region gewährt wurde, können alle Überarbeitungen in dieser Region das zugewiesene Limit erreichen.

  2. Es steuert die maximale Parallelität eines Jobs mit ausgehendem Direct VPC-Traffic. Sobald es in einer bestimmten Region gewährt wurde, können alle Jobs in dieser Region das zugewiesene Limit erreichen.

4 Um auf die GPU zugreifen zu können, müssen Sie eine Erhöhung des Kontingents für NvidiaL4GpuAllocPerProjectRegion oder NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion beantragen. Wenn Ihre maximale GPU-Auslastung nicht annähernd Ihrem Kontingent entspricht, kann Google Ihr Kontingent verringern.

Netzwerklimits für Cloud Run

Anfragelimits für Cloud Run

Beschreibung Limit Hinweise
Maximale Anzahl gleichzeitiger Anfragen pro Instanz 1000
Maximale Anzahl gleichzeitiger Streams pro HTTP/2-Clientverbindung 100
Maximale Zeit vor einer Zeitüberschreitung pro Anfrage 60 Minuten
Maximale Größe von HTTP/1-Anfragen 32 MiB bei Verwendung des HTTP/1-Servers. Keine Beschränkung bei Verwendung des HTTP/2-Servers.
Maximale Größe von HTTP/1-Antworten 32 MiB, wenn keine Transfer-Encoding: chunked oder Streaming-Mechanismen verwendet werden
Ausgehende Verbindungen pro Sekunde und Instanz 700 Gilt nicht für ausgehenden Direct VPC-Traffic, der an das VPC-Netzwerk gesendet wird, der nicht begrenzt ist.
Ausgehende DNS-Auflösungen pro Sekunde und Instanz 1000
Eingehende Anfragen pro Sekunde an einen HTTP/1-Containerport pro Instanz 800 Gilt nicht für HTTP/2-Containerports.

Bandbreitenlimits für Cloud Run

Für Cloud Run-Instanzen gelten folgende Bandbreitenlimits:

Beschreibung Limit Hinweise
Maximale Bit pro Instanz für ausgehenden Traffic über Direct VPC 1 Gbit/s Ausgehender Traffic über Direct VPC zu Zielen im VPC-Netzwerk.
Maximale Bit pro Instanz, ohne ausgehenden Traffic über Direct VPC 600 Mbit/s Basierend auf der Summe der eingehenden und ausgehenden Bit, ohne ausgehenden Traffic über den Direct VPC-Traffic zu Zielen im VPC-Netzwerk.
Maximale Gesamtpaketrate pro Instanz, ohne ausgehenden Traffic über Direct VPC 64.000 Pakete pro Sekunde Basierend auf der Summe der eingehenden und ausgehenden Pakete, mit Ausnahme des ausgehenden Direct VPC-Traffics zu Zielen im VPC-Netzwerk.

Wird eines der beiden Limits erreicht, so gilt für die Cloud Run-Instanz eine eingeschränkte Bandbreite.

Ratenbegrenzung für Cloud Run Admin API

Die folgende Ratenbegrenzung gilt für die Cloud Run Admin API. Sie gelten nicht für die Anfragen, die bereitgestellte Cloud Run-Dienste erreichen.

Kontingent Beschreibung Limit Kann erhöht werden Umfang
Cloud Run Admin API-Leseanfragen Die Anzahl der API-Lesevorgänge pro 60 Sekunden und Projekt. Dies ist nicht die Anzahl der Leseanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. 3.000 pro 60 Sekunden Ja pro Projekt und Region
Cloud Run Admin API-Schreibanfragen Die Anzahl der API-Schreibvorgänge pro 60 Sekunden und Region. Dies ist nicht die Anzahl der Schreibanfragen an Ihren Cloud Run-Dienst, da hierfür keine Beschränkung existiert. 180 pro 60 Sekunden Ja pro Projekt und Region
Jobausführung Maximale Häufigkeit, mit der ein Job pro 60 Sekunden und Region ausgeführt werden kann. 180 pro 60 Sekunden Ja pro Projekt und Region

Kontingent erhöhen

Anträge auf Anpassung von Cloud-Kontingenten unterliegen einer Prüfung. Wenn Ihre Anfrage zur Kontingentanpassung geprüft werden muss, erhalten Sie eine E‑Mail, in der der Eingang Ihrer Anfrage bestätigt wird. Falls Sie weitere Hilfe benötigen, antworten Sie einfach auf diese E‑Mail. Nach der Prüfung Ihrer Anfrage erhalten Sie eine E‑Mail-Benachrichtigung, in der Sie darüber informiert werden, ob Ihre Anfrage genehmigt wurde.

Console

So passen Sie einen Kontingentwert an:

  1. Google Cloud Gehen Sie in der Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits"

  2. Suchen Sie in der Spalte Kontingent nach dem Kontingentwert, den Sie aktualisieren möchten, und klicken Sie auf das Kästchen daneben.

    Verwenden Sie gegebenenfalls das Suchfeld Filter, um nach dem gewünschten Kontingent zu suchen.

  3. Klicken Sie auf Bearbeiten, um das Dialogfeld Kontingentänderungen aufzurufen.

  4. Geben Sie den gewünschten Kontingentwert in das Feld Neuer Wert ein. Einige Kontingentwerte haben eine Maßeinheit. Wählen Sie in diesem Fall in der nebenstehenden Liste die gewünschte Maßeinheit aus. Klicken Sie auf Fertig.

    Optional: Wenn Sie ein Kästchen mit dem Text I understand that this request will remove any overrides sehen, bedeutet das, dass die vorherige Kontingentüberschreibung entfernt wird, wenn Sie als Kontingentwert eine Zahl festlegen, die dem Standardwert entspricht oder höher ist. Wenn Sie das möchten, klicken Sie das Kästchen an und fahren Sie fort.

  5. Wenn Sie als Kontingent einen höheren Wert als den im Dialogfeld angegebenen festlegen möchten, wählen Sie Höheres Kontingent beantragen aus.

    1. Geben Sie im Formular Kontingentänderungen im Feld Neuer Wert den gewünschten geänderten Kontingentwert ein. Wenn das Feld Beschreibung der Anfrage angezeigt wird, geben Sie eine Beschreibung ein. Klicken Sie auf Fertig.

    2. Wenn die Schaltfläche Weiter angezeigt wird, klicken Sie auf Weiter und geben Sie auf dem nächsten Bildschirm Ihre Kontaktdaten ein.

  6. Klicken Sie auf Anfrage senden.

Wenn Sie feststellen, dass Sie eine Anpassung nicht über die Console beantragen können, fordern Sie die Erhöhung über Cloud Customer Care an.

Weitere Informationen zur Funktionsweise der Kontingenterhöhung finden Sie unter Kontingentanpassungen.

Batchanfragen für höhere Kontingentwerte

Sie können mehrere Anträge auf ein höheres Kontingent gleichzeitig stellen, indem Sie die Kästchen neben den gewünschten Kontingenten anklicken. Die Bearbeitung von Batchanfragen kann jedoch die Zeit verlängern, die für die Prüfung Ihrer Anfrage benötigt wird. Google Cloud

Gruppieren Sie Anfragen zur Kontingentanpassung nach Produkt und Region, um die Überprüfungszeit zu verkürzen. Wenn Sie beispielsweise Anpassungen an den Netzwerk- und Compute Engine-VM-Kontingenten anfordern möchten, erstellen Sie eine Anfrage für die Netzwerkkontingente und eine weitere für die Compute Engine-VM-Kontingente.