Kontingentanpassung

Auf dieser Seite wird beschrieben, wie Sie Kontingente mithilfe des Kontingentanpassungssystems anpassen.

Die Kontingentanpassung beobachtet Ihren Ressourcenverbrauch und sendet proaktiv Anfragen zur Kontingentanpassung in Ihrem Namen. Wenn Sie Ihre Ressourcennutzung im Blick behalten und proaktiv Anträge auf Kontingentanpassung stellen, können Sie Ausfälle vermeiden, die durch das Erreichen Ihres Kontingentwerts verursacht werden. Mit der Kontingentanpassung müssen Sie weniger auf ungeplante Steigerungen der Ressourcennutzung achten und können weniger manuelle Anträge auf Kontingentanpassungen stellen.

Funktionsweise der Kontingentanpassung

Wenn Sie die Kontingentanpassung aktivieren, werden alle anwendbaren Kontingente überwacht und die folgende Logik wird angewendet:

  • Die Kontingentanpassung prüft, ob die Spitzennutzung während eines bestimmten Zeitraums das Kontingentwert erreicht hat.
  • Wenn ja, versucht die Kontingentanpassung, das Kontingentlimit zu erhöhen (in der Regel etwa 10 bis 20 %).

Wenn es möglich ist, den Kontingentwert zu erhöhen, wird die Erhöhung genehmigt und der Wert angepasst. Sie können jederzeit manuell Erhöhungen für Kontingentwerte anfordern, unabhängig davon, ob die Kontingentanpassung aktiviert ist oder nicht.

Die Kontingentanpassung sendet nur Anfragen zur Kontingentanpassung, um den Wert eines Kontingents zu erhöhen. Es wird nicht versucht, den Wert zu senken. Für Kontingente mit einer manuellen Kontingentobergrenze werden keine Anfragen zur Kontingentanpassung eingereicht.

Sie können Anfragen, die von der Kontingentanpassung gesendet wurden, in derGoogle Cloud Console auf der Seite „Kontingente und Systemlimits“ einsehen. Sie können auch Benachrichtigungen einrichten, um Änderungen zu überwachen, die durch die Kontingentanpassung initiiert wurden.

Beschränkungen

Für die Kontingentanpassung gelten die folgenden Einschränkungen:

  • Die Einstellungen für die Kontingentanpassung sind nur auf Projektbasis verfügbar.
  • Die Einstellungen für die Kontingentanpassung sind nur über dieGoogle Cloud -Konsole zugänglich.

Verfügbarkeit

Für die Kontingentanpassung ist eine ausreichende Menge an Verlaufsdaten zur Nutzung erforderlich, um genau bestimmen zu können, wann zusätzliche Kontingente angefordert werden sollen. Aus diesem Grund ist die Option zur Aktivierung der Kontingentanpassung nur für Projekte mit ausreichend früheren Aktivitäten verfügbar, um genaue Vorhersagen zu unterstützen.

So rufen Sie die Liste der Kontingente auf, die von der Kontingentanpassung angepasst werden können:

  1. Rufen Sie in der Google Cloud Console die Seite IAM und Verwaltung > Kontingente und Systemlimits auf:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen, um die Liste aufzurufen.

    Alternativ können Sie in der folgenden Tabelle nach einem Keyword suchen. Geben Sie dazu ein Keyword in das Feld Tabelle nach Keyword filtern ein.

    Dienst Kontingente
    Artifact Registry API Anfragen pro Projekt in der Multi-Region „Asien“ pro Minute
    Artifact Registry API Anfragen pro Projekt in der Mehrfachregion Europa pro Minute
    Artifact Registry API Anfragen pro Projekt in der US-Mehrfachregion pro Minute
    Artifact Registry API Anfragen pro Projekt pro Region und Minute pro Region
    Cloud Build API Build- und Operation-Get-Anfragen pro Minute
    Cloud Build API Build- und Operation-Get-Anfragen pro Minute und Nutzer
    Cloud Build API Gleichzeitige Build-CPUs (regionaler Standardpool)
    Cloud Build API Gleichzeitige Builds (nicht regionaler Standardpool)
    Cloud Key Management Service API Kryptografische Anfragen pro Minute
    Cloud Key Management Service API Leseanfragen pro Minute
    Cloud Key Management Service API Schreibanfragen pro Minute
    Cloud Logging API Geschriebene Log-Byte pro Minute und Region
    Cloud Resource Manager API Leseanfragen pro Minute
    Cloud Run Admin API Anfragen für Jobausführungen pro Minute und Region
    Cloud Run Admin API Leseanfragen pro Minute und Region
    Cloud Run Admin API Gesamte CPU-Zuweisung in Milli-vCPUs pro Projekt und Region
    Cloud Run Admin API Leseanfragen pro Minute und Region
    Cloud Trace API Schreibanfragen (kostenlos) pro Minute
    Compute Engine API Affinitätsgruppen
    Compute Engine API Backend-Buckets
    Compute Engine API C2-CPUs
    Compute Engine API C2D-CPUs
    Compute Engine API C3-CPUs
    Compute Engine API Zusicherungen
    Compute Engine API Zugesicherte A2-CPUs
    Compute Engine API Zugesicherte CPUs
    Compute Engine API Vergebene Lizenzen
    Compute Engine API Reservierter zugesicherter lokaler SSD-Speicherplatz (GB)
    Compute Engine API Zugesicherte M3-CPUs
    Compute Engine API Zugesicherte speicheroptimierte CPUs
    Compute Engine API Zugesicherte N2-CPUs
    Compute Engine API Zugesicherte N2D-CPUs
    Compute Engine API Zugesicherte T2D-CPUs
    Compute Engine API CPUs
    Compute Engine API CPUs pro VM-Familie
    Compute Engine API Projekte mit projektübergreifendem Netzwerkdienst
    Compute Engine API Benutzerdefinierte statische Routen pro VPC-Netzwerk
    Compute Engine API Externe Passthrough-Back-End-Dienste des Netzwerk-Load-Balancers
    Compute Engine API Weiterleitungsregeln für externe Passthrough-Network-Load-Balancer
    Compute Engine API Weiterleitungsregeln für externe Protokolle
    Compute Engine API Firewallregeln
    Compute Engine API Weiterleitungsregeln
    Compute Engine API Globale extern verwaltete Backend-Dienste
    Compute Engine API Globale extern verwaltete Weiterleitungsregeln
    Compute Engine API Backend-Dienste von globalen externen Proxy-Load-Balancern
    Compute Engine API Globale interne Traffic Director-Backend-Dienste
    Compute Engine API GPU-Anzahl pro GPU-Familie
    Compute Engine API GPUs (alle Regionen)
    Compute Engine API Systemdiagnosen
    Compute Engine API Kapazität für Hyperdisk Balanced (GB)
    Compute Engine API Bilder
    Compute Engine API IP-Adressen in Verwendung
    Compute Engine API In Verwendung befindliche regionale externe IPv4-Adressen
    Compute Engine API Snapshot-Zeitpläne in Verwendung
    Compute Engine API Instanzgruppen
    Compute Engine API Instanzvorlagen
    Compute Engine API Instanzen pro Peering-Gruppe
    Compute Engine API Instanzen pro VPC-Netzwerk
    Compute Engine API Interne IP-Adressen
    Compute Engine API Back-End-Dienste des internen Passthrough-Netzwerk-Load-Balancers
    Compute Engine API Weiterleitungsregeln für interne Passthrough-Network Load Balancer pro Peering-Gruppe
    Compute Engine API Weiterleitungsregeln für interne Passthrough-Network-Load-Balancer pro VPC-Netzwerk
    Compute Engine API IP-Aliasse pro Peering-Gruppe
    Compute Engine API IP-Aliasse pro VPC-Netzwerk
    Compute Engine API Lokales SSD-Laufwerk pro VM-Familie (GB)
    Compute Engine API M1-CPUs
    Compute Engine API M2-CPUs
    Compute Engine API M3-CPUs
    Compute Engine API Verwaltete Instanzgruppen
    Compute Engine API N2-CPUs
    Compute Engine API N2D-CPUs
    Compute Engine API Netzwerk-Endpunktgruppen
    Compute Engine API Netzwerk-Firewallrichtlinien
    Compute Engine API Attribute von Sicherheitsrichtlinienregeln für Network Load Balancing
    Compute Engine API Sicherheitsrichtlinien für das Netzwerk-Load-Balancing
    Compute Engine API Netzwerke
    Compute Engine API NVIDIA A2-CPUs
    Compute Engine API Peerings pro VPC-Netzwerk
    Compute Engine API Persistent Disk-IOPS
    Compute Engine API Nichtflüchtiger SSD-Speicher (GB):
    Compute Engine API Nichtflüchtiger Standardspeicher (GB)
    Compute Engine API Präemptive CPUs
    Compute Engine API Lokale SSD auf Abruf (GB)
    Compute Engine API NVIDIA A100-GPUs mit 80 GB auf Abruf
    Compute Engine API NVIDIA A100-GPUs auf Abruf
    Compute Engine API NVIDIA H100-GPUs auf Abruf
    Compute Engine API NVIDIA H100 MEGA-GPUs auf Abruf
    Compute Engine API NVIDIA K80-GPUs auf Abruf
    Compute Engine API NVIDIA L4-GPUs auf Abruf
    Compute Engine API NVIDIA L4-GPUs auf Abruf für virtuelle Workstations
    Compute Engine API NVIDIA P100-GPUs auf Abruf
    Compute Engine API NVIDIA P100-GPUs auf Abruf für virtuelle Workstations
    Compute Engine API NVIDIA P4-GPUs auf Abruf
    Compute Engine API NVIDIA P4-GPUs auf Abruf für virtuelle Workstations
    Compute Engine API NVIDIA T4-GPUs auf Abruf
    Compute Engine API NVIDIA T4-GPUs auf Abruf für virtuelle Workstations
    Compute Engine API NVIDIA V100-GPUs auf Abruf für virtuelle Workstations
    Compute Engine API Öffentliche Beworbene Präfixe
    Compute Engine API Regionale extern verwaltete Backend-Dienste
    Compute Engine API Regionale extern verwaltete Weiterleitungsregeln pro Region und VPC-Netzwerk
    Compute Engine API Regionale Instanzvorlagen
    Compute Engine API Regionale intern verwaltete Backend-Dienste
    Compute Engine API Regionale interne Traffic Director-Backend-Dienste
    Compute Engine API Regional verwaltete Instanzgruppen
    Compute Engine API Regionale Sicherheitsrichtlinien
    Compute Engine API Regionale Regeln für Sicherheitsrichtlinien mit einer erweiterten Bedingung
    Compute Engine API Regionale TCP-Zielproxys
    Compute Engine API Router
    Compute Engine API Routen
    Compute Engine API Sicherheitsrichtlinien
    Compute Engine API Regeln für Sicherheitsrichtlinien
    Compute Engine API Sprachregeln für Sicherheitsrichtlinienregeln
    Compute Engine API Snapshots
    Compute Engine API SSL-Zertifikate
    Compute Engine API Statische BYOIP-IP-Adressen
    Compute Engine API Statische IP-Adressen
    Compute Engine API Subnetzbereiche pro Peering-Gruppe
    Compute Engine API Subnetzwerkbereiche pro VPC-Netzwerk
    Compute Engine API T2A-CPUs
    Compute Engine API T2D-CPUs
    Compute Engine API Ziel-HTTP-Proxys
    Compute Engine API Ziel-HTTPS-Proxys
    Compute Engine API Ziel-SSL-Proxys
    Compute Engine API Ziel-TCP-Proxys
    Compute Engine API Ziel-VPN-Gateways
    Compute Engine API Reservierter lokaler SSD-Speicher gesamt (GB)
    Compute Engine API URL-Zuordnungen
    Compute Engine API VM-Instanzen
    Compute Engine API VPN-Gateways
    Compute Engine API VPN-Tunnel
    Connect Gateway API Gateway-Verbindungsanfragen pro Minute
    Dialogflow API Alle anderen Anfragen pro Minute
    Filestore API Sicherungen pro Region
    Filestore API Kapazität von Basic HDD (Standard) (GB) nach Region
    Filestore API Kapazität von Basic SSD (Premium) (GB) nach Region
    Filestore API Zonale und regionale Kapazität (GB) von 1–10 TiB (Enterprise) pro Region
    Filestore API Zonale und regionale Kapazität (GB) von 10–100 TiB (High Scale) pro Region
    Google Cloud Memorystore for Redis API Redis-Gesamtkapazität (GB) pro Region
    Google Cloud Memorystore for Redis API Gesamtzahl der Redis-Cluster-Einheiten pro Projekt und Region
    Memorystore API Gesamtzahl der Memorystore-Einheiten pro Projekt und Region
    Vertex AI API Benutzerdefinierte CPUs für die Bereitstellung von Modellen pro Region
    Vertex AI API Bereitstellung von benutzerdefinierten Modellen mit Nvidia T4-GPUs pro Region
    Vertex AI API Training von benutzerdefiniertem Modell mit Nvidia T4-GPUs pro Region
    Vertex AI API Anfragen zum Generieren von Inhalten pro Minute und Projekt und Basismodell
    Vertex AI API

    Regionale Anfragen für Onlinevorhersagen pro Minute und Projekt pro Basismodell

    Hinweis: Eine vollständige Liste der verfügbaren Dimensionen finden Sie in der Google Cloud -Konsole.

    Vertex AI API Resource Management (CRUD)-Anfragen pro Minute und Region
    Vertex AI API Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region

Kontingentanpassung aktivieren

Zum Aktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

So aktivieren Sie die Kontingentanpassung für ein Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:

Console

So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud Projekt über die Google Cloud Konsole:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf den Schalter Aktivieren.

Wenn in der Spalte Status Aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung und sendet Anfragen zur Kontingentanpassung, wenn die Ressourcennutzung den Kontingentwert erreicht.

REST

  1. So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion): Senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld enablement auf ENABLED. Sie können auch ein ETag angeben. Das ist jedoch optional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.
    • OPTIONAL_ETAG: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.

    Dadurch wird der Aktivierungsstatus auf enabled aktualisiert.

gcloud

So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt mit der gcloud CLI (Vorschau):

  1. Authentifizieren Sie sich mit der gcloud CLI:

    gcloud auth login
    
  2. Einstellungen für die Kontingentanpassung aktivieren:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Ersetzen Sie PROJECT_ID_OR_NUMBER durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.

  3. Prüfen Sie den Aktivierungsstatus:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als enabled zurückgegeben.

Anfragen zur Kontingentanpassung ansehen

Zum Aufrufen von Anfragen zur Kontingenterhöhung benötigen Sie die folgenden IAM-Berechtigungen:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

So rufen Sie Anfragen zur Kontingentanpassung auf, die von der Kontingentanpassung ausgegeben wurden:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Anfragen erhöhen. In der Ansicht Anfragen erhöhen sehen Sie Erhöhungsanfragen für Ihr Projekt, einschließlich sowohl manuell angeforderter als auch durch die Kontingentanpassung erhöhter Kontingente.
  3. Klicken Sie auf das Feld Filter.
  4. Wählen Sie im Menü Typ aus und geben Sie Auto ein. Hier werden Anfragen gefiltert, die von der Kontingentanpassung gesendet wurden.

Benachrichtigungen zur Kontingentanpassung einrichten

So erhalten Sie Benachrichtigungen von der Kontingentanpassung:

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf Benachrichtigung erstellen.
  4. Wählen Sie eine oder beide Benachrichtigungsvorlagen aus:
    1. Alle Anpassungen durch die Kontingentanpassung senden jedes Mal eine Benachrichtigung, wenn die Kontingentanpassung eine Anfrage zur Kontingentanpassung für das Projekt ausgibt.
    2. Fehler und Störungen der Kontingentanpassung senden nur dann Benachrichtigungen, wenn die Kontingentanpassung versucht, ein Kontingentlimit zu erhöhen und dies nicht möglich ist.
  5. Optional: Sie können die Standardwerte für die Mindestdauer zwischen Benachrichtigungen und die Dauer bis zur automatischen Schließung von Vorfällen anpassen, indem Sie auf Optionen anzeigen klicken.
  6. Wählen Sie den Benachrichtigungskanal aus, über den Sie Benachrichtigungen erhalten möchten. Wenn Sie Ihre Einstellungen für den Benachrichtigungskanal anpassen oder einen neuen Benachrichtigungskanal erstellen möchten, klicken Sie auf Benachrichtigungskanäle verwalten.
  7. Klicken Sie auf Erstellen.

Benachrichtigungen zur Kontingentanpassung bearbeiten oder löschen

Sie können Benachrichtigungen zur Kontingentanpassung in derGoogle Cloud -Konsole bearbeiten oder löschen:

  1. Rufen Sie in der Cloud Monitoring Console die Seite Richtlinien auf.

    Zu den Richtlinien

  2. Suchen Sie nach der Benachrichtigungsrichtlinie für die Kontingentanpassung. Diese Richtlinien haben folgende Namen:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Klicken Sie in der Zeile mit der Benachrichtigungsrichtlinie für den Kontingentsmanager auf Mehr anzeigen.

  4. Klicken Sie auf Bearbeiten oder Löschen.

Kontingentanpassung deaktivieren

Zum Deaktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:

Console

  1. Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:

    Zur Seite „Kontingente und Systemlimits“

  2. Klicken Sie auf den Tab Konfigurationen.
  3. Klicken Sie auf den Schalter Aktivieren. Der Schalter wird grau.

Wenn der Schalter grau ist und in der Statusspalte Nicht aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung nicht mehr und sendet keine Anfragen zur Kontingentanpassung mehr.

REST

  1. Wenn Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion) deaktivieren möchten, senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld enablement auf DISABLED. Sie können auch ein ETag angeben. Das ist jedoch optional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Ersetzen Sie Folgendes:

    • PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.
    • OPTIONAL_ETAG: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.

    Dadurch wird der Aktivierungsstatus auf disabled aktualisiert.

gcloud

So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud Projekt über die gcloud CLI (Vorabversion):

  1. Authentifizieren Sie sich in der gcloud CLI:

    gcloud auth login
    
  2. So deaktivieren Sie die Einstellungen für die Kontingentanpassung:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Ersetzen Sie PROJECT_ID_OR_NUMBER durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.

  3. Aktivierungsstatus prüfen:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als disabled zurückgegeben.

Fehlerbehebung bei Ablehnungen von Kontingenterhöhungen

Es kann vorkommen, dass eine durch die Kontingentanpassung initiierte Kontingenterhöhung abgelehnt wird. Dies kann vorkommen, wenn Google Cloud das Kontingentlimit für ein bestimmtes Projekt, eine Ressource oder eine Region nicht über ein bestimmtes Limit hinaus erhöhen kann. In diesen Fällen können Sie immer noch eine manuelle Kontingenterhöhung anfordern.

Wenn Sie benachrichtigt werden möchten, wenn ein Antrag auf Kontingentanpassung abgelehnt wird, richten Sie Benachrichtigungen zur Kontingentanpassung ein.