Auf dieser Seite wird beschrieben, wie Sie Kontingente mithilfe des Kontingentanpassungssystems anpassen.
Die Kontingentanpassung beobachtet Ihren Ressourcenverbrauch und sendet proaktiv Anfragen zur Kontingentanpassung in Ihrem Namen. Wenn Sie Ihre Ressourcennutzung im Blick behalten und proaktiv Anträge auf Kontingentanpassung stellen, können Sie Ausfälle vermeiden, die durch das Erreichen Ihres Kontingentwerts verursacht werden. Mit der Kontingentanpassung müssen Sie weniger auf ungeplante Steigerungen der Ressourcennutzung achten und können weniger manuelle Anträge auf Kontingentanpassungen stellen.
Funktionsweise der Kontingentanpassung
Wenn Sie die Kontingentanpassung aktivieren, werden alle anwendbaren Kontingente überwacht und die folgende Logik wird angewendet:
- Die Kontingentanpassung prüft, ob die Spitzennutzung während eines bestimmten Zeitraums das Kontingentwert erreicht hat.
- Wenn ja, versucht die Kontingentanpassung, das Kontingentlimit zu erhöhen (in der Regel etwa 10 bis 20 %).
Wenn es möglich ist, den Kontingentwert zu erhöhen, wird die Erhöhung genehmigt und der Wert angepasst. Sie können jederzeit manuell Erhöhungen für Kontingentwerte anfordern, unabhängig davon, ob die Kontingentanpassung aktiviert ist oder nicht.
Die Kontingentanpassung sendet nur Anfragen zur Kontingentanpassung, um den Wert eines Kontingents zu erhöhen. Es wird nicht versucht, den Wert zu senken. Für Kontingente mit einer manuellen Kontingentobergrenze werden keine Anfragen zur Kontingentanpassung eingereicht.
Sie können Anfragen, die von der Kontingentanpassung gesendet wurden, in derGoogle Cloud Console auf der Seite „Kontingente und Systemlimits“ einsehen. Sie können auch Benachrichtigungen einrichten, um Änderungen zu überwachen, die durch die Kontingentanpassung initiiert wurden.
Beschränkungen
Für die Kontingentanpassung gelten die folgenden Einschränkungen:
- Die Einstellungen für die Kontingentanpassung sind nur auf Projektbasis verfügbar.
- Die Einstellungen für die Kontingentanpassung sind nur über dieGoogle Cloud -Konsole zugänglich.
Verfügbarkeit
Für die Kontingentanpassung ist eine ausreichende Menge an Verlaufsdaten zur Nutzung erforderlich, um genau bestimmen zu können, wann zusätzliche Kontingente angefordert werden sollen. Aus diesem Grund ist die Option zur Aktivierung der Kontingentanpassung nur für Projekte mit ausreichend früheren Aktivitäten verfügbar, um genaue Vorhersagen zu unterstützen.
So rufen Sie die Liste der Kontingente auf, die von der Kontingentanpassung angepasst werden können:
Rufen Sie in der Google Cloud Console die Seite IAM und Verwaltung > Kontingente und Systemlimits auf:
Klicken Sie auf den Tab Konfigurationen, um die Liste aufzurufen.
Alternativ können Sie in der folgenden Tabelle nach einem Keyword suchen. Geben Sie dazu ein Keyword in das Feld Tabelle nach Keyword filtern ein.
Dienst Kontingente Artifact Registry API Anfragen pro Projekt in der Multi-Region „Asien“ pro Minute Artifact Registry API Anfragen pro Projekt in der Mehrfachregion Europa pro Minute Artifact Registry API Anfragen pro Projekt in der US-Mehrfachregion pro Minute Artifact Registry API Anfragen pro Projekt pro Region und Minute pro Region Cloud Build API Build- und Operation-Get-Anfragen pro Minute Cloud Build API Build- und Operation-Get-Anfragen pro Minute und Nutzer Cloud Build API Gleichzeitige Build-CPUs (regionaler Standardpool) Cloud Build API Gleichzeitige Builds (nicht regionaler Standardpool) Cloud Key Management Service API Kryptografische Anfragen pro Minute Cloud Key Management Service API Leseanfragen pro Minute Cloud Key Management Service API Schreibanfragen pro Minute Cloud Logging API Geschriebene Log-Byte pro Minute und Region Cloud Resource Manager API Leseanfragen pro Minute Cloud Run Admin API Anfragen für Jobausführungen pro Minute und Region Cloud Run Admin API Leseanfragen pro Minute und Region Cloud Run Admin API Gesamte CPU-Zuweisung in Milli-vCPUs pro Projekt und Region Cloud Run Admin API Leseanfragen pro Minute und Region Cloud Trace API Schreibanfragen (kostenlos) pro Minute Compute Engine API Affinitätsgruppen Compute Engine API Backend-Buckets Compute Engine API C2-CPUs Compute Engine API C2D-CPUs Compute Engine API C3-CPUs Compute Engine API Zusicherungen Compute Engine API Zugesicherte A2-CPUs Compute Engine API Zugesicherte CPUs Compute Engine API Vergebene Lizenzen Compute Engine API Reservierter zugesicherter lokaler SSD-Speicherplatz (GB) Compute Engine API Zugesicherte M3-CPUs Compute Engine API Zugesicherte speicheroptimierte CPUs Compute Engine API Zugesicherte N2-CPUs Compute Engine API Zugesicherte N2D-CPUs Compute Engine API Zugesicherte T2D-CPUs Compute Engine API CPUs Compute Engine API CPUs pro VM-Familie Compute Engine API Projekte mit projektübergreifendem Netzwerkdienst Compute Engine API Benutzerdefinierte statische Routen pro VPC-Netzwerk Compute Engine API Externe Passthrough-Back-End-Dienste des Netzwerk-Load-Balancers Compute Engine API Weiterleitungsregeln für externe Passthrough-Network-Load-Balancer Compute Engine API Weiterleitungsregeln für externe Protokolle Compute Engine API Firewallregeln Compute Engine API Weiterleitungsregeln Compute Engine API Globale extern verwaltete Backend-Dienste Compute Engine API Globale extern verwaltete Weiterleitungsregeln Compute Engine API Backend-Dienste von globalen externen Proxy-Load-Balancern Compute Engine API Globale interne Traffic Director-Backend-Dienste Compute Engine API GPU-Anzahl pro GPU-Familie Compute Engine API GPUs (alle Regionen) Compute Engine API Systemdiagnosen Compute Engine API Kapazität für Hyperdisk Balanced (GB) Compute Engine API Bilder Compute Engine API IP-Adressen in Verwendung Compute Engine API In Verwendung befindliche regionale externe IPv4-Adressen Compute Engine API Snapshot-Zeitpläne in Verwendung Compute Engine API Instanzgruppen Compute Engine API Instanzvorlagen Compute Engine API Instanzen pro Peering-Gruppe Compute Engine API Instanzen pro VPC-Netzwerk Compute Engine API Interne IP-Adressen Compute Engine API Back-End-Dienste des internen Passthrough-Netzwerk-Load-Balancers Compute Engine API Weiterleitungsregeln für interne Passthrough-Network Load Balancer pro Peering-Gruppe Compute Engine API Weiterleitungsregeln für interne Passthrough-Network-Load-Balancer pro VPC-Netzwerk Compute Engine API IP-Aliasse pro Peering-Gruppe Compute Engine API IP-Aliasse pro VPC-Netzwerk Compute Engine API Lokales SSD-Laufwerk pro VM-Familie (GB) Compute Engine API M1-CPUs Compute Engine API M2-CPUs Compute Engine API M3-CPUs Compute Engine API Verwaltete Instanzgruppen Compute Engine API N2-CPUs Compute Engine API N2D-CPUs Compute Engine API Netzwerk-Endpunktgruppen Compute Engine API Netzwerk-Firewallrichtlinien Compute Engine API Attribute von Sicherheitsrichtlinienregeln für Network Load Balancing Compute Engine API Sicherheitsrichtlinien für das Netzwerk-Load-Balancing Compute Engine API Netzwerke Compute Engine API NVIDIA A2-CPUs Compute Engine API Peerings pro VPC-Netzwerk Compute Engine API Persistent Disk-IOPS Compute Engine API Nichtflüchtiger SSD-Speicher (GB): Compute Engine API Nichtflüchtiger Standardspeicher (GB) Compute Engine API Präemptive CPUs Compute Engine API Lokale SSD auf Abruf (GB) Compute Engine API NVIDIA A100-GPUs mit 80 GB auf Abruf Compute Engine API NVIDIA A100-GPUs auf Abruf Compute Engine API NVIDIA H100-GPUs auf Abruf Compute Engine API NVIDIA H100 MEGA-GPUs auf Abruf Compute Engine API NVIDIA K80-GPUs auf Abruf Compute Engine API NVIDIA L4-GPUs auf Abruf Compute Engine API NVIDIA L4-GPUs auf Abruf für virtuelle Workstations Compute Engine API NVIDIA P100-GPUs auf Abruf Compute Engine API NVIDIA P100-GPUs auf Abruf für virtuelle Workstations Compute Engine API NVIDIA P4-GPUs auf Abruf Compute Engine API NVIDIA P4-GPUs auf Abruf für virtuelle Workstations Compute Engine API NVIDIA T4-GPUs auf Abruf Compute Engine API NVIDIA T4-GPUs auf Abruf für virtuelle Workstations Compute Engine API NVIDIA V100-GPUs auf Abruf für virtuelle Workstations Compute Engine API Öffentliche Beworbene Präfixe Compute Engine API Regionale extern verwaltete Backend-Dienste Compute Engine API Regionale extern verwaltete Weiterleitungsregeln pro Region und VPC-Netzwerk Compute Engine API Regionale Instanzvorlagen Compute Engine API Regionale intern verwaltete Backend-Dienste Compute Engine API Regionale interne Traffic Director-Backend-Dienste Compute Engine API Regional verwaltete Instanzgruppen Compute Engine API Regionale Sicherheitsrichtlinien Compute Engine API Regionale Regeln für Sicherheitsrichtlinien mit einer erweiterten Bedingung Compute Engine API Regionale TCP-Zielproxys Compute Engine API Router Compute Engine API Routen Compute Engine API Sicherheitsrichtlinien Compute Engine API Regeln für Sicherheitsrichtlinien Compute Engine API Sprachregeln für Sicherheitsrichtlinienregeln Compute Engine API Snapshots Compute Engine API SSL-Zertifikate Compute Engine API Statische BYOIP-IP-Adressen Compute Engine API Statische IP-Adressen Compute Engine API Subnetzbereiche pro Peering-Gruppe Compute Engine API Subnetzwerkbereiche pro VPC-Netzwerk Compute Engine API T2A-CPUs Compute Engine API T2D-CPUs Compute Engine API Ziel-HTTP-Proxys Compute Engine API Ziel-HTTPS-Proxys Compute Engine API Ziel-SSL-Proxys Compute Engine API Ziel-TCP-Proxys Compute Engine API Ziel-VPN-Gateways Compute Engine API Reservierter lokaler SSD-Speicher gesamt (GB) Compute Engine API URL-Zuordnungen Compute Engine API VM-Instanzen Compute Engine API VPN-Gateways Compute Engine API VPN-Tunnel Connect Gateway API Gateway-Verbindungsanfragen pro Minute Dialogflow API Alle anderen Anfragen pro Minute Filestore API Sicherungen pro Region Filestore API Kapazität von Basic HDD (Standard) (GB) nach Region Filestore API Kapazität von Basic SSD (Premium) (GB) nach Region Filestore API Zonale und regionale Kapazität (GB) von 1–10 TiB (Enterprise) pro Region Filestore API Zonale und regionale Kapazität (GB) von 10–100 TiB (High Scale) pro Region Google Cloud Memorystore for Redis API Redis-Gesamtkapazität (GB) pro Region Google Cloud Memorystore for Redis API Gesamtzahl der Redis-Cluster-Einheiten pro Projekt und Region Memorystore API Gesamtzahl der Memorystore-Einheiten pro Projekt und Region Vertex AI API Benutzerdefinierte CPUs für die Bereitstellung von Modellen pro Region Vertex AI API Bereitstellung von benutzerdefinierten Modellen mit Nvidia T4-GPUs pro Region Vertex AI API Training von benutzerdefiniertem Modell mit Nvidia T4-GPUs pro Region Vertex AI API Anfragen zum Generieren von Inhalten pro Minute und Projekt und Basismodell Vertex AI API Regionale Anfragen für Onlinevorhersagen pro Minute und Projekt pro Basismodell
Hinweis: Eine vollständige Liste der verfügbaren Dimensionen finden Sie in der Google Cloud -Konsole.
Vertex AI API Resource Management (CRUD)-Anfragen pro Minute und Region Vertex AI API Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region
Kontingentanpassung aktivieren
Zum Aktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:
cloudquotas.quotas.update
cloudquotas.quotas.get
So aktivieren Sie die Kontingentanpassung für ein Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:
Console
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud Projekt über die Google Cloud Konsole:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf den Schalter Aktivieren.
Wenn in der Spalte Status Aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung und sendet Anfragen zur Kontingentanpassung, wenn die Ressourcennutzung den Kontingentwert erreicht.
REST
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion): Senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld
enablement
aufENABLED
. Sie können auch ein ETag angeben. Das ist jedoch optional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: ENABLED etag: OPTIONAL_ETAG }
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER
: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.OPTIONAL_ETAG
: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.
Dadurch wird der Aktivierungsstatus auf
enabled
aktualisiert.
gcloud
So aktivieren Sie die Kontingentanpassung für Ihr Google Cloud -Projekt mit der gcloud CLI (Vorschau):
Authentifizieren Sie sich mit der gcloud CLI:
gcloud auth login
Einstellungen für die Kontingentanpassung aktivieren:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
Ersetzen Sie
PROJECT_ID_OR_NUMBER
durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser aktivieren möchten.Prüfen Sie den Aktivierungsstatus:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als
enabled
zurückgegeben.
Anfragen zur Kontingentanpassung ansehen
Zum Aufrufen von Anfragen zur Kontingenterhöhung benötigen Sie die folgenden IAM-Berechtigungen:
resourcemanager.projects.get
serviceusage.services.list
serviceusage.quotas.get
So rufen Sie Anfragen zur Kontingentanpassung auf, die von der Kontingentanpassung ausgegeben wurden:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Anfragen erhöhen. In der Ansicht Anfragen erhöhen sehen Sie Erhöhungsanfragen für Ihr Projekt, einschließlich sowohl manuell angeforderter als auch durch die Kontingentanpassung erhöhter Kontingente.
- Klicken Sie auf das Feld Filter.
- Wählen Sie im Menü Typ aus und geben Sie
Auto
ein. Hier werden Anfragen gefiltert, die von der Kontingentanpassung gesendet wurden.
Benachrichtigungen zur Kontingentanpassung einrichten
So erhalten Sie Benachrichtigungen von der Kontingentanpassung:
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf Benachrichtigung erstellen.
- Wählen Sie eine oder beide Benachrichtigungsvorlagen aus:
- Alle Anpassungen durch die Kontingentanpassung senden jedes Mal eine Benachrichtigung, wenn die Kontingentanpassung eine Anfrage zur Kontingentanpassung für das Projekt ausgibt.
- Fehler und Störungen der Kontingentanpassung senden nur dann Benachrichtigungen, wenn die Kontingentanpassung versucht, ein Kontingentlimit zu erhöhen und dies nicht möglich ist.
- Optional: Sie können die Standardwerte für die Mindestdauer zwischen Benachrichtigungen und die Dauer bis zur automatischen Schließung von Vorfällen anpassen, indem Sie auf Optionen anzeigen klicken.
- Wählen Sie den Benachrichtigungskanal aus, über den Sie Benachrichtigungen erhalten möchten. Wenn Sie Ihre Einstellungen für den Benachrichtigungskanal anpassen oder einen neuen Benachrichtigungskanal erstellen möchten, klicken Sie auf Benachrichtigungskanäle verwalten.
- Klicken Sie auf Erstellen.
Benachrichtigungen zur Kontingentanpassung bearbeiten oder löschen
Sie können Benachrichtigungen zur Kontingentanpassung in derGoogle Cloud -Konsole bearbeiten oder löschen:
Rufen Sie in der Cloud Monitoring Console die Seite Richtlinien auf.
Suchen Sie nach der Benachrichtigungsrichtlinie für die Kontingentanpassung. Diese Richtlinien haben folgende Namen:
Quota adjuster errors and failures
All adjustments by quota adjuster
Klicken Sie in der Zeile mit der Benachrichtigungsrichtlinie für den Kontingentsmanager auf
Mehr anzeigen.Klicken Sie auf Bearbeiten oder Löschen.
Kontingentanpassung deaktivieren
Zum Deaktivieren der Kontingentanpassung benötigen Sie die folgenden IAM-Berechtigungen:
cloudquotas.quotas.update
cloudquotas.quotas.get
So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud -Konsolenprojekt: Wählen Sie den entsprechenden Tab aus und folgen Sie der Anleitung:
Console
- Gehen Sie in der Google Cloud Console zu IAM und Verwaltung > Kontingente und Systemlimits:
- Klicken Sie auf den Tab Konfigurationen.
- Klicken Sie auf den Schalter Aktivieren. Der Schalter wird grau.
Wenn der Schalter grau ist und in der Statusspalte Nicht aktiviert angezeigt wird, überwacht die Kontingentanpassung Ihre Nutzung nicht mehr und sendet keine Anfragen zur Kontingentanpassung mehr.
REST
Wenn Sie die Kontingentanpassung für Ihr Google Cloud -Projekt über die REST API (Vorabversion) deaktivieren möchten, senden Sie eine HTTP-Anfrage zum Aktualisieren der Einstellungen für die Kontingentanpassung:
PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
Geben Sie im Anfragetext die Ressource für die Einstellungen für die Kontingentanpassung an und setzen Sie das Feld
enablement
aufDISABLED
. Sie können auch ein ETag angeben. Das ist jedoch optional:{ name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings enablement: DISABLED etag: OPTIONAL_ETAG }
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER
: die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.OPTIONAL_ETAG
: Ein optionaler ETag-String für die Einstellungen für die Kontingentanpassung.
Dadurch wird der Aktivierungsstatus auf
disabled
aktualisiert.
gcloud
So deaktivieren Sie die Kontingentanpassung in Ihrem Google Cloud Projekt über die gcloud CLI (Vorabversion):
Authentifizieren Sie sich in der gcloud CLI:
gcloud auth login
So deaktivieren Sie die Einstellungen für die Kontingentanpassung:
gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
Ersetzen Sie
PROJECT_ID_OR_NUMBER
durch die Projekt-ID oder Projektnummer des Projekts, für das Sie den Kontingentanpasser deaktivieren möchten.Aktivierungsstatus prüfen:
gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
Sofern Sie die erforderlichen Berechtigungen haben, wird der Status als
disabled
zurückgegeben.
Fehlerbehebung bei Ablehnungen von Kontingenterhöhungen
Es kann vorkommen, dass eine durch die Kontingentanpassung initiierte Kontingenterhöhung abgelehnt wird. Dies kann vorkommen, wenn Google Cloud das Kontingentlimit für ein bestimmtes Projekt, eine Ressource oder eine Region nicht über ein bestimmtes Limit hinaus erhöhen kann. In diesen Fällen können Sie immer noch eine manuelle Kontingenterhöhung anfordern.
Wenn Sie benachrichtigt werden möchten, wenn ein Antrag auf Kontingentanpassung abgelehnt wird, richten Sie Benachrichtigungen zur Kontingentanpassung ein.