Diese Seite wurde von der Cloud Translation API übersetzt.

Vertex AI-Kontingente und -Limits

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .

Das Cloud-Kontingentsystem tut Folgendes:

Es überwacht Ihren Verbrauch von Produkten und Diensten von Google Cloud .
Es schränkt Ihren Verbrauch dieser Ressourcen ein.
Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Für Vertex AI-Ressourcen gelten außerdem Limits. Diese Limits stehen nicht im Zusammenhang mit dem Kontingentsystem. Limits können nicht geändert werden.

Ratenkontingente

Die folgenden Kontingente gelten für Vertex AI-Anfragen für angegebene Projekte und unterstützte Regionen. Sie können beispielsweise in einem Projekt bis zu 30.000 Anfragen pro Minute für Onlineinferenz in einer Region und weitere 30.000 Anfragen für Onlineinferenz pro Minute in einer anderen Region haben.

Art der Anfrage	Anfragen pro Minute
Resource Management (CRUD)-Anfragen¹	600
Anfragen zum Senden von Jobs oder Vorgängen mit langer Ausführungszeit	60
Anfragen für Onlineinferenz²	30.000
Durchsatz von Onlineinferenzanfragen	1,5 GB
Anfragen für Onlineerklärungen	600
Vertex AI TensorBoard-Leseanfragen für Zeitreihen	60.000
ML Metadata-Anfragen (CRUD)	12.000
CRUD-Anfragen für das Caching generativer KI	200
Vertex AI Vizier-Anfragen (CRUD)	6.000
Vertex AI Feature Store-Anfragen zur Onlinebereitstellung	300.000
Vertex ML Metadata-Anfragen	12.000
Anzahl der Anfragen für Zähl- oder Berechnungs-Tokens	3.000

¹ Anfragen zur Ressourcenverwaltung umfassen alle Anfragen, die kein Job, Vorgang mit langer Ausführungszeit, Onlineinferenzanfrage, Vertex AI Vizier-Anfrage, ML-Metadatenanfrage, Vertex AI TensorBoard Timeseries Insights API-Leseanfrage, Vertex AI Feature Store-Anfrage, Vertex AI Feature Store-Streaminganfrage oder Vector Search-Anfrage sind.

² Dieses Kontingent gilt nur für öffentliche Endpunkte.

Jobs oder LROs umfassen die folgenden Anfragen:

Datasets erstellen oder löschen
Daten in ein Dataset importieren oder aus einem Dataset exportieren.
Erstellen Sie einen Endpunkt.
Benutzerdefinierten Job erstellen oder löschen
Erstellen oder löschen Sie einen Daten-Labeling-Job.
Hyperparameter-Abstimmungsjob erstellen oder löschen
Batchinferenzjob erstellen oder löschen
Modell erstellen oder löschen
Modell hochladen, löschen oder exportieren
Notebook-Laufzeitvorlagen erstellen oder löschen
Notebook-Laufzeit zuweisen, löschen, starten oder upgraden.
Modellmonitor erstellen, löschen oder aktualisieren.
Erstellen oder löschen Sie einen Model Monitoring-Job.

Informationen zu Kontingenten für generative KI-Modelle finden Sie unter Kontingente und Limits für generative KI in Vertex AI.

Kontingente für AutoML-Modelle

Die folgenden Kontingente gelten für jeden Datentyp und jedes Ziel für angegebene Projekte und Regionen. Sie können beispielsweise in einem bestimmten Projekt und in einer bestimmten Region 10 AutoML-Bildklassifizierungsmodelle und 10 AutoML-Bildobjekterkennungsmodelle für insgesamt 20 erstellte Modelle bereitstellen.

Bild

Klassifizierung

Kontingent	Wert
Gleichzeitige Trainingsjobs	5
Gleichzeitige Trainingsjobs mit Explainable AI	2
Gleichzeitige Batchinferenzjobs	5
Gleichzeitige Jobs für die Modellbereitstellung	5
Gleichzeitige Jobs zur Aufhebung der Bereitstellung eines Modells	5
Anzahl der bereitgestellten Modelle	10

Objekterkennung

Kontingent	Wert
Gleichzeitige Trainingsjobs	5
Gleichzeitige Batchinferenzjobs	5
Anzahl der bereitgestellten Modelle	10

Tabellarisch

Kontingent	Wert
Gleichzeitige Trainingsjobs	5
Gleichzeitige Batchinferenzjobs	5
Anzahl der bereitgestellten Modelle	30

Vertex AI Model Registry

Die maximale Modellgröße, die von Vertex AI Model Registry unterstützt wird, beträgt 1 TB.

Limits für AutoML-Modelle

Die folgenden Limits gelten für jeden Datentyp für ein bestimmtes Projekt und eine bestimmte Region. Sie können beispielsweise in einem bestimmten Projekt und in einer bestimmten Region maximal 1.000.000 Bilder in eine Batch-Anfrage einfügen.

Bild

Art des Limits	Wert
Größe der Bilddatei	Maximum: 30 MB
Bilder pro Dataset	Maximum: 1.000.000
Labels pro Dataset	Minimum: 2 Maximum: 5.000
Bilder pro Label	Minimum: 10 Empfohlen: 1.000
Größe der Batch-Eingabe für CSV-Datei	Maximum: 100 MB
Anzahl der Bilder in der Batch-Eingabe	Maximum: 1.000.000

Tabellarisch

Art des Limits	Wert
Maximalgröße	100 GB
Zeilenanzahl	Zwischen 1.000 und 100 Millionen Zeilen
Anzahl der Spalten	Zwischen zwei und 1.000 Spalten
Anzahl gleichzeitig ausgeführter Dataset-Importe	5 Importe
Größe der CSV-Datei	Maximal: 10 GB pro Datei, bis zu einer maximalen Gesamtgröße von 100 GB

Video

Art des Limits	Wert
Maximale Videolänge	3 Stunden
Maximale Videodateigröße	50 GB
Label-Mindestanzahl pro Dataset	2
Video-Mindestanzahl pro Label	10 (1.000 werden empfohlen)
Größe der Batch-Eingabe für CSV-Datei	Maximum: 100 MB
Anzahl der Videosegmente in der Batch-Eingabe	Maximum: 1.000

Kontingente für benutzerdefiniert trainierte Modelle

Die folgenden Kontingente gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.

Training

Kontingent	Wert
Gleichzeitige benutzerdefinierte Trainingspipelines	2.000

Anzahl der N1- und E2-CPUs für das Training pro Region
Region	Wert
`us-west1`	2.200
`us-west2`	20
`us-west3`	2.200
`us-west4`	20
`us-central1`	2.200
`us-east1`	2.200
`us-east4`	20
`us-east5`	450
`us-south1`	450
`northamerica-northeast1`	2.200
`northamerica-northeast2`	20
`southamerica-east1`	20
`southamerica-west1`	20
`europe-west2`	2.200
`europe-west1`	2.200
`europe-west4`	2.200
`europe-west6`	20
`europe-west3`	2.200
`europe-north1`	20
`europe-central2`	450
`europe-west8`	20
`europe-west9`	450
`europe-southwest1`	20
`asia-south1`	2.200
`asia-south2`	20
`asia-southeast1`	2.200
`asia-southeast2`	2.200
`asia-east2`	2.200
`asia-east1`	2.200
`asia-northeast1`	2.200
`asia-northeast2`	20
`australia-southeast1`	2.200
`australia-southeast2`	20
`asia-northeast3`	2.200
`me-west1`	450
`me-central1`	450
`me-central2`	450
`europe-west12`	450
`africa-south1`	450

Anzahl der N2-CPUs für das Training pro Region
Region	Wert
`us-west1`	20
`us-west2`	20
`us-west3`	20
`us-west4`	20
`us-central1`	450
`us-east1`	20
`us-east4`	20
`us-east5`	450
`us-south1`	20
`northamerica-northeast1`	20
`northamerica-northeast2`	20
`southamerica-east1`	20
`southamerica-west1`	20
`europe-west2`	20
`europe-west1`	20
`europe-west4`	450
`europe-west6`	20
`europe-west3`	20
`europe-north1`	20
`europe-central2`	20
`europe-west8`	20
`europe-west9`	450
`europe-southwest1`	20
`asia-south1`	20
`asia-south2`	20
`asia-southeast1`	20
`asia-southeast2`	20
`asia-east2`	20
`asia-east1`	450
`asia-northeast1`	20
`asia-northeast2`	20
`australia-southeast1`	20
`australia-southeast2`	20
`asia-northeast3`	20
`me-west1`	20
`me-central1`	450
`me-central2`	450
`europe-west12`	450
`africa-south1`	450

Anzahl der M1-CPUs für das Training pro Region
Region	Wert
`us-west1`	0
`us-west2`	0
`us-west3`	0
`us-west4`	0
`us-central1`	0
`us-east1`	0
`us-east4`	0
`us-east5`	0
`us-south1`	0
`northamerica-northeast1`	0
`northamerica-northeast2`	0
`southamerica-east1`	0
`southamerica-west1`	0
`europe-west2`	0
`europe-west1`	0
`europe-west4`	0
`europe-west6`	0
`europe-west3`	0
`europe-north1`	0
`europe-central2`	0
`europe-west8`	0
`europe-west9`	0
`europe-southwest1`	0
`asia-south1`	0
`asia-south2`	0
`asia-southeast1`	0
`asia-southeast2`	0
`asia-east2`	0
`asia-east1`	0
`asia-northeast1`	0
`asia-northeast2`	0
`australia-southeast1`	0
`australia-southeast2`	0
`asia-northeast3`	0
`me-west1`	0
`me-central1`	0
`me-central2`	0
`europe-west12`	0
`africa-south1`	0

Anzahl der C2-CPUs für das Training pro Region
Region	Wert
`us-west1`	20
`us-west2`	20
`us-west3`	20
`us-west4`	20
`us-central1`	450
`us-east1`	20
`us-east4`	20
`us-east5`	450
`us-south1`	20
`northamerica-northeast1`	20
`northamerica-northeast2`	20
`southamerica-east1`	20
`southamerica-west1`	20
`europe-west2`	20
`europe-west1`	20
`europe-west4`	450
`europe-west6`	20
`europe-west3`	20
`europe-north1`	20
`europe-central2`	20
`europe-west8`	20
`europe-west9`	450
`europe-southwest1`	20
`asia-south1`	20
`asia-south2`	20
`asia-southeast1`	20
`asia-southeast2`	20
`asia-east2`	20
`asia-east1`	450
`asia-northeast1`	20
`asia-northeast2`	20
`australia-southeast1`	20
`australia-southeast2`	20
`asia-northeast3`	20
`me-west1`	20
`me-central1`	20
`me-central2`	20
`europe-west12`	20
`africa-south1`	20

Anzahl der A2-CPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	Unbegrenzt
`us-east1`	Unbegrenzt
`us-east4`	Unbegrenzt
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Unbegrenzt
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Unbegrenzt
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Unbegrenzt
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger A3-CPUs für das Training pro Region
Region	Wert
`us-west1`	Unbegrenzt
`us-west2`	Unbegrenzt
`us-west3`	Unbegrenzt
`us-west4`	Unbegrenzt
`us-central1`	Unbegrenzt
`us-east1`	Unbegrenzt
`us-east4`	Unbegrenzt
`us-east5`	Unbegrenzt
`us-south1`	Unbegrenzt
`northamerica-northeast1`	Unbegrenzt
`northamerica-northeast2`	Unbegrenzt
`southamerica-east1`	Unbegrenzt
`southamerica-west1`	Unbegrenzt
`europe-west2`	Unbegrenzt
`europe-west1`	Unbegrenzt
`europe-west4`	Unbegrenzt
`europe-west6`	Unbegrenzt
`europe-west3`	Unbegrenzt
`europe-north1`	Unbegrenzt
`europe-central2`	Unbegrenzt
`europe-west8`	Unbegrenzt
`europe-west9`	Unbegrenzt
`europe-southwest1`	Unbegrenzt
`asia-south1`	Unbegrenzt
`asia-south2`	Unbegrenzt
`asia-southeast1`	Unbegrenzt
`asia-southeast2`	Unbegrenzt
`asia-east2`	Unbegrenzt
`asia-east1`	Unbegrenzt
`asia-northeast1`	Unbegrenzt
`asia-northeast2`	Unbegrenzt
`australia-southeast1`	Unbegrenzt
`australia-southeast2`	Unbegrenzt
`asia-northeast3`	Unbegrenzt
`me-west1`	Unbegrenzt
`me-central1`	Unbegrenzt
`me-central2`	Unbegrenzt
`europe-west12`	Unbegrenzt
`africa-south1`	Unbegrenzt

Anzahl gleichzeitiger H200-GPUs für das Training pro Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	8
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	0
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	8
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der P4-GPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	6
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	6
`us-east1`	Nicht verfügbar
`us-east4`	1
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	6
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	6
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	6
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	6
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der T4-GPUs für das Training pro Region
Region	Wert
`us-west1`	2
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	12
`us-east1`	2
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	6
`europe-west1`	Nicht verfügbar
`europe-west4`	2
`europe-west6`	Nicht verfügbar
`europe-west3`	0
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	6
`asia-south2`	Nicht verfügbar
`asia-southeast1`	1
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	6
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	1
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der L4-GPUs für das Training pro Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	0
`us-east4`	0
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	0
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	0
`asia-south2`	Nicht verfügbar
`asia-southeast1`	0
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	0
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	0
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der P100-GPUs für das Training pro Region
Region	Wert
`us-west1`	30
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	56
`us-east1`	30
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	30
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	30
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	6
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der V100-GPUs für das Training pro Region
Region	Wert
`us-west1`	6
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	6
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	6
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	6
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der A100-GPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	8
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	8
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	8
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger A100-GPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	0
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.

Anzahl gleichzeitiger H100-GPUs für das Training pro Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	0
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	0
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	0
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger B200-GPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger GB200-GPUs für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger H100-Mega-GPUs für das Training pro Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	0
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	0
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	0
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	0
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	0
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	0
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.

Anzahl der gleichzeitigen TPU V2-Kerne für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	0
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der TPU V2-Pod-Kerne für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	Nicht verfügbar
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der TPU V3-Kerne für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	0
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der TPU V3-Pod-Kerne für das Training pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	Nicht verfügbar
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

HDD-Nutzung (GB) während des Trainings, nach Region
Region	Wert
`us-west1`	180.000
`us-west2`	3.600
`us-west3`	180.000
`us-west4`	3.600
`us-central1`	180.000
`us-east1`	180.000
`us-east4`	3.600
`us-east5`	3.600
`us-south1`	180.000
`northamerica-northeast1`	180.000
`northamerica-northeast2`	3.600
`southamerica-east1`	3.600
`southamerica-west1`	3.600
`europe-west2`	180.000
`europe-west1`	180.000
`europe-west4`	180.000
`europe-west6`	3.600
`europe-west3`	180.000
`europe-north1`	3.600
`europe-central2`	180.000
`europe-west8`	3.600
`europe-west9`	180.000
`europe-southwest1`	3.600
`asia-south1`	180.000
`asia-south2`	3.600
`asia-southeast1`	180.000
`asia-southeast2`	180.000
`asia-east2`	180.000
`asia-east1`	180.000
`asia-northeast1`	180.000
`asia-northeast2`	3.600
`australia-southeast1`	180.000
`australia-southeast2`	3.600
`asia-northeast3`	180.000
`me-west1`	180.000
`me-central1`	3.600
`me-central2`	3.600
`europe-west12`	3.600
`africa-south1`	3.600

SSD-Nutzung (GB) während des Trainings, nach Region
Region	Wert
`us-west1`	75.000
`us-west2`	450
`us-west3`	75.000
`us-west4`	450
`us-central1`	75.000
`us-east1`	75.000
`us-east4`	450
`us-east5`	450
`us-south1`	75.000
`northamerica-northeast1`	75.000
`northamerica-northeast2`	450
`southamerica-east1`	450
`southamerica-west1`	450
`europe-west2`	75.000
`europe-west1`	75.000
`europe-west4`	75.000
`europe-west6`	450
`europe-west3`	75.000
`europe-north1`	450
`europe-central2`	75.000
`europe-west8`	450
`europe-west9`	75.000
`europe-southwest1`	450
`asia-south1`	75.000
`asia-south2`	450
`asia-southeast1`	75.000
`asia-southeast2`	75.000
`asia-east2`	75.000
`asia-east1`	75.000
`asia-northeast1`	75.000
`asia-northeast2`	450
`australia-southeast1`	75.000
`australia-southeast2`	450
`asia-northeast3`	75.000
`me-west1`	75.000
`me-central1`	450
`me-central2`	450
`europe-west12`	450
`africa-south1`	450

Hyperdisk Balanced-Nutzung (GB) während des Trainings, nach Region
Region	Wert
`us-west1`	75.000
`us-west2`	450
`us-west3`	450
`us-west4`	450
`us-central1`	75.000
`us-east1`	450
`us-east4`	75.000
`us-east5`	450
`us-south1`	75.000
`northamerica-northeast1`	450
`northamerica-northeast2`	450
`southamerica-east1`	450
`southamerica-west1`	450
`europe-west2`	450
`europe-west1`	75.000
`europe-west4`	75.000
`europe-west6`	450
`europe-west3`	450
`europe-north1`	450
`europe-central2`	450
`europe-west8`	450
`europe-west9`	450
`europe-southwest1`	450
`asia-south1`	75.000
`asia-south2`	450
`asia-southeast1`	450
`asia-southeast2`	450
`asia-east2`	450
`asia-east1`	450
`asia-northeast1`	450
`asia-northeast2`	450
`australia-southeast1`	450
`australia-southeast2`	450
`asia-northeast3`	450
`me-west1`	450
`me-central1`	450
`me-central2`	450
`europe-west12`	450
`africa-south1`	450

Serving

Kontingent	Wert
Anzahl der bereitgestellten benutzerdefinierten Modellreplikate	100

Anzahl der CPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	2.200
`us-west2`	2.200
`us-west3`	2.200
`us-west4`	16
`us-central1`	2.200
`us-east1`	2.200
`us-east4`	2.200
`us-east5`	16
`us-south1`	450
`northamerica-northeast1`	2.200
`northamerica-northeast2`	450
`southamerica-east1`	2.200
`southamerica-west1`	450
`europe-west2`	2.200
`europe-west1`	2.200
`europe-west4`	2.200
`europe-west6`	2.200
`europe-west3`	2.200
`europe-north1`	16
`europe-central2`	450
`europe-west8`	16
`europe-west9`	16
`europe-southwest1`	16
`asia-south1`	2.200
`asia-south2`	16
`asia-southeast1`	2.200
`asia-southeast2`	2.200
`asia-east2`	2.200
`asia-east1`	2.200
`asia-northeast1`	2.200
`asia-northeast2`	16
`australia-southeast1`	2.200
`australia-southeast2`	16
`asia-northeast3`	2.200
`me-west1`	450
`me-central1`	16
`me-central2`	16
`europe-west12`	16
`africa-south1`	16

Anzahl gleichzeitiger H200-GPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	Nicht verfügbar
`us-south1`	8
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	0
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	8
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der P100-GPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	30
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	56
`us-east1`	30
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	30
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	30
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der P4-GPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	6
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	6
`us-east1`	Nicht verfügbar
`us-east4`	6
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	6
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	6
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	6
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	6
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der T4-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	12
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	12
`us-east1`	12
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	12
`europe-west1`	Nicht verfügbar
`europe-west4`	12
`europe-west6`	Nicht verfügbar
`europe-west3`	0
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	6
`asia-south2`	Nicht verfügbar
`asia-southeast1`	6
`asia-southeast2`	Nicht verfügbar
`asia-east2`	12
`asia-east1`	6
`asia-northeast1`	6
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	6
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der L4-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	28
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	28
`us-east1`	28
`us-east4`	28
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	28
`europe-west1`	28
`europe-west4`	28
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	28
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	28
`asia-northeast1`	28
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der V100-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	6
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	6
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	6
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der A100-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	14
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	14
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	14
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	14
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	14
`me-west1`	1
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der A100-GPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	1
`us-east1`	Nicht verfügbar
`us-east4`	1
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	1
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	1
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger B200-GPUs für die Bereitstellung pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl gleichzeitiger GB200-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	Nicht verfügbar
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der H100-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	8
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	16
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	16
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	16
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	16
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der H100-Mega-GPUs für die Bereitstellung nach Region
Region	Wert
`us-west1`	0
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	0
`us-central1`	0
`us-east1`	Nicht verfügbar
`us-east4`	0
`us-east5`	0
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	0
`europe-west4`	0
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	0
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	0
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	0
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der v5e-TPU-Chips für die Bereitstellung pro Region
Region	Wert
`us-west1`	4
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	0
`us-central1`	32
`us-east1`	Nicht verfügbar
`us-east4`	Nicht verfügbar
`us-east5`	Nicht verfügbar
`us-south1`	32
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	32
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	32
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	Nicht verfügbar
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Anzahl der v6e-TPU-Chips für die Bereitstellung pro Region
Region	Wert
`us-west1`	Nicht verfügbar
`us-west2`	Nicht verfügbar
`us-west3`	Nicht verfügbar
`us-west4`	Nicht verfügbar
`us-central1`	Nicht verfügbar
`us-east1`	0
`us-east4`	Nicht verfügbar
`us-east5`	0
`us-south1`	Nicht verfügbar
`northamerica-northeast1`	Nicht verfügbar
`northamerica-northeast2`	Nicht verfügbar
`southamerica-east1`	Nicht verfügbar
`southamerica-west1`	Nicht verfügbar
`europe-west2`	Nicht verfügbar
`europe-west1`	Nicht verfügbar
`europe-west4`	8
`europe-west6`	Nicht verfügbar
`europe-west3`	Nicht verfügbar
`europe-north1`	Nicht verfügbar
`europe-central2`	Nicht verfügbar
`europe-west8`	Nicht verfügbar
`europe-west9`	Nicht verfügbar
`europe-southwest1`	Nicht verfügbar
`asia-south1`	Nicht verfügbar
`asia-south2`	Nicht verfügbar
`asia-southeast1`	Nicht verfügbar
`asia-southeast2`	Nicht verfügbar
`asia-east2`	Nicht verfügbar
`asia-east1`	Nicht verfügbar
`asia-northeast1`	0
`asia-northeast2`	Nicht verfügbar
`australia-southeast1`	Nicht verfügbar
`australia-southeast2`	Nicht verfügbar
`asia-northeast3`	Nicht verfügbar
`me-west1`	Nicht verfügbar
`me-central1`	Nicht verfügbar
`me-central2`	Nicht verfügbar
`europe-west12`	Nicht verfügbar
`africa-south1`	Nicht verfügbar

Limits für benutzerdefiniert trainierte Modelle

Die folgenden Limits gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.

Serving

Limit	Wert
Anzahl der Replikate pro Projekt	200
Anzahl der Container pro Cluster	25.000

Vertex AI Feature Store

In diesem Abschnitt werden die Kontingente und Limits für Folgendes aufgeführt:

Vertex AI Feature Store
Vertex AI Feature Store (Legacy)

Vertex AI Feature Store

Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. Sie können beispielsweise in einem einzelnen Projekt 200 Onlinebereitstellungsknoten in us-central1 und weitere 50 Knoten in us-east4 haben.

Kontingent	Wert
Anfragen zur Onlinebereitstellung pro Minute	300.000
Maximale Anzahl von `FeatureOnlineStore`-Instanzen	10
Maximale Anzahl von Suchanfragen pro Minute	6.000.000
Maximale Anzahl von Onlinebereitstellungsknoten für alle Optimized `FeatureOnlineStore`-Instanzen im Projekt	80
Maximale Anzahl von `FeatureView`-Instanzen für alle `FeatureOnlineStore`-Instanzen	30

Für Vertex AI Feature Store gelten außerdem die folgenden Limits: Für die Limits in der folgenden Tabelle können Sie keine Erhöhung beantragen:

Limit	Wert
Maximale Anzahl von `FeatureGroup`-Ressourcen in einem Projekt und an einem Standort	250
Maximale Anzahl von `Feature`-Ressourcen in einem `FeatureGroup`	10.000
Maximale Größe der Featuredaten pro Entität	5 MB
Anzahl der Entitäts-IDs pro Onlinebereitstellungsanfrage (`FetchFeatureValues`)	1
Maximale Länge einer Entitäts-ID	4.076 Zeichen
Speicherlimit für einen optimierten Online-Bereitstellungsknoten	200 GB

Vertex AI Feature Store (Legacy)

Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. In einem einzelnen Projekt können Sie beispielsweise 75 gleichzeitige Batchjobs in us-central1 und weitere 75 Jobs in europe-west4 haben.

Kontingent	Wert
Anfragen zur Onlinebereitstellung pro Minute	300.000
Anfragen für Streamingaufnahme pro Minute	60.000
Schreibdurchsatz für die Streamingaufnahme pro Minute	1,2 GB
Anfragen zur Featureerstellung pro Minute	100
Online-Bereitstellungsknoten in allen Featurestores	30
Gleichzeitige Batchjobs (Aufnahme, Bereitstellung und Löschen von Featurewerten)	75
Gleichzeitige Anfragen zum Löschen von Featurewerten	1
Entitätstypen für alle Featurestores	75

Für Vertex AI Feature Store (Legacy) gelten außerdem die folgenden Limits: Für die Limits in der folgenden Tabelle können Sie keine Erhöhung beantragen:

Limit	Wert
Speicherlimit für einen Online-Bereitstellungsknoten	5 TB
Gesamtdaten im Offlinespeicher	Unbegrenzt
Features pro Entitätstyp	5.000
Anzahl der Erstellungs-, Aktualisierungs- und Löschanfragen für Featurestores pro Tag, Projekt und Region	500
Die Größe der Streamingaufnahme	1 MB
Für Streaming-Lesevorgänge die Anzahl der Entitäten, die pro Anfrage einbezogen werden können	100
Für den Batchimport die Anzahl der Dateien, die pro Anfrage einbezogen werden können	5.000 für Avro oder 500 für CSV
Für Batchbereitstellung und exporte, die Anzahl der Features, die Sie anfordern können	5.000
Der älteste Zeitstempel bei der Batchaufnahme und Streamingaufnahme, für den Featuredaten aufgenommen werden können.	4.000 Tage ab dem aktuellen Datum

Das Datenaufbewahrungslimit in Vertex AI Feature Store (Legacy) hat den folgenden Standardwert, den Sie überschreiben können:

Standardeinstellungen für die Datenaufbewahrung	Standardwert
Datenaufbewahrung im Offlinespeicher (ältester Zeitstempel für Featurewerte, nach dem die Werte gelöscht werden)	4.000 Tage ab dem aktuellen Datum
Datenaufbewahrung im Onlinespeicher (ältester Zeitstempel für Featurewerte, nach dem die Werte gelöscht werden)	4.000 Tage ab dem aktuellen Datum

Sie haben folgende Möglichkeiten, die Datenaufbewahrungsgrenze zu überschreiben:

Wenn Sie das Datenaufbewahrungslimit für den Onlinespeicher überschreiben möchten, legen Sie den Parameter online_storage_ttl_days beim Erstellen oder Aktualisieren eines Feature Stores fest.
Wenn Sie das Datenaufbewahrungslimit für den Offlinespeicher überschreiben möchten, legen Sie den Parameter offline_storage_ttl_days beim Erstellen oder Aktualisieren eines Entitätstyps fest.

Vektorsuche

Die folgenden Kontingente gelten für die Vektorsuche für ein bestimmtes Projekt in jeder Region.

Kontingent	Wert
Gleichzeitige Vorgänge für die Indexerstellung	5
Gleichzeitige Vorgänge für die Indexaktualisierung	5
Anzahl der bereitgestellten Indexknoten	50
Anzahl der bereitgestellten N2D-Indexknoten	5
Indexanzahl	100
Anfragen für Streaming-Updates pro Minute	6.000
Durchsatz der Streamingaktualisierung (in KB) pro Minute	120.000

Vertex ML Metadata

Die folgenden Limits gelten für Vertex ML Metadata für ein bestimmtes Projekt in jeder Region.

Limit	Wert
Maximale serialisierte Größe des Metadatenfelds in einer Ressource	204.800 Byte
Maximale serialisierte Größe von Metadatenschemas	204.800 Byte

Vertex AI Pipelines

Die folgenden Kontingente und Limits gelten für Vertex AI Pipelines für ein bestimmtes Projekt in jeder Region.

Kontingent	Wert
Pipelineaufgaben parallel ausführen^*	600
Gleichzeitige Pipelineausführungen^*	300

^* Anfragen zur Pipelineausführung und Aufgaben über dieses Limit hinaus werden in die Warteschlange gestellt, bis Ressourcen verfügbar sind.

Für Vertex AI Pipelines gelten die folgenden Limits. Beachten Sie, dass Sie im Gegensatz zu Kontingenten keine Erhöhung eines Limits anfordern können.

Limit	Wert
Anzahl der Pipeline-Aufgaben pro Job	10.000
Eingabe- und Ausgabeartefakte pro Pipelineaufgabe	100
Eingabe- und Ausgabeartefakte pro Pipelinejob	10.000
Maximale Größe der JSON-Nutzlast pro Pipelineaufgabe mit Ausgabeparametern und Artefakten	131.072 Byte
Maximale Laufzeit für eine Pipeline-Aufgabe^**	7 Tage

^* Pipeline-Aufgaben, die dieses Limit überschreiten, werden abgebrochen.

Kontingente und Limits für Colab Enterprise

Kontingente und Limits für Colab Enterprise werden separat aufgeführt. Weitere Informationen finden Sie unter Kontingente und Limits für Colab Enterprise.

Kontingent erhöhen

Wenn Sie eines der Kontingente für Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.

Weitere Informationen zum Senden einer Anfrage zur Kontingenterhöhung finden Sie in den folgenden Abschnitten unter Kontingente aufrufen und verwalten:

Kontingentanpassung anfordern

Kontingente nach Region und Modell

Kontingente in der Google Cloud -Console ansehen und bearbeiten

So rufen Sie die Kontingente in der Google Cloud -Konsole auf und bearbeiten sie:

Rufen Sie die Seite Kontingente und Systemlimits auf.

Zur Seite „Kontingente und Systemlimits“

Um das Kontingent anzupassen, kopieren Sie das Attribut aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model und fügen Sie es in den Filter ein. Drücken Sie die Eingabetaste.
Klicken Sie auf das Dreipunkt-Menü am Ende der Zeile und wählen Sie Kontingent bearbeiten aus.
Geben Sie im Bereich einen neuen Kontingentwert ein und klicken Sie auf Anfrage senden.

Kontingente für Anfragen pro Minute nach Region und Modell ansehen

Standardmäßig verwenden Gemini-Modelle 2.0 und höher ein dynamisches freigegebenes Kontingent.

Wählen Sie eine Region aus, um die Kontingente für jedes verfügbare Modell aufzurufen:

Kontingente erhöhen

Wenn Sie eines der Kontingente für generative KI auf Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.

Kontingente für RAG Engine

Für jeden Dienst, der RAG (Retrieval Augmented Generation) mit RAG Engine ausführt, gelten die folgenden Kontingente. Das Kontingent wird als Anfragen pro Minute (RPM) gemessen.

Dienst	Kontingent	Messwert
APIs zur Datenverwaltung für die RAG Engine	60 U/min	`VertexRagDataService requests per minute per region`
`RetrievalContexts` API	600 U/min	`VertexRagService retrieve requests per minute per region`
`base_model: textembedding-gecko`	1.500 RPM	`Online prediction requests per base model per minute per region per base_model` Ein weiterer Filter, den Sie angeben können, ist `base_model: textembedding-gecko`

Die folgenden Begrenzungen gelten:

Dienst	Limit	Messwert
Gleichzeitige `ImportRagFiles`-Anfragen	3 RPM	`VertexRagService concurrent import requests per region`
Maximale Anzahl von Dateien pro `ImportRagFiles`-Anfrage	10.000	`VertexRagService import rag files requests per region`

Weitere Ratenbegrenzungen und Kontingente finden Sie unter Ratenbegrenzungen für generative KI in Vertex AI.

Batchanfragen

Die Kontingente und Limits für Batchinferenzjobs sind in allen Regionen gleich.

Gleichzeitige Batchinferenzjob-Limits für Gemini-Modelle

Für die Batchinferenz für Gemini-Modelle gibt es keine vordefinierten Kontingentlimits. Stattdessen bietet der Batch-Dienst Zugriff auf einen großen, gemeinsamen Ressourcenpool, der dynamisch zugewiesen wird, basierend auf der Echtzeitverfügbarkeit des Modells und der Nachfrage aller Kunden nach diesem Modell. Wenn mehr Kunden aktiv sind und die Kapazität des Modells ausgeschöpft ist, werden Ihre Batchanfragen möglicherweise in die Warteschlange gestellt.

Kontingente für gleichzeitige Batchinferenzjobs für Nicht-Gemini-Modelle

In der folgenden Tabelle sind die Kontingente für die Anzahl der gleichzeitigen Batch-Inferenzjobs aufgeführt, die nicht für Gemini-Modelle gelten:

Kontingent	Wert
`aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs`	4

Wenn die Anzahl der eingereichten Aufgaben das zugewiesene Kontingent überschreitet, werden die Aufgaben in eine Warteschlange gestellt und verarbeitet, sobald Kontingentkapazität verfügbar ist.

Kontingente für benutzerdefiniert trainierte Modelle

Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:

Kontingent	Wert
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region * unterstützte Region - europe-west4	64
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region * unterstützte Region - us-central1 * unterstützte Region - us-east4	8 2

* Feinabstimmungsszenarien haben Beschleunigerreservierungen in bestimmten Regionen. Kontingente für die Feinabstimmung werden unterstützt und müssen in bestimmten Regionen angefordert werden.

Beschränkungen für Texteinbettungen

Jede Anfrage kann bis zu 250 Eingabetexte (mit jeweils einer Einbettung) und 20.000 Tokens pro Anfrage enthalten. Nur die ersten 2.048 Tokens in jedem Eingabetext werden zum Berechnen der Einbettungen verwendet. Für gemini-embedding-001 wird das Kontingent unter dem Namen gemini-embedding aufgeführt.

Eingabetokens für eingebettete Inhalte pro Minute und Basismodell

Im Gegensatz zu früheren Einbettungsmodellen, die hauptsächlich durch RPM-Kontingente begrenzt waren, wird das Kontingent für das Gemini Embedding-Modell durch die Anzahl der Tokens begrenzt, die pro Minute und Projekt gesendet werden können.

Kontingent	Wert
Eingabetokens für das Einbetten von Inhalten pro Minute	5.000.000

Dienstkontingente für den Gen AI Evaluation Service

Der Gen AI Evaluation Service verwendet gemini-2.0-flash als Standardmodell für modellbasierte Messwerte. Eine einzelne Bewertungsanfrage für einen modellbasierten Messwert kann zu mehreren zugrunde liegenden Anfragen an den Gen AI Evaluation Service führen. Das Kontingent jedes Modells wird auf Projektbasis berechnet. Das bedeutet, dass alle Anfragen, die zur Modellinferenz und zur modellbasierten Bewertung an gemini-2.0-flash gerichtet werden, zum Kontingent beitragen. Die Kontingente für den Gen AI Evaluation Service und das zugrunde liegende Judge-Modell sind in der folgenden Tabelle aufgeführt:

Kontingent anfordern	Standardkontingent
Anfragen pro Minute für den Gen AI Evaluation Service	1.000 Anfragen pro Projekt und Region
Anfragen für Onlinevorhersagen pro Minute für `base_model: gemini-2.0-flash`	Weitere Informationen finden Sie unter Kontingente nach Region und Modell.

Wenn Sie bei der Verwendung des Gen AI Evaluation Service einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.

Limit	Wert
Zeitlimit für Anfragen an den Gen AI Evaluation Service	60 Sekunden

Wenn Sie den Gen AI-Bewertungsdienst zum ersten Mal in einem neuen Projekt verwenden, kann es zu einer anfänglichen Einrichtungsverzögerung von bis zu zwei Minuten kommen. Wenn Ihre erste Anfrage fehlschlägt, warten Sie einige Minuten und versuchen Sie es dann noch einmal. Nachfolgende Bewertungsanfragen werden in der Regel innerhalb von 60 Sekunden abgeschlossen.

Die maximalen Eingabe- und Ausgabetokens für modellbasierte Messwerte hängen vom Modell ab, das als Judge-Modell verwendet wird. Eine Liste der Modelle finden Sie unter Google-Modelle.

Kontingente für die Pipelinebewertung

Wenn Sie bei der Verwendung des Pipelines-Bewertungsdienstes einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten. Der Pipelines-Bewertungsdienst verwendet Vertex AI Pipelines, um PipelineJobs auszuführen. Relevante Kontingente für Vertex AI Pipelines Im Folgenden finden Sie allgemeine Empfehlungen für Kontingente:

Dienst	Kontingent	Empfehlung
Vertex AI API	Gleichzeitige LLM-Batchvorhersagejobs pro Region	Punktweise: 1 * num_concurrent_pipelines Paarweise: 2 * num_concurrent_pipelines
Vertex AI API	Bewertungsanfragen pro Minute und Region	1.000 * num_concurrent_pipelines

Außerdem hängt das relevante Kontingent für modellbasierte Messwerte davon ab, welches Judge-Modell Sie verwenden:

Google Tasks	Kontingent	Basismodell	Empfehlung
`summarization` `question_answering`	Anfragen für Onlinevorhersagen pro Basismodell pro Minute und Region pro base_model	`text-bison`	60 * num_concurrent_pipelines

Vertex AI Agent Engine

Die folgenden Limits gelten für Vertex AI Agent Engine für ein bestimmtes Projekt in jeder Region:

Beschreibung	Limit
Vertex AI Agent Engine-Agents pro Minute erstellen, löschen oder aktualisieren	10
Vertex AI Agent Engine-Sitzungen pro Minute erstellen, löschen oder aktualisieren	100
`Query` oder `StreamQuery` Vertex AI Agent Engine pro Minute	90
Ereignis an Vertex AI Agent Engine-Sitzungen pro Minute anhängen	300
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen	100
Vertex AI Agent Engine-Speicherressourcen pro Minute erstellen, löschen oder aktualisieren	100
Abrufen, Auflisten oder Abrufen aus der Vertex AI Agent Engine Memory Bank pro Minute	300
Sandbox-Umgebung (Codeausführung): „execute“-Anfragen pro Minute	1000
Sandbox-Umgebung (Codeausführung) – Einheiten pro Region	1000
A2A-Agent-Post-Anfragen wie `sendMessage` und `cancelTask` pro Minute	60
A2A-Agent-Get-Anfragen wie `getTask` und `getCard` pro Minute	600
Gleichzeitige bidirektionale Live-Verbindungen über die `BidiStreamQuery` API pro Minute	10

Fehlercode 429 beheben

Informationen zur Fehlerbehebung bei Fehler 429 finden Sie unter Fehlercode 429.

Nächste Schritte

Weitere Informationen zu Kontingenten und Limits für generative KI in Vertex AI

Vertex AI-Kontingente und -Limits Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Ratenkontingente

Kontingente für AutoML-Modelle

Bild

Klassifizierung

Objekterkennung

Tabellarisch

Vertex AI Model Registry

Limits für AutoML-Modelle

Bild

Tabellarisch

Video

Kontingente für benutzerdefiniert trainierte Modelle

Training

Serving

Limits für benutzerdefiniert trainierte Modelle

Serving

Vertex AI Feature Store

Vertex AI Feature Store

Vertex AI Feature Store (Legacy)

Vektorsuche

Vertex ML Metadata

Vertex AI Pipelines

Kontingente und Limits für Colab Enterprise

Kontingent erhöhen

Kontingente nach Region und Modell

Kontingente in der Google Cloud -Console ansehen und bearbeiten

Kontingente für Anfragen pro Minute nach Region und Modell ansehen

Kontingente erhöhen

Kontingente für RAG Engine

Batchanfragen

Gleichzeitige Batchinferenzjob-Limits für Gemini-Modelle

Kontingente für gleichzeitige Batchinferenzjobs für Nicht-Gemini-Modelle

Kontingente für benutzerdefiniert trainierte Modelle

Beschränkungen für Texteinbettungen

Eingabetokens für eingebettete Inhalte pro Minute und Basismodell

Dienstkontingente für den Gen AI Evaluation Service

Kontingente für die Pipelinebewertung

Vertex AI Agent Engine

Fehlercode 429 beheben

Nächste Schritte

Vertex AI-Kontingente und -Limits