Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud -Ressource Ihr Google Cloud -Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud -Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud Produkten und ‑Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern und Kontingentanpassungen zu automatisieren
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Vertex AI-Ressourcen gelten außerdem Limits. Diese Limits stehen nicht im Zusammenhang mit dem Kontingentsystem. Limits können nicht geändert werden.
Anfragekontingente
Die folgenden Kontingente gelten für Vertex AI-Anfragen für angegebene Projekte und unterstützte Regionen. Sie können beispielsweise in einem Projekt bis zu 30.000 Anfragen pro Minute für Onlineinferenz in einer Region und weitere 30.000 Anfragen für Onlineinferenz pro Minute in einer anderen Region haben.
Art der Anfrage | Anfragen pro Minute |
---|---|
Resource Management (CRUD)-Anfragen1 | 600 |
Anfragen zum Senden von Jobs oder Vorgängen mit langer Ausführungszeit | 60 |
Anfragen für Onlineinferenz2 | 30.000 |
Durchsatz von Onlineinferenzanfragen | 1,5 GB |
Anfragen für Onlineerklärungen | 600 |
Vertex AI TensorBoard-Leseanfragen für Zeitreihen | 60.000 |
ML Metadata-Anfragen (CRUD) | 12.000 |
CRUD-Anfragen für das Caching generativer KI | 200 |
Vertex AI Vizier-Anfragen (CRUD) | 6.000 |
Vertex AI Feature Store-Anfragen zur Onlinebereitstellung | 300.000 |
Vertex ML Metadata-Anfragen | 12.000 |
Anzahl der Anfragen für Zähl- oder Berechnungs-Tokens | 3.000 |
1 Anfragen zur Ressourcenverwaltung umfassen alle Anfragen, die kein Job, Vorgang mit langer Ausführungszeit, Onlineinferenzanfrage, Vertex AI Vizier-Anfrage, ML-Metadatenanfrage, Vertex AI TensorBoard Timeseries Insights API-Leseanfrage, Vertex AI Feature Store-Anfrage, Vertex AI Feature Store-Streaminganfrage oder Vector Search-Anfrage sind.
2 Dieses Kontingent gilt nur für öffentliche Endpunkte.
Jobs oder LROs umfassen die folgenden Anfragen:
- Datasets erstellen oder löschen
- Daten in ein Dataset importieren oder aus einem Dataset exportieren.
- Erstellen Sie einen Endpunkt.
- Benutzerdefinierten Job erstellen oder löschen
- Erstellen oder löschen Sie einen Daten-Labeling-Job.
- Hyperparameter-Abstimmungsjob erstellen oder löschen
- Batchinferenzjob erstellen oder löschen
- Modell erstellen oder löschen
- Modell hochladen, löschen oder exportieren
- Notebook-Laufzeitvorlagen erstellen oder löschen
- Notebook-Laufzeit zuweisen, löschen, starten oder upgraden.
- Modellmonitor erstellen, löschen oder aktualisieren.
- Erstellen oder löschen Sie einen Model Monitoring-Job.
Informationen zu Kontingenten für generative KI-Modelle finden Sie unter Kontingente und Limits für generative KI in Vertex AI.
Kontingente für AutoML-Modelle
Die folgenden Kontingente gelten für jeden Datentyp und jedes Ziel für angegebene Projekte und Regionen. Sie können beispielsweise in einem bestimmten Projekt und in einer bestimmten Region 10 AutoML-Bildklassifizierungsmodelle und 10 AutoML-Bildobjekterkennungsmodelle für insgesamt 20 erstellte Modelle bereitstellen.
Bild
Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Trainingsjobs mit Explainable AI | 2 |
Gleichzeitige Batchinferenzjobs | 5 |
Gleichzeitige Jobs für die Modellbereitstellung | 5 |
Gleichzeitige Jobs zur Aufhebung der Bereitstellung eines Modells | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Objekterkennung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Tabellarisch
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Anzahl der bereitgestellten Modelle | 30 |
Text
.Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Entitätsextraktion
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Sentimentanalyse
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Video
Aktionserkennung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Objekt-Tracking
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchinferenzjobs | 5 |
Vertex AI Model Registry
Die maximale Modellgröße, die von Vertex AI Model Registry unterstützt wird, beträgt 1 TB.
Limits für AutoML-Modelle
Die folgenden Limits gelten für jeden Datentyp für ein bestimmtes Projekt und eine bestimmte Region. Sie können beispielsweise in einem bestimmten Projekt und in einer bestimmten Region maximal 1.000.000 Bilder in die Eingabe einer Batch-Anfrage aufnehmen.
Bild
Art des Limits | Wert |
---|---|
Größe der Bilddatei | Maximum: 30 MB |
Bilder pro Dataset | Maximum: 1.000.000 |
Labels pro Dataset | Minimum: 2 Maximum: 5.000 |
Bilder pro Label | Minimum: 10 Empfohlen: 1.000 |
Größe der Batch-Eingabe für CSV-Datei | Maximum: 100 MB |
Anzahl der Bilder in der Batch-Eingabe | Maximum: 1.000.000 |
Tabellarisch
Art des Limits | Wert |
---|---|
Maximalgröße | 100 GB |
Zeilenanzahl | Zwischen 1.000 und 200 Millionen Zeilen |
Anzahl der Spalten | Zwischen zwei und 1.000 Spalten |
Anzahl gleichzeitig ausgeführter Dataset-Importe | 5 Importe |
Größe der CSV-Datei | Maximal: 10 GB pro Datei, bis zu einer maximalen Gesamtgröße von 100 GB |
Text
.Bei Zeichenanzahlen wird von UTF-8-Zeichen ausgegangen.
Art des Limits | Klassifizierung | Entitätsextraktion | Sentimentanalyse |
---|---|---|---|
Trainingselemente | 10 bis 1.000.000 | 50 bis 100.000 | 10 bis 100.000 |
Labels pro Dataset | 2 bis 5.000 | 1 bis 100 | 2 bis 11 |
Länge des Labelnamens | 1 bis 32 | 1 bis 32 | Ganzzahl zwischen 0 und 10 |
Länge des annotierten Spans | – | 1 bis 100 Zeichen | – |
Trainingselemente pro Label | 10 bis 1.000.000 | 100 bis 100.000 | 10 bis 100.000 |
Größe der Trainingselemente | 10 MB
5.000.000 Zeichen |
128 KB (Text); 20 MB (PDF)
10 bis 300.000 Zeichen (Text) |
128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
Zur Inferenz gesendete Elemente | 128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
20 MB | 128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
Elemente pro Batchanfrage | 10.000 | 10.000 | 10.000 |
Video
Art des Limits | Wert |
---|---|
Maximale Videolänge | 3 Stunden |
Maximale Videodateigröße | 50 GB |
Label-Mindestanzahl pro Dataset | 2 |
Video-Mindestanzahl pro Label | 10 (1.000 werden empfohlen) |
Größe der Batch-Eingabe für CSV-Datei | Maximum: 100 MB |
Anzahl der Videosegmente in der Batch-Eingabe | Maximum: 1.000 |
Kontingente für benutzerdefiniert trainierte Modelle
Die folgenden Kontingente gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.
Training
Kontingent | Wert |
---|---|
Gleichzeitige benutzerdefinierte Trainingspipelines | 2.000 |
Anzahl der N1- und E2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 2.200 |
us-west2 | 20 |
us-west3 | 2.200 |
us-west4 | 20 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 20 |
europe-west3 | 2.200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2.200 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 20 |
australia-southeast1 | 2.200 |
australia-southeast2 | 20 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Anzahl der N2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Anzahl der M1-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Anzahl der C2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Anzahl der A2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Unbegrenzt |
us-east1 | Unbegrenzt |
us-east4 | Unbegrenzt |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Unbegrenzt |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Unbegrenzt |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Unbegrenzt |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger A3-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Unbegrenzt |
us-west2 | Unbegrenzt |
us-west3 | Unbegrenzt |
us-west4 | Unbegrenzt |
us-central1 | Unbegrenzt |
us-east1 | Unbegrenzt |
us-east4 | Unbegrenzt |
us-east5 | Unbegrenzt |
us-south1 | Unbegrenzt |
northamerica-northeast1 | Unbegrenzt |
northamerica-northeast2 | Unbegrenzt |
southamerica-east1 | Unbegrenzt |
southamerica-west1 | Unbegrenzt |
europe-west2 | Unbegrenzt |
europe-west1 | Unbegrenzt |
europe-west4 | Unbegrenzt |
europe-west6 | Unbegrenzt |
europe-west3 | Unbegrenzt |
europe-north1 | Unbegrenzt |
europe-central2 | Unbegrenzt |
europe-west8 | Unbegrenzt |
europe-west9 | Unbegrenzt |
europe-southwest1 | Unbegrenzt |
asia-south1 | Unbegrenzt |
asia-southeast1 | Unbegrenzt |
asia-southeast2 | Unbegrenzt |
asia-east2 | Unbegrenzt |
asia-east1 | Unbegrenzt |
asia-northeast1 | Unbegrenzt |
asia-northeast2 | Unbegrenzt |
australia-southeast1 | Unbegrenzt |
australia-southeast2 | Unbegrenzt |
asia-northeast3 | Unbegrenzt |
me-west1 | Unbegrenzt |
me-central1 | Unbegrenzt |
me-central2 | Unbegrenzt |
europe-west12 | Unbegrenzt |
africa-south1 | Unbegrenzt |
Anzahl gleichzeitiger H200-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 8 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 0 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | 6 |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | 1 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der T4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 2 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 6 |
europe-west1 | Nicht verfügbar |
europe-west4 | 2 |
europe-west6 | Nicht verfügbar |
europe-west3 | 0 |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 6 |
asia-southeast1 | 1 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 6 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 1 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der L4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | 0 |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 0 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | 0 |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 30 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 30 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 30 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der V100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 6 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 6 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 8 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger A100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.
Anzahl gleichzeitiger H100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger B200-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger H100-Mega-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 0 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.
Anzahl der gleichzeitigen TPU V2-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 8 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V2-Pod-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V3-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 8 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V3-Pod-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
HDD-Nutzung (GB) während des Trainings, nach Region | |
---|---|
Region | Wert |
us-west1 | 180.000 |
us-west2 | 3.600 |
us-west3 | 180.000 |
us-west4 | 3.600 |
us-central1 | 180.000 |
us-east1 | 180.000 |
us-east4 | 3.600 |
us-east5 | 3.600 |
us-south1 | 180.000 |
northamerica-northeast1 | 180.000 |
northamerica-northeast2 | 3.600 |
southamerica-east1 | 3.600 |
southamerica-west1 | 3.600 |
europe-west2 | 180.000 |
europe-west1 | 180.000 |
europe-west4 | 180.000 |
europe-west6 | 3.600 |
europe-west3 | 180.000 |
europe-north1 | 3.600 |
europe-central2 | 180.000 |
europe-west8 | 3.600 |
europe-west9 | 180.000 |
europe-southwest1 | 3.600 |
asia-south1 | 180.000 |
asia-southeast1 | 180.000 |
asia-southeast2 | 180.000 |
asia-east2 | 180.000 |
asia-east1 | 180.000 |
asia-northeast1 | 180.000 |
asia-northeast2 | 3.600 |
australia-southeast1 | 180.000 |
australia-southeast2 | 3.600 |
asia-northeast3 | 180.000 |
me-west1 | 180.000 |
me-central1 | 3.600 |
me-central2 | 3.600 |
europe-west12 | 3.600 |
africa-south1 | 3.600 |
SSD-Nutzung (GB) während des Trainings, nach Region | |
---|---|
Region | Wert |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 75.000 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 75.000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 75.000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75.000 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 75.000 |
europe-north1 | 450 |
europe-central2 | 75.000 |
europe-west8 | 450 |
europe-west9 | 75.000 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-southeast1 | 75.000 |
asia-southeast2 | 75.000 |
asia-east2 | 75.000 |
asia-east1 | 75.000 |
asia-northeast1 | 75.000 |
asia-northeast2 | 450 |
australia-southeast1 | 75.000 |
australia-southeast2 | 450 |
asia-northeast3 | 75.000 |
me-west1 | 75.000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Hyperdisk Balanced-Nutzung (GB) während des Trainings, nach Region | |
---|---|
Region | Wert |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 450 |
us-east4 | 75.000 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Serving
Kontingent | Wert |
---|---|
Anzahl der bereitgestellten benutzerdefinierten Modellreplikate | 100 |
Anzahl der CPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 2.200 |
us-west2 | 2.200 |
us-west3 | 2.200 |
us-west4 | 16 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 2.200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2.200 |
southamerica-west1 | 450 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 2.200 |
europe-west3 | 2.200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2.200 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 16 |
australia-southeast1 | 2.200 |
australia-southeast2 | 16 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Anzahl gleichzeitiger H200-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 0 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P100-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 30 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 30 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 30 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P4-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | 6 |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | 6 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der T4-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 12 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 12 |
europe-west1 | Nicht verfügbar |
europe-west4 | 12 |
europe-west6 | Nicht verfügbar |
europe-west3 | 0 |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 6 |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 6 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der L4-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 28 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 28 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der V100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 6 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 14 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 14 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 14 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 14 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 1 |
us-east1 | Nicht verfügbar |
us-east4 | 1 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 1 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 1 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger B200-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der H100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 8 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 8 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der H100-Mega-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 0 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der v5e-TPU-Chips für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 4 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | 0 |
us-central1 | 16 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | 0 |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der v6e-TPU-Chips für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | 0 |
us-east4 | Nicht verfügbar |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Limits für benutzerdefiniert trainierte Modelle
Die folgenden Limits gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.
Serving
Limit | Wert |
---|---|
Anzahl der Replikate pro Projekt | 200 |
Anzahl der Container pro Cluster | 25.000 |
Vertex AI Feature Store
In diesem Abschnitt werden die Kontingente und Limits für Folgendes aufgeführt:
Vertex AI Feature Store
Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. Sie können beispielsweise in einem einzelnen Projekt 200 Onlinebereitstellungsknoten in us-central1
und weitere 50 Knoten in us-east4
haben.
Kontingent | Wert |
---|---|
Anfragen zur Onlinebereitstellung pro Minute | 300.000 |
Maximale Anzahl von FeatureOnlineStore -Instanzen |
10 |
Maximale Anzahl von Suchanfragen pro Minute | 6.000.000 |
Maximale Anzahl von Onlinebereitstellungsknoten für alle Optimized FeatureOnlineStore -Instanzen im Projekt |
80 |
Maximale Anzahl von FeatureView -Instanzen für alle FeatureOnlineStore -Instanzen |
30 |
Für Vertex AI Feature Store gelten außerdem die folgenden Limits: Für die Limits in der folgenden Tabelle können Sie keine Erhöhung beantragen:
Limit | Wert |
---|---|
Maximale Anzahl von FeatureGroup -Ressourcen in einem Projekt und an einem Standort |
250 |
Maximale Anzahl von Feature -Ressourcen in einer FeatureGroup |
10.000 |
Maximale Größe der Featuredaten pro Entität | 5 MB |
Anzahl der Entitäts-IDs pro Onlinebereitstellungsanfrage (FetchFeatureValues ) |
1 |
Maximale Länge einer Entitäts-ID | 4.076 Zeichen |
Speicherlimit für einen optimierten Online-Bereitstellungsknoten | 200 GB |
Vertex AI Feature Store (Legacy)
Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. In einem einzelnen Projekt können Sie beispielsweise 75 gleichzeitige Batchjobs in us-central1
und weitere 75 Jobs in europe-west4
haben.
Kontingent | Wert |
---|---|
Anfragen zur Onlinebereitstellung pro Minute | 300.000 |
Anfragen für Streamingaufnahme pro Minute | 60.000 |
Schreibdurchsatz für die Streamingaufnahme pro Minute | 1,2 GB |
Anfragen zur Featureerstellung pro Minute | 100 |
Online-Bereitstellungsknoten in allen Featurestores | 30 |
Gleichzeitige Batchjobs (Aufnahme, Bereitstellung und Löschen von Featurewerten) | 75 |
Gleichzeitige Anfragen zum Löschen von Featurewerten | 1 |
Entitätstypen für alle Featurestores | 75 |
Für Vertex AI Feature Store (Legacy) gelten außerdem die folgenden Limits: Für die Limits in der folgenden Tabelle können Sie keine Erhöhung beantragen:
Limit | Wert |
---|---|
Speicherlimit für einen Online-Bereitstellungsknoten | 5 TB |
Gesamtdaten im Offlinespeicher | Unbegrenzt |
Features pro Entitätstyp | 5.000 |
Anzahl der Erstellungs-, Aktualisierungs- und Löschanfragen für Featurestores pro Tag, Projekt und Region | 500 |
Die Größe der Streamingaufnahme | 1 MB |
Für Streaming-Lesevorgänge die Anzahl der Entitäten, die pro Anfrage einbezogen werden können | 100 |
Für den Batchimport die Anzahl der Dateien, die pro Anfrage einbezogen werden können | 5.000 für Avro oder 500 für CSV |
Für Batchbereitstellung und exporte, die Anzahl der Features, die Sie anfordern können | 5.000 |
Der älteste Zeitstempel bei der Batchaufnahme und Streamingaufnahme, für den Featuredaten aufgenommen werden können. | 4.000 Tage ab dem aktuellen Datum |
Das Datenaufbewahrungslimit in Vertex AI Feature Store (Legacy) hat den folgenden Standardwert, den Sie überschreiben können:
Standardeinstellungen für die Datenaufbewahrung | Standardwert |
---|---|
Datenaufbewahrung im Offlinespeicher (ältester Zeitstempel für Featurewerte, nach dem die Werte gelöscht werden) | 4.000 Tage ab dem aktuellen Datum |
Datenaufbewahrung im Onlinespeicher (ältester Zeitstempel für Featurewerte, nach dem die Werte gelöscht werden) | 4.000 Tage ab dem aktuellen Datum |
Sie haben folgende Möglichkeiten, die Datenaufbewahrungsgrenze zu überschreiben:
Wenn Sie das Datenaufbewahrungslimit für den Onlinespeicher überschreiben möchten, legen Sie den Parameter
online_storage_ttl_days
beim Erstellen oder Aktualisieren eines Feature Stores fest.Wenn Sie das Datenaufbewahrungslimit für den Offlinespeicher überschreiben möchten, legen Sie den Parameter
offline_storage_ttl_days
beim Erstellen oder Aktualisieren eines Entitätstyps fest.
Vektorsuche
Die folgenden Kontingente gelten für die Vektorsuche für ein bestimmtes Projekt in jeder Region.
Kontingent | Wert |
---|---|
Gleichzeitige Vorgänge für die Indexerstellung | 5 |
Gleichzeitige Vorgänge für die Indexaktualisierung | 5 |
Anzahl der bereitgestellten Indexknoten | 50 |
Anzahl der bereitgestellten N2D-Indexknoten | 5 |
Indexanzahl | 100 |
Anfragen für Streaming-Updates pro Minute | 6.000 |
Durchsatz der Streamingaktualisierung (in KB) pro Minute | 120.000 |
Vertex ML Metadata
Die folgenden Limits gelten für Vertex ML Metadata für ein bestimmtes Projekt in jeder Region.
Limit | Wert |
---|---|
Maximale serialisierte Größe des Metadatenfelds in einer Ressource | 204.800 Byte |
Maximale serialisierte Größe von Metadatenschemas | 204.800 Byte |
Vertex AI Pipelines
Die folgenden Kontingente und Limits gelten für Vertex AI Pipelines für ein bestimmtes Projekt in jeder Region.
Kontingent | Wert |
---|---|
Pipelineaufgaben parallel ausführen* | 600 |
Gleichzeitige Pipelineausführungen* | 300 |
* Anfragen zur Pipelineausführung und Aufgaben über dieses Limit hinaus werden in die Warteschlange gestellt, bis Ressourcen verfügbar sind.
Für Vertex AI Pipelines gelten die folgenden Limits. Beachten Sie, dass Sie im Gegensatz zu Kontingenten keine Erhöhung eines Limits anfordern können.
Limit | Wert |
---|---|
Anzahl der Pipeline-Aufgaben pro Job | 10.000 |
Eingabe- und Ausgabeartefakte pro Pipelineaufgabe | 100 |
Eingabe- und Ausgabeartefakte pro Pipelinejob | 10.000 |
Maximale Größe der JSON-Nutzlast pro Pipelineaufgabe mit Ausgabeparametern und Artefakten | 131.072 Byte |
Maximale Laufzeit für eine Pipeline-Aufgabe** | 7 Tage |
* Pipeline-Aufgaben, die dieses Limit überschreiten, werden abgebrochen.
Kontingente und Limits für Colab Enterprise
Kontingente und Limits für Colab Enterprise werden separat aufgeführt. Weitere Informationen finden Sie unter Kontingente und Limits für Colab Enterprise.
Kontingent erhöhen
Wenn Sie eines der Kontingente für Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.
Weitere Informationen zum Senden einer Anfrage zur Kontingenterhöhung finden Sie in den folgenden Abschnitten unter Kontingente aufrufen und verwalten:
Kontingente nach Region und Modell
Kontingente in der Google Cloud -Console ansehen und bearbeiten
So rufen Sie die Kontingente in der Google Cloud -Konsole auf und bearbeiten sie:- Rufen Sie die Seite Kontingente und Systemlimits auf.
- Um das Kontingent anzupassen, kopieren Sie das Attribut
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
und fügen Sie es in den Filter ein. Drücken Sie die Eingabetaste. - Klicken Sie auf das Dreipunkt-Menü am Ende der Zeile und wählen Sie Kontingent bearbeiten aus.
- Geben Sie im Bereich einen neuen Kontingentwert ein und klicken Sie auf Anfrage senden.
Zur Seite „Kontingente und Systemlimits“
Kontingente für Anfragen pro Minute nach Region und Modell ansehen
Standardmäßig verwenden Modelle ab Version 2.0 das dynamische freigegebene Kontingent.
Wählen Sie eine Region aus, um die Kontingente für jedes verfügbare Modell aufzurufen:
Kontingente erhöhen
Wenn Sie eines der Kontingente für generative KI auf Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.
Kontingente für RAG Engine
Für jeden Dienst, der RAG (Retrieval Augmented Generation) mit RAG Engine ausführt, gelten die folgenden Kontingente. Das Kontingent wird als Anfragen pro Minute (RPM) gemessen.Dienst | Kontingent | Messwert |
---|---|---|
APIs zur Datenverwaltung für die RAG Engine | 60 U/min | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1.500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1.500 RPM | Online prediction requests per base model per minute per region per base_model Ein weiterer Filter, den Sie angeben können, ist base_model: textembedding-gecko |
Dienst | Limit | Messwert |
---|---|---|
Gleichzeitige ImportRagFiles -Anfragen |
3 RPM | VertexRagService concurrent import requests per region |
Maximale Anzahl von Dateien pro ImportRagFiles -Anfrage |
10.000 | VertexRagService import rag files requests per region |
Weitere Ratenbegrenzungen und Kontingente finden Sie unter Ratenbegrenzungen für generative KI in Vertex AI.
Batchanfragen
Die Kontingente und Limits für Batchinferenzjobs sind in allen Regionen gleich.Gleichzeitige Batchinferenzjob-Limits für Gemini-Modelle
Für die Batchinferenz für Gemini-Modelle gibt es keine vordefinierten Kontingentlimits. Stattdessen bietet der Batch-Dienst Zugriff auf einen großen, gemeinsamen Ressourcenpool, der dynamisch zugewiesen wird, basierend auf der Echtzeitverfügbarkeit des Modells und der Nachfrage aller Kunden nach diesem Modell. Wenn mehr Kunden aktiv sind und die Kapazität des Modells überschritten wird, werden Ihre Batchanfragen möglicherweise in die Warteschlange gestellt.Kontingente für gleichzeitige Batchinferenzjobs
In der folgenden Tabelle sind die Kontingente für die Anzahl der gleichzeitigen Batch-Inferenzjobs aufgeführt, die nicht für Gemini-Modelle gelten:Kontingent | Wert |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Kontingente für benutzerdefiniert trainierte Modelle
Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:Kontingent | Wert |
---|---|
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region * unterstützte Region - europe-west4 |
64 |
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region * unterstützte Region - us-central1 * unterstützte Region - us-east4 |
8 2 |
Beschränkungen für Texteinbettungen
Jede Anfrage für ein Text-Embedding-Modell kann bis zu 250 Eingabetexte (mit jeweils einem Embedding) und 20.000 Tokens pro Anfrage enthalten. Für die Berechnung der Einbettungen werden nur die ersten 2.048 Tokens in jedem Eingabetext verwendet. Fürgemini-embedding-001
kann jede Anfrage nur einen einzelnen Eingabetext enthalten.
Das Kontingent für dieses Modell wird unter dem Namen gemini-embedding
aufgeführt.
Eingabetokens für eingebettete Inhalte pro Minute und Basismodell
Im Gegensatz zu früheren Einbettungsmodellen, die hauptsächlich durch RPM-Kontingente begrenzt waren, wird das Kontingent für das Gemini Embedding-Modell durch die Anzahl der Tokens begrenzt, die pro Minute und Projekt gesendet werden können.
Kontingent | Wert |
---|---|
Eingabetokens für das Einbetten von Inhalten pro Minute | 200000 |
Dienstkontingente für den Gen AI Evaluation Service
Der Gen AI Evaluation Service verwendetgemini-2.0-flash
als Standardmodell für modellbasierte Messwerte.
Eine einzelne Bewertungsanfrage für einen modellbasierten Messwert kann zu mehreren zugrunde liegenden Anfragen an den Gen AI Evaluation Service führen. Das Kontingent jedes Modells wird auf Projektbasis berechnet. Das bedeutet, dass alle Anfragen, die zur Modellinferenz und zur modellbasierten Bewertung an gemini-2.0-flash
gerichtet werden, zum Kontingent beitragen.
Die Kontingente für den Gen AI Evaluation Service und das zugrunde liegende Judge-Modell sind in der folgenden Tabelle aufgeführt:
Kontingent anfordern | Standardkontingent |
---|---|
Anfragen pro Minute für den Gen AI Evaluation Service | 1.000 Anfragen pro Projekt und Region |
Anfragen für Onlinevorhersagen pro Minute fürbase_model: gemini-2.0-flash |
Weitere Informationen finden Sie unter Kontingente nach Region und Modell. |
Wenn Sie bei der Verwendung des Gen AI Evaluation Service einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.
Limit | Wert |
---|---|
Zeitlimit für Anfragen an den Gen AI Evaluation Service | 60 Sekunden |
Wenn Sie den Gen AI-Bewertungsdienst zum ersten Mal in einem neuen Projekt verwenden, kann es bei der ersten Einrichtung zu einer Verzögerung von bis zu zwei Minuten kommen. Wenn Ihre erste Anfrage fehlschlägt, warten Sie einige Minuten und versuchen Sie es dann noch einmal. Nachfolgende Bewertungsanfragen werden in der Regel innerhalb von 60 Sekunden abgeschlossen.
Die maximalen Eingabe- und Ausgabetokens für modellbasierte Messwerte hängen vom Modell ab, das als Judge-Modell verwendet wird. Eine Liste der Modelle finden Sie unter Google-Modelle.
Kontingente für die Pipelinebewertung
Wenn Sie bei der Verwendung des Pipelines-Bewertungsdienstes einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten. Der Pipelines-Bewertungsdienst verwendet Vertex AI Pipelines, umPipelineJobs
auszuführen. Relevante Kontingente für Vertex AI Pipelines Im Folgenden finden Sie allgemeine Empfehlungen für Kontingente:
Dienst | Kontingent | Empfehlung |
---|---|---|
Vertex AI API | Gleichzeitige LLM-Batchvorhersagejobs pro Region | Punktweise: 1 * num_concurrent_pipelines Paarweise: 2 * num_concurrent_pipelines |
Vertex AI API | Bewertungsanfragen pro Minute und Region | 1.000 * num_concurrent_pipelines |
Google Tasks | Kontingent | Basismodell | Empfehlung |
---|---|---|---|
summarization question_answering |
Anfragen für Onlinevorhersagen pro Basismodell pro Minute und Region pro base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine
Die folgenden Limits gelten für Vertex AI Agent Engine für ein bestimmtes Projekt in jeder Region:Beschreibung | Limit |
---|---|
Vertex AI Agent Engine-Agents pro Minute erstellen, löschen oder aktualisieren | 10 |
Vertex AI Agent Engine-Sitzungen pro Minute erstellen, löschen oder aktualisieren | 100 |
Vertex AI Agent Engine-Sitzungen pro Minute erstellen, löschen oder aktualisieren | 100 |
Query oder StreamQuery Vertex AI Agent Engine pro Minute |
60 |
Ereignis an Vertex AI Agent Engine-Sitzungen pro Minute anhängen | 100 |
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen | 100 |
Vertex AI Agent Engine-Speicherressourcen pro Minute erstellen, löschen oder aktualisieren | 100 |
Abrufen, Auflisten oder Abrufen aus dem Vertex AI Agent Engine Memory Bank pro Minute | 300 |
Probleme mit Fehlercode 429 beheben
Informationen zur Fehlerbehebung bei Fehler 429 finden Sie unter Fehlercode 429.