Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Verbrauch von Google Cloud Produkten und Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern und Kontingentanpassungen zu automatisieren
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Vertex AI-Ressourcen gelten außerdem Limits. Diese Limits stehen nicht im Zusammenhang mit dem Kontingentsystem. Limits können nicht geändert werden.
Anfragekontingente
Die folgenden Kontingente gelten für Vertex AI-Anfragen für angegebene Projekte und unterstützte Regionen. Sie können beispielsweise in einem Projekt bis zu 30.000 Anfragen pro Minute für Onlinevorhersagen in einer Region und weitere 30.000 Anfragen für Onlinevorhersagen pro Minute in einer anderen Region haben.
Art der Anfrage | Anfragen pro Minute |
---|---|
Resource Management (CRUD)-Anfragen1 | 600 |
Anfragen zum Einreichen von Jobs oder Vorgängen mit langer Ausführungszeit | 60 |
Anfragen für Onlinevorhersagen2 | 30.000 |
Durchsatz der Anfrage für Onlinevorhersagen | 1,5 GB |
Anfragen für Onlineerläuterungen | 600 |
Vertex AI TensorBoard-Leseanfragen für Zeitreihen | 60.000 |
ML-Metadaten-Anfragen (CRUD) | 12.000 |
Caching (CRUD)-Anfragen für generative KI | 200 |
Vertex AI Vizier-Anfragen (CRUD) | 6.000 |
Vertex AI Feature Store-Anfragen zur Onlinebereitstellung | 300.000 |
Vertex ML Metadata-Anfragen | 12.000 |
Anzahl der Anfragen für Zähl- oder Berechnungstokens | 3.000 |
1 Anfragen zur Ressourcenverwaltung umfassen alle Anfragen, die nicht Job, LRO, Onlinevorhersageanfrage, Vertex AI Vizier-Anfrage, ML-Metadatenanfrage, Vertex AI TensorBoard Timeseries Insights API-Leseanfrage, Vertex AI Feature Store-Anfrage, Vertex AI Feature Store-Streaminganfrage oder Vektorsuchanfrage sind.
2 Dieses Kontingent gilt nur für öffentliche Endpunkte.
Jobs oder Vorgänge mit langer Ausführungszeit umfassen folgende Anfragen:
- Dataset erstellen oder löschen
- Daten in einen Datensatz importieren oder aus einem Datensatz exportieren
- Erstellen Sie einen Endpunkt.
- Benutzerdefinierten Job erstellen oder löschen
- Daten-Labeling-Job erstellen oder löschen
- Hyperparameter-Abstimmungsjob erstellen oder löschen
- Batchvorhersagejob erstellen oder löschen
- Modelle erstellen oder löschen
- Modelle hochladen, löschen oder exportieren
- Notebook-Laufzeitvorlage erstellen oder löschen
- Notebook-Laufzeit zuweisen, löschen, starten oder aktualisieren
- Modellmonitor erstellen, löschen oder aktualisieren
- Erstellen oder löschen Sie einen Modell-Monitoring-Job.
Informationen zu Kontingenten für generative KI-Modelle finden Sie unter Kontingente und Limits für generative KI in Vertex AI.
Kontingente für AutoML-Modelle
Die folgenden Kontingente gelten für jeden Datentyp und jedes Ziel für angegebene Projekte und Regionen. Sie können beispielsweise in einem bestimmten Projekt und in einer bestimmten Region 10 AutoML-Bildklassifizierungsmodelle und 10 AutoML-Bildobjekterkennungsmodelle für insgesamt 20 erstellte Modelle bereitstellen.
Bild
Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Trainingsjobs mit Explainable AI | 2 |
Gleichzeitige Batchvorhersagejobs | 5 |
Gleichzeitige Jobs für die Modellbereitstellung | 5 |
Gleichzeitige Jobs zur Aufhebung der Bereitstellung eines Modells | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Objekterkennung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Tabellarisch
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Anzahl der bereitgestellten Modelle | 30 |
Text
.Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Entitätsextraktion
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Sentimentanalyse
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Anzahl der bereitgestellten Modelle | 10 |
Video
Aktionserkennung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Klassifizierung
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Objekt-Tracking
Kontingent | Wert |
---|---|
Gleichzeitige Trainingsjobs | 5 |
Gleichzeitige Batchvorhersagejobs | 5 |
Vertex AI Model Registry
Die von Vertex AI Model Registry unterstützte maximale Modellgröße beträgt 1 TB.
Limits für AutoML-Modelle
Die folgenden Limits gelten für jeden Datentyp für ein bestimmtes Projekt und eine bestimmte Region. Sie können beispielsweise in einem bestimmten Projekt und einer bestimmten Region maximal 1.000.000 Bilder in eine Batchanfrage einfügen.
Bild
Art des Limits | Wert |
---|---|
Größe der Bilddatei | Maximum: 30 MB |
Bilder pro Dataset | Maximum: 1.000.000 |
Labels pro Dataset | Minimum: 2 Maximum: 5.000 |
Bilder pro Label | Minimum: 10 Empfohlen: 1.000 |
Größe der Batch-Eingabe für CSV-Datei | Maximum: 100 MB |
Anzahl der Bilder in der Batch-Eingabe | Maximum: 1.000.000 |
Tabellarisch
Art des Limits | Wert |
---|---|
Maximalgröße | 100 GB |
Zeilenanzahl | Zwischen 1.000 und 200 Millionen Zeilen |
Spaltenanzahl | Zwischen zwei und 1.000 Spalten |
Anzahl der gleichzeitig ausgeführten Datensatzimporte | 5 Importe |
Größe der CSV-Datei | Maximal: 10 GB pro Datei, insgesamt maximal 100 GB |
Text
.Bei Zeichenanzahlen wird von UTF-8-Zeichen ausgegangen.
Art des Limits | Klassifizierung | Entitätsextraktion | Sentimentanalyse |
---|---|---|---|
Trainingselemente | 10 bis 1.000.000 | 50 bis 100.000 | 10 bis 100.000 |
Labels pro Dataset | 2 bis 5.000 | 1 bis 100 | 2 bis 11 |
Länge des Labelnamens | 1 bis 32 | 1 bis 32 | Ganzzahl zwischen 0 und 10 |
Länge des annotierten Spans | – | 1 bis 100 Zeichen | – |
Trainingselemente pro Label | 10 bis 1.000.000 | 100 bis 100.000 | 10 bis 100.000 |
Größe der Trainingselemente | 10 MB
5.000.000 Zeichen |
128 KB (Text); 20 MB (PDF)
10 bis 300.000 Zeichen (Text) |
128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
Zur Vorhersage gesendete Elemente | 128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
20 MB | 128 KB (Text); 2 MB (PDF)
60.000 Zeichen |
Elemente pro Batchanfrage | 10.000 | 10.000 | 10.000 |
Video
Art des Limits | Wert |
---|---|
Maximale Videolänge | 3 Stunden |
Maximale Videodateigröße | 50 GB |
Label-Mindestanzahl pro Dataset | 2 |
Video-Mindestanzahl pro Label | 10 (1.000 werden empfohlen) |
Größe der Batch-Eingabe für CSV-Datei | Maximum: 100 MB |
Anzahl der Videosegmente in der Batch-Eingabe | Maximum: 1.000 |
Kontingente für benutzerdefiniert trainierte Modelle
Die folgenden Kontingente gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.
Training
Kontingent | Wert |
---|---|
Gleichzeitige benutzerdefinierte Trainingspipelines | 2.000 |
Anzahl der N1- und E2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 2.200 |
us-west2 | 20 |
us-west3 | 2.200 |
us-west4 | 20 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 20 |
europe-west3 | 2.200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2.200 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 20 |
australia-southeast1 | 2.200 |
australia-southeast2 | 20 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Anzahl der N2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Anzahl der M1-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Anzahl der C2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Anzahl der A2-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Unbegrenzt |
us-east1 | Unbegrenzt |
us-east4 | Unbegrenzt |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Unbegrenzt |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Unbegrenzt |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Unbegrenzt |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger A3-CPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Unbegrenzt |
us-west2 | Unbegrenzt |
us-west3 | Unbegrenzt |
us-west4 | Unbegrenzt |
us-central1 | Unbegrenzt |
us-east1 | Unbegrenzt |
us-east4 | Unbegrenzt |
us-east5 | Unbegrenzt |
us-south1 | Unbegrenzt |
northamerica-northeast1 | Unbegrenzt |
northamerica-northeast2 | Unbegrenzt |
southamerica-east1 | Unbegrenzt |
southamerica-west1 | Unbegrenzt |
europe-west2 | Unbegrenzt |
europe-west1 | Unbegrenzt |
europe-west4 | Unbegrenzt |
europe-west6 | Unbegrenzt |
europe-west3 | Unbegrenzt |
europe-north1 | Unbegrenzt |
europe-central2 | Unbegrenzt |
europe-west8 | Unbegrenzt |
europe-west9 | Unbegrenzt |
europe-southwest1 | Unbegrenzt |
asia-south1 | Unbegrenzt |
asia-southeast1 | Unbegrenzt |
asia-southeast2 | Unbegrenzt |
asia-east2 | Unbegrenzt |
asia-east1 | Unbegrenzt |
asia-northeast1 | Unbegrenzt |
asia-northeast2 | Unbegrenzt |
australia-southeast1 | Unbegrenzt |
australia-southeast2 | Unbegrenzt |
asia-northeast3 | Unbegrenzt |
me-west1 | Unbegrenzt |
me-central1 | Unbegrenzt |
me-central2 | Unbegrenzt |
europe-west12 | Unbegrenzt |
africa-south1 | Unbegrenzt |
Anzahl der P4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | 6 |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | 1 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der T4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 2 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 6 |
europe-west1 | Nicht verfügbar |
europe-west4 | 2 |
europe-west6 | Nicht verfügbar |
europe-west3 | 0 |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 6 |
asia-southeast1 | 1 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 6 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 1 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der L4-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | 0 |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 0 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | 0 |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 30 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 30 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 30 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der V100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 6 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 6 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 8 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger A100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Weitere Informationen finden Sie in der Dokumentation zu Kontingenten.
Anzahl gleichzeitiger H100-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl gleichzeitiger H100-Mega-GPUs für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | 0 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 0 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 0 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 0 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Weitere Informationen finden Sie in der Dokumentation zu Kontingenten.
Anzahl der gleichzeitigen TPU V2-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 8 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V2-Pod-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V3-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 8 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU V3-Pod-Kerne für das Training pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
HDD-Nutzung (GB) während des Trainings, nach Region | |
---|---|
Region | Wert |
us-west1 | 180.000 |
us-west2 | 3.600 |
us-west3 | 180.000 |
us-west4 | 3.600 |
us-central1 | 180.000 |
us-east1 | 180.000 |
us-east4 | 3.600 |
us-east5 | 3.600 |
us-south1 | 180.000 |
northamerica-northeast1 | 180.000 |
northamerica-northeast2 | 3.600 |
southamerica-east1 | 3.600 |
southamerica-west1 | 3.600 |
europe-west2 | 180.000 |
europe-west1 | 180.000 |
europe-west4 | 180.000 |
europe-west6 | 3.600 |
europe-west3 | 180.000 |
europe-north1 | 3.600 |
europe-central2 | 180.000 |
europe-west8 | 3.600 |
europe-west9 | 180.000 |
europe-southwest1 | 3.600 |
asia-south1 | 180.000 |
asia-southeast1 | 180.000 |
asia-southeast2 | 180.000 |
asia-east2 | 180.000 |
asia-east1 | 180.000 |
asia-northeast1 | 180.000 |
asia-northeast2 | 3.600 |
australia-southeast1 | 180.000 |
australia-southeast2 | 3.600 |
asia-northeast3 | 180.000 |
me-west1 | 180.000 |
me-central1 | 3.600 |
me-central2 | 3.600 |
europe-west12 | 3.600 |
africa-south1 | 3.600 |
SSD-Nutzung (GB) während des Trainings, nach Region | |
---|---|
Region | Wert |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 75.000 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 75.000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 75.000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75.000 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 75.000 |
europe-north1 | 450 |
europe-central2 | 75.000 |
europe-west8 | 450 |
europe-west9 | 75.000 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-southeast1 | 75.000 |
asia-southeast2 | 75.000 |
asia-east2 | 75.000 |
asia-east1 | 75.000 |
asia-northeast1 | 75.000 |
asia-northeast2 | 450 |
australia-southeast1 | 75.000 |
australia-southeast2 | 450 |
asia-northeast3 | 75.000 |
me-west1 | 75.000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Serving
Kontingent | Wert |
---|---|
Anzahl der bereitgestellten Replikate benutzerdefinierter Modelle | 100 |
Anzahl der CPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 2.200 |
us-west2 | 2.200 |
us-west3 | 2.200 |
us-west4 | 16 |
us-central1 | 2.200 |
us-east1 | 2.200 |
us-east4 | 2.200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2.200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2.200 |
southamerica-west1 | 450 |
europe-west2 | 2.200 |
europe-west1 | 2.200 |
europe-west4 | 2.200 |
europe-west6 | 2.200 |
europe-west3 | 2.200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2.200 |
asia-southeast1 | 2.200 |
asia-southeast2 | 2.200 |
asia-east2 | 2.200 |
asia-east1 | 2.200 |
asia-northeast1 | 2.200 |
asia-northeast2 | 16 |
australia-southeast1 | 2.200 |
australia-southeast2 | 16 |
asia-northeast3 | 2.200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Anzahl der P100-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 30 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | 30 |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 30 |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der P4-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | 6 |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | 6 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | 6 |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der T4-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 12 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 12 |
europe-west1 | Nicht verfügbar |
europe-west4 | 12 |
europe-west6 | Nicht verfügbar |
europe-west3 | 0 |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | 6 |
asia-southeast1 | 6 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 6 |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der L4-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 28 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 28 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der V100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 6 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 6 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 6 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 14 |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 14 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 14 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | 14 |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der A100-GPUs für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | Nicht verfügbar |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 1 |
us-east1 | Nicht verfügbar |
us-east4 | 1 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 1 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 1 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der H100-GPUs für die Bereitstellung nach Region | |
---|---|
Region | Wert |
us-west1 | 8 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | 8 |
us-east1 | Nicht verfügbar |
us-east4 | 0 |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | 8 |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | 8 |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Anzahl der TPU v5e-Chips für die Bereitstellung pro Region | |
---|---|
Region | Wert |
us-west1 | 4 |
us-west2 | Nicht verfügbar |
us-west3 | Nicht verfügbar |
us-west4 | Nicht verfügbar |
us-central1 | Nicht verfügbar |
us-east1 | Nicht verfügbar |
us-east4 | Nicht verfügbar |
us-east5 | Nicht verfügbar |
us-south1 | Nicht verfügbar |
northamerica-northeast1 | Nicht verfügbar |
northamerica-northeast2 | Nicht verfügbar |
southamerica-east1 | Nicht verfügbar |
southamerica-west1 | Nicht verfügbar |
europe-west2 | Nicht verfügbar |
europe-west1 | Nicht verfügbar |
europe-west4 | Nicht verfügbar |
europe-west6 | Nicht verfügbar |
europe-west3 | Nicht verfügbar |
europe-north1 | Nicht verfügbar |
europe-central2 | Nicht verfügbar |
europe-west8 | Nicht verfügbar |
europe-west9 | Nicht verfügbar |
europe-southwest1 | Nicht verfügbar |
asia-south1 | Nicht verfügbar |
asia-southeast1 | Nicht verfügbar |
asia-southeast2 | Nicht verfügbar |
asia-east2 | Nicht verfügbar |
asia-east1 | Nicht verfügbar |
asia-northeast1 | Nicht verfügbar |
asia-northeast2 | Nicht verfügbar |
australia-southeast1 | Nicht verfügbar |
australia-southeast2 | Nicht verfügbar |
asia-northeast3 | Nicht verfügbar |
me-west1 | Nicht verfügbar |
me-central1 | Nicht verfügbar |
me-central2 | Nicht verfügbar |
europe-west12 | Nicht verfügbar |
africa-south1 | Nicht verfügbar |
Limits für benutzerdefiniert trainierte Modelle
Die folgenden Limits gelten für benutzerdefiniert trainierte Modelle von Vertex AI für angegebene Projekte und Regionen.
Serving
Limit | Wert |
---|---|
Anzahl der Replikate pro Projekt | 200 |
Anzahl der Container pro Cluster | 25.000 |
Vertex AI Feature Store
In diesem Abschnitt sind die Kontingente und Limits für Folgendes aufgeführt:
Vertex AI Feature Store
Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. Sie können beispielsweise in einem einzelnen Projekt 200 Onlinebereitstellungsknoten in us-central1
und weitere 50 Knoten in us-east4
haben.
Kontingent | Wert |
---|---|
Anfragen zur Onlinebereitstellung pro Minute | 300.000 |
Maximale Anzahl von FeatureOnlineStore -Instanzen |
10 |
Maximale Anzahl von Suchanfragen pro Minute | 6.000.000 |
Maximale Anzahl von Onlinebereitstellungsknoten für alle optimierten FeatureOnlineStore -Instanzen im Projekt |
80 |
Maximale Anzahl von FeatureView -Instanzen aller FeatureOnlineStore -Instanzen |
30 |
Für Vertex AI Feature Store gelten außerdem die folgenden Limits: Für die folgenden Limits können keine Erhöhungen angefordert werden:
Limit | Wert |
---|---|
Maximale Anzahl von FeatureGroup -Ressourcen in einem Projekt und an einem Standort |
250 |
Maximale Anzahl von Feature -Ressourcen in einer FeatureGroup |
10.000 |
Maximale Größe von Feature-Daten pro Entität | 5 MB |
Anzahl der Entitäts-IDs pro Onlinebereitstellungsanfrage (FetchFeatureValues ) |
1 |
Maximale Länge einer Entitäts-ID | 4.076 Zeichen |
Speicherlimit für einen optimierten Online-Bereitstellungsknoten | 200 GB |
Vertex AI Feature Store (Legacy)
Für ein bestimmtes Projekt und eine bestimmte Region gelten die folgenden Kontingente. In einem einzelnen Projekt können Sie beispielsweise 75 gleichzeitige Batchjobs in us-central1
und weitere 75 Jobs in europe-west4
haben.
Kontingent | Wert |
---|---|
Anfragen zur Onlinebereitstellung pro Minute | 300.000 |
Anfragen für Streamingaufnahme pro Minute | 60.000 |
Schreibdurchsatz für die Streamingaufnahme pro Minute | 1,2 GB |
Anfragen zur Featureerstellung pro Minute | 100 |
Online-Bereitstellungsknoten in allen Featurestores | 30 |
Gleichzeitige Batchjobs (Aufnahme, Bereitstellung und Löschen von Featurewerten) | 75 |
Gleichzeitige Löschanfragen für Featurewerte | 1 |
Entitätstypen für alle Featurestores | 75 |
Für Vertex AI Feature Store (Legacy) gelten außerdem die folgenden Limits: Für die folgenden Limits können keine Erhöhungen angefordert werden:
Limit | Wert |
---|---|
Speicherlimit für einen Online-Bereitstellungsknoten | 5 TB |
Gesamtdaten im Offlinespeicher | Unbegrenzt |
Features pro Entitätstyp | 5.000 |
Anzahl der Erstellungs-, Aktualisierungs- und Löschanfragen für Featurestores pro Tag, Projekt und Region | 500 |
Die Größe der Streamingaufnahme | 1 MB |
Für Streaming-Lesevorgänge die Anzahl der Entitäten, die pro Anfrage einbezogen werden können | 100 |
Für den Batchimport die Anzahl der Dateien, die pro Anfrage einbezogen werden können | 5.000 für Avro oder 500 für CSV |
Für Batchbereitstellung und exporte, die Anzahl der Features, die Sie anfordern können | 5.000 |
Der älteste Zeitstempel bei der Batchaufnahme und Streamingaufnahme, für den Featuredaten aufgenommen werden können. | 4.000 Tage ab dem aktuellen Datum |
Das Datenaufbewahrungslimit in Vertex AI Feature Store (Legacy) hat den folgenden Standardwert, den Sie überschreiben können:
Standardeinstellungen für die Datenaufbewahrung | Standardwert |
---|---|
Datenaufbewahrung im Offlinespeicher (ältester Featurewert-Zeitstempel, nach dem die Werte gelöscht werden) | 4.000 Tage ab dem aktuellen Datum |
Datenaufbewahrung im Onlinespeicher (ältester Featurewert-Zeitstempel, nach dem die Werte gelöscht werden) | 4.000 Tage ab dem aktuellen Datum |
Sie können das Limit für die Datenaufbewahrung auf folgende Arten überschreiben:
Wenn Sie das Datenaufbewahrungslimit für den Onlinespeicher überschreiben möchten, legen Sie den Parameter
online_storage_ttl_days
beim Erstellen oder Aktualisieren eines Feature Stores fest.Wenn Sie das Datenaufbewahrungslimit für den Offlinespeicher überschreiben möchten, legen Sie den Parameter
offline_storage_ttl_days
beim Erstellen oder Aktualisieren eines Entitätstyps fest.
Vektorsuche
Die folgenden Kontingente gelten für die Vektorsuche für ein bestimmtes Projekt in jeder Region.
Kontingent | Wert |
---|---|
Gleichzeitige Vorgänge für die Indexerstellung | 5 |
Gleichzeitige Vorgänge für die Indexaktualisierung | 5 |
Anzahl der bereitgestellten Indexknoten | 50 |
Anzahl der bereitgestellten Index-N2D-Knoten | 5 |
Indexanzahl | 100 |
Anfragen für Streaming-Updates pro Minute | 6.000 |
Durchsatz der Streamingaktualisierung (in KB) pro Minute | 120.000 |
Vertex ML Metadata
Die folgenden Limits gelten für Vertex ML Metadata für ein bestimmtes Projekt in jeder Region.
Limit | Wert |
---|---|
Maximale serialisierte Größe des Metadatenfelds innerhalb einer Ressource | 204.800 Byte |
Maximale serialisierte Größe von Metadatenschemata | 204.800 Byte |
Vertex AI Pipelines
Die folgenden Kontingente und Limits gelten für Vertex AI Pipelines für ein bestimmtes Projekt in jeder Region.
Kontingent | Wert |
---|---|
Pipelineaufgaben parallel ausführen* | 600 |
Gleichzeitige Pipelineausführungen* | 300 |
* Anfragen zur Pipelineausführung und zu Aufgaben, die dieses Limit überschreiten, werden in die Warteschlange gestellt, bis Ressourcen verfügbar sind.
Für Vertex AI Pipelines gelten die folgenden Limits. Beachten Sie, dass Sie im Gegensatz zu Kontingenten keine Erhöhung eines Limits anfordern können.
Limit | Wert |
---|---|
Anzahl der Pipeline-Aufgaben pro Job | 10.000 |
Eingabe- und Ausgabeartefakte pro Pipelineaufgabe | 100 |
Eingabe- und Ausgabeartefakte pro Pipelinejob | 10.000 |
Maximale Größe der JSON-Nutzlast pro Pipelineaufgabe mit Ausgabeparametern und Artefakten | 131.072 Byte |
Maximale Ausführungszeit für eine Pipeline-Aufgabe** | 7 Tage |
* Pipelineaufgaben, die dieses Limit überschreiten, werden abgebrochen.
Vertex AI-Entscheidungsoptimierung
Die folgenden Kontingente und Limits gelten für die Entscheidungsoptimierung mit Vertex AI für ein bestimmtes Projekt in jeder Region.
Kontingent | Wert |
---|---|
Anfrage lösen pro Minute | 30 |
Kontingente und Limits für Colab Enterprise
Kontingente und Limits für Colab Enterprise werden separat aufgeführt. Weitere Informationen finden Sie unter Kontingente und Limits für Google Colab Enterprise.
Kontingent erhöhen
Wenn Sie eines der Kontingente für Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.
Weitere Informationen zum Senden einer Anfrage zur Kontingenterhöhung finden Sie in den folgenden Abschnitten unter Kontingente aufrufen und verwalten:
Kontingente nach Region und Modell
Kontingente in der Google Cloud Console ansehen und bearbeiten
So rufen Sie die Kontingente in der Google Cloud Console auf und bearbeiten sie:- Rufen Sie die Seite Kontingente und Systemlimits auf.
- Wenn Sie das Kontingent anpassen möchten, kopieren Sie das Attribut
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
und fügen Sie es in das Feld Filter ein. Drücken Sie die Eingabetaste. - Klicken Sie am Ende der Zeile auf das Dreipunkt-Menü und wählen Sie Kontingent bearbeiten aus.
- Geben Sie im Bereich einen neuen Kontingentwert ein und klicken Sie auf Anfrage senden.
Kontingente und Systemlimits aufrufen
Kontingente für Anfragen pro Minute nach Region und Modell aufrufen
Bei Modellen der Version 2.0 und höher wird standardmäßig das dynamische freigegebene Kontingent (DSQ) verwendet.
Wählen Sie eine Region aus, um die Kontingente für jedes verfügbare Modell aufzurufen:
Kontingente erhöhen
Wenn Sie eines der Kontingente für die generative AI auf Vertex AI erhöhen möchten, können Sie über die Google Cloud Console eine Kontingenterhöhung anfordern.
RAG Engine-Kontingente
Für jeden Dienst, der die Retrieval-Augmented Generation (RAG) mit der RAG Engine durchführt, gelten die folgenden Kontingente. Das Kontingent wird in Anfragen pro Minute (RPM) gemessen.Dienst | Kontingent | Messwert |
---|---|---|
APIs zur Datenverwaltung der RAG Engine | 60 U/min | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1.500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1.500 RPM | Online prediction requests per base model per minute per region per base_model Sie können auch den Filter base_model: textembedding-gecko angeben. |
Dienst | Limit | Messwert |
---|---|---|
Gleichzeitige ImportRagFiles -Anfragen |
3 U/min | VertexRagService concurrent import requests per region |
Maximale Anzahl von Dateien pro ImportRagFiles -Anfrage |
10.000 | VertexRagService import rag files requests per region |
Weitere Informationen zu den Ratenbegrenzungen und Kontingenten finden Sie unter Ratenbegrenzungen für generative KI in Vertex AI.
Batchanfragen
Die Kontingente und Limits für Batchvorhersageanfragen sind für alle Regionen gleich.Limits für gleichzeitige Anfragen für Batchvorhersagen
In der folgenden Tabelle sind die Limits für die Anzahl der gleichzeitigen Batch-Vorhersageanfragen aufgeführt:Limit | Wert |
---|---|
Gemini-Modelle | 8 |
Kontingente für Anfragen für Batchvorhersagen
In der folgenden Tabelle sind die Kontingente für die Anzahl gleichzeitiger Batch-Vorhersageanfragen aufgeführt. Diese gelten nicht für Gemini-Modelle:Kontingent | Wert |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Kontingente für benutzerdefiniert trainierte Modelle
Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:Kontingent | Wert |
---|---|
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region * unterstützte Region - europe-west4 |
64 |
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region * unterstützte Region – us-central1 * unterstützte Region – us-east4 |
8 2 |
Einschränkungen bei der Texteinbettung
Jede Anfrage für ein Modell für Text-Embeddings kann bis zu 250 Eingabetexte (1 Embedding pro Eingabetext) und 20.000 Token pro Anfrage enthalten. Für die Berechnung der Einbettungen werden nur die ersten 2.048 Token in jedem Eingabetext verwendet.
Bei text-embedding-large-exp-03-07
kann jede Anfrage nur einen einzelnen Eingabetext enthalten. Das Kontingent für dieses Modell wird unter dem Namen text-embedding-large-001
aufgeführt.
Kontingente für den Gen AI Evaluation Service
Der Gen AI-Bewertungsdienst verwendetgemini-2.0-flash
als Standardbewertungsmodell für modellbasierte Messwerte.
Eine einzelne Bewertungsanfrage für einen modellbasierten Messwert kann zu mehreren zugrunde liegenden Anfragen an den Gen AI Evaluation Service führen. Das Kontingent jedes Modells wird auf Projektbasis berechnet. Das bedeutet, dass alle Anfragen, die zur Modellinferenz und zur modellbasierten Bewertung an gemini-2.0-flash
gerichtet werden, zum Kontingent beitragen.
Die Kontingente für den Gen AI Evaluation Service und das zugrunde liegende Bewertungsmodell sind in der folgenden Tabelle aufgeführt:
Kontingent anfordern | Standardkontingent |
---|---|
Anfragen an den Gen AI Evaluation Service pro Minute | 1.000 Anfragen pro Projekt und Region |
Anfragen für Onlinevorhersagen pro Minute fürbase_model: gemini-2.0-flash |
Weitere Informationen finden Sie unter Kontingente nach Region und Modell. |
Wenn Sie bei der Verwendung des Gen AI Evaluation Service einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten.
Limit | Wert |
---|---|
Zeitlimit für Gen AI Evaluation Service-Anfragen | 60 Sekunden |
Wenn Sie den Gen AI-Bewertungsdienst zum ersten Mal in einem neuen Projekt verwenden, kann die Ersteinrichtung bis zu zwei Minuten dauern. Wenn die erste Anfrage fehlschlägt, warten Sie einige Minuten und versuchen Sie es dann noch einmal. Nachfolgende Bewertungsanfragen werden in der Regel innerhalb von 60 Sekunden abgeschlossen.
Die maximalen Eingabe- und Ausgabetokens für modellbasierte Messwerte hängen vom Modell ab, das als Bewertungsmodell verwendet wird. Eine Liste der Modelle finden Sie unter Google-Modelle.
Kontingente für die Pipelinebewertung
Wenn Sie bei der Verwendung des Pipelines-Bewertungsdienstes einen Fehler im Zusammenhang mit Kontingenten erhalten, müssen Sie möglicherweise eine Kontingenterhöhung beantragen. Weitere Informationen finden Sie unter Kontingente aufrufen und verwalten. Der Pipelines-Bewertungsdienst verwendet Vertex AI Pipelines, umPipelineJobs
auszuführen. Sehen Sie sich relevante Kontingente für Vertex AI Pipelines an. Im Folgenden finden Sie allgemeine Empfehlungen für Kontingente:
Dienst | Kontingent | Empfehlung |
---|---|---|
Vertex AI API | Gleichzeitige LLM-Batchvorhersagejobs pro Region | Punktweise: 1 * num_concurrent_pipelines Paareweise: 2 * num_concurrent_pipelines |
Vertex AI API | Bewertungsanfragen pro Minute und Region | 1.000 * num_concurrent_pipelines |
Google Tasks | Kontingent | Basismodell | Empfehlung |
---|---|---|---|
summarization question_answering |
Anfragen für Onlinevorhersagen pro Basismodell pro Minute pro Region pro base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine
Die folgenden Kontingente und Limits gelten für die Vertex AI Agent Engine für ein bestimmtes Projekt in jeder Region.Kontingent | Wert |
---|---|
Vertex AI Agent Engine pro Minute erstellen/löschen/aktualisieren | 10 |
Vertex AI Agent Engine-Anfragen vom Typ „Abfrage“/„StreamQuery“ pro Minute | 60 |
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen | 100 |
Fehlercode 429 beheben
Informationen zur Fehlerbehebung bei Fehler 429 finden Sie unter Fehlercode 429.