Modellendpunkte garantieren keine regionale Verfügbarkeit oder regionale ML-Verarbeitung. Informationen zum Datenstandort finden Sie unter Datenstandort.
Globaler Endpunkt
Wenn Sie einen globalen Endpunkt für Ihre Anfragen auswählen, kann die Gesamtverfügbarkeit verbessert und die Anzahl der Fehler vom Typ „Ressource erschöpft“ (429) reduziert werden. Verwenden Sie den globalen Endpunkt nicht, wenn Sie Anforderungen an die Verarbeitung von ML haben, da Sie nicht steuern oder wissen können, an welche Region Ihre Anfragen zur Verarbeitung von ML gesendet werden, wenn eine Anfrage gestellt wird.
Unterstützte Modelle
Die Verwendung des globalen Endpunkts wird für die folgenden Google-Modelle unterstützt:
Weitere Informationen zu Partnermodellen finden Sie unter Google Cloud Endpunktstandorte für Partnermodelle.
Globalen Endpunkt verwenden
Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf global
. Beispiel für eine globale Endpunkt-URL:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Erstellen Sie für das Google Gen AI SDK einen Client, der den global
-Standort verwendet:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Initialisieren Sie das Vertex AI SDK für Python mit dem Standort global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Beschränkungen
Die folgenden Funktionen sind bei Verwendung des globalen Endpunkts nicht verfügbar:
- Abstimmung
- Batchvorhersage
- Kontext-Caching
- RAG-Corpus (Retrieval-Augmented Generation) (RAG-Anfragen werden unterstützt)
Die Verwendung des globalen Endpunkts mit bereitgestelltem Durchsatz ist nur für die folgenden Modelle verfügbar:
Modell | Neueste unterstützte Modellversion |
---|---|
Gemini 2.5 Flash-Lite (Vorschau) | gemini-2.5-flash-lite-preview-06-17 |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Standorte von Google-Modellendpunkten
Google-Modellendpunkte für generative KI in Vertex AI sind in den folgenden Regionen verfügbar.
USA
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, South Carolina (us-east1) | Northern Virginia (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für Text | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen für Untertitel und VQA | ✔ | ✔ | ✔ | ✔ | |||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ✔ | |||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ✔ | |||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 4
( imagen-4.0-generate-preview-06-06 ) |
✔ | ||||||
Imagen 4 Ultra Generate (experimentell)
( imagen-4.0-ultra-generate-preview-06-06 ) |
✔ | ||||||
Veo 2
( veo-2.0-generate-001 ) |
✔ | ||||||
Veo 3
( veo-3.0-generate-preview ) |
✔ |
Kanada
Montreal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ |
Einbettungen für Text | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ |
Imagen für Untertitel und VQA | ✔ |
Imagen ( imagegeneration@002 ) |
✔ |
Imagen 2 ( imagegeneration@005 ) |
✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ |
Südamerika
São Paulo, Brasilien (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ |
Einbettungen für Text | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ |
Imagen für Untertitel und VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
✔ |
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ |
Europa
Niederlande (europe-west4) | Paris, Frankreich (europe-west9) | London, Vereinigtes Königreich (europe-west2) | Frankfurt, Deutschland (europe-west3) | Belgien (europe-west1) | Zürich, Schweiz (europe-west6) | Madrid, Spanien (europe-southwest1) | Mailand, Italien (europe-west8) | Finnland (europe-north1) | Warschau, Polen (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für Text | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen für Untertitel und VQA | ✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Asiatisch-pazifischer Raum
Tokio, Japan (asia-northeast1) | Sydney, Australien (australia-southeast1) | Singapur (asia-southeast1) | Seoul, Korea (asia-northeast3) | Taiwan (asia-east1) | Hongkong, China (asia-east2) | Mumbai, Indien (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für Text | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen für Untertitel und VQA | ✔ | ✔ | ✔ | ||||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ||||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ||||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Naher Osten
Dammam, Saudi-Arabien (me-central2) | Doha, Katar (me-central1) | Tel Aviv, Israel (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ |
Gemini Embeddings ( gemini-embedding-001 ) |
✔ | ✔ | ✔ |
Einbettungen für Text | ✔ | ✔ | ✔ |
Einbettungen für multimodale Konfigurationen | ✔ | ✔ | ✔ |
Imagen für Untertitel und VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ |
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ |
Global
Global (global) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ |
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
✔ |
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ |
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ |
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Einbettungen für Text | |
Einbettungen für multimodale Konfigurationen | |
Imagen für Untertitel und VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Bearbeitung und Anpassung mit Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
Google Cloud Endpunktstandorte für Partnermodelle
Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann separate Kontingente für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regional and global endpoint“ unter Vertex AI-Partnermodelle für MaaS.
Endpunkte für Partnermodelle für Generative AI in Vertex AI sind in den folgenden Regionen verfügbar:
USA
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, South Carolina (us-east1) | Northern Virginia (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Opus 4 von Anthropic | ✔ | ||||||
Claude Sonnet 4 von Anthropic | ✔ | ||||||
Claude 3.7 Sonnet von Anthropic | ✔ | ||||||
Anthropic Claude 3.5 Sonnet v2 | ✔ | ||||||
Claude 3.5 Sonnet von Anthropic | ✔ | ||||||
Claude 3.5 Haiku von Anthropic | ✔ | ||||||
Claude 3 Haiku von Anthropic | ✔ | ||||||
DeepSeek-R1-0528 | ✔ | ||||||
Llama 4 Maverick 17B-128E (Vorabversion) | ✔ | ||||||
Llama 4 Scout 17B-16E (Vorabversion) | ✔ | ||||||
Llama 3.3 70B (Vorabversion) | ✔ | ||||||
Llama 3.2 90B (Vorabversion) | ✔ | ||||||
Llama 3.1 405B | ✔ | ||||||
Llama 3.1 70B (Vorabversion) | ✔ | ||||||
Llama 3.1 8B (Vorabversion) | ✔ | ||||||
Mistral OCR (25.05) | ✔ | ||||||
Mistral Small 3.1 (25.03) | ✔ | ||||||
Mistral Large | ✔ | ||||||
Codestral | ✔ | ||||||
Jamba 1.5 Large (Vorabversion) | ✔ | ||||||
Jamba 1.5 Mini (Vorschau) | ✔ |
Europa
Niederlande (europe-west4) | Belgien (europe-west1) | ||
---|---|---|---|
Claude Opus 4 von Anthropic | |||
Claude Sonnet 4 von Anthropic | ✔ | ||
Claude 3.7 Sonnet von Anthropic | ✔ | ||
Anthropic Claude 3.5 Sonnet v2 | ✔ | ||
Claude 3.5 Sonnet von Anthropic | ✔ | ||
Claude 3.5 Haiku von Anthropic | |||
Claude 3 Haiku von Anthropic | ✔ | ||
DeepSeek-R1-0528 | |||
Llama 4 Maverick 17B-128E (Vorabversion) | |||
Llama 4 Scout 17B-16E (Vorabversion) | |||
Llama 3.3 70B (Vorabversion) | |||
Llama 3.2 90B (Vorabversion) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (Vorabversion) | |||
Llama 3.1 8B (Vorabversion) | |||
Mistral OCR (25.05) | ✔ | ||
Mistral Small 3.1 (25.03) | ✔ | ||
Mistral Large | ✔ | ||
Codestral | ✔ | ||
Jamba 1.5 Large (Vorabversion) | ✔ | ||
Jamba 1.5 Mini (Vorschau) | ✔ |
Asiatisch-pazifischer Raum
Singapur (asia-southeast1) | |
---|---|
Claude Opus 4 von Anthropic | |
Claude Sonnet 4 von Anthropic | |
Claude 3.7 Sonnet von Anthropic | |
Anthropic Claude 3.5 Sonnet v2 | |
Claude 3.5 Sonnet von Anthropic | ✔ |
Claude 3.5 Haiku von Anthropic | |
Claude 3 Haiku von Anthropic | ✔ |
DeepSeek-R1-0528 | |
Llama 4 Maverick 17B-128E (Vorabversion) | |
Llama 4 Scout 17B-16E (Vorabversion) | |
Llama 3.3 70B (Vorabversion) | |
Llama 3.2 90B (Vorabversion) | |
Llama 3.1 405B | |
Llama 3.1 70B (Vorabversion) | |
Llama 3.1 8B (Vorabversion) | |
Mistral OCR (25.05) | |
Mistral Small 3.1 (25.03) | |
Mistral Large | |
Codestral | |
Jamba 1.5 Large (Vorabversion) | |
Jamba 1.5 Mini (Vorschau) |
Global
Global (global) | ||
---|---|---|
Claude Opus 4 von Anthropic | ✔ | |
Claude Sonnet 4 von Anthropic | ✔ | |
Claude 3.7 Sonnet von Anthropic | ✔ | |
Anthropic Claude 3.5 Sonnet v2 | ✔ | |
Claude 3.5 Sonnet von Anthropic | ||
Claude 3.5 Haiku von Anthropic | ||
Claude 3 Haiku von Anthropic | ||
DeepSeek-R1-0528 | ||
Llama 4 Maverick 17B-128E (Vorabversion) | ||
Llama 4 Scout 17B-16E (Vorabversion) | ||
Llama 3.3 70B (Vorabversion) | ||
Llama 3.2 90B (Vorabversion) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (Vorabversion) | ||
Llama 3.1 8B (Vorabversion) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (Vorabversion) | ||
Jamba 1.5 Mini (Vorschau) |
Nächste Schritte
- Eine Notebook-Anleitung, in der der globale Endpunkt veranschaulicht wird, finden Sie unter Einführung in den globalen Vertex AI-Endpunkt.
- Weitere Informationen zur Datenresidenz für generative KI in Vertex AI
- Google Cloud -Regionen
- Weitere Informationen zu den Sicherheitskontrollen nach Funktion
- Erfahren Sie mehr über die Modelle, die Generative AI in Vertex AI-Unterstützung bieten. Siehe Referenz: Generative AI AI-Modellen.
- Informationen zu Vertex AI-Standorten