Bereitstellungen und Endpunkte

Modelle und Funktionen für generative KI von Google und Partnern in Vertex AI werden als bestimmte regionale Endpunkte und als globaler Endpunkt bereitgestellt. Globale Endpunkte sind weltweit verfügbar und bieten eine höhere Verfügbarkeit und Zuverlässigkeit als einzelne Regionen.

Modellendpunkte sind keine Garantie für die Verfügbarkeit in einer Region oder die ML-Verarbeitung in der Region. Informationen zum Datenstandort finden Sie unter Datenstandort.

Globaler Endpunkt

Wenn Sie einen globalen Endpunkt für Ihre Anfragen auswählen, lässt sich die Gesamtverfügbarkeit verbessern und gleichzeitig die Anzahl der Fehlermeldungen vom Typ „Ressourcen ausgeschöpft“ (429) reduzieren. Verwenden Sie den globalen Endpunkt nicht, wenn Sie Anforderungen an die ML-Verarbeitung haben, da Sie nicht steuern oder wissen können, an welche Region Ihre Anfragen zur ML-Verarbeitung gesendet werden.

Unterstützte Modelle

Die Verwendung des globalen Endpunkts wird für die folgenden Modelle unterstützt:

Globalen Endpunkt verwenden

Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Speicherort der Ressource als global. Die folgende URL ist beispielsweise eine globale Endpunkt-URL:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Erstellen Sie für das Google Gen AI SDK einen Client, der den Speicherort global verwendet:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Beschränkungen

Die folgenden Funktionen sind bei Verwendung des globalen Endpunkts nicht verfügbar:

  • Abstimmung
  • Batchvorhersage
  • Kontext-Caching
  • Retrieval-Augmented Generation (RAG)-Corpus (RAG-Anfragen werden unterstützt)
  • VPC Service Controls
  • Bereitgestellter Durchsatz

Generative KI an Vertex AI-Endpunktstandorten

Standorte von Google-Modellendpunkten

Google-Modellendpunkte für die generative KI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, South Carolina (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2 
(imagegeneration@005)
Imagen 2 
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Kanada

Montreal (northamerica-northeast1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Südamerika

São Paulo, Brasilien (southamerica-east1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Europa

Niederlande (europe-west4) Paris, Frankreich (europe-west9) London, Vereinigtes Königreich (europe-west2) Frankfurt, Deutschland (europe-west3) Belgien (europe-west1) Zürich, Schweiz (europe-west6) Madrid, Spanien (europe-southwest1) Mailand, Italien (europe-west8) Finnland (europe-north1) Warschau, Polen (europe-central2)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Asiatisch-pazifischer Raum

Tokio, Japan (asia-northeast1) Sydney, Australien (australia-southeast1) Singapur (asia-southeast1) Seoul, Korea (asia-northeast3) Taiwan (asia-east1) Hongkong, China (asia-east2) Mumbai, Indien (asia-south1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Naher Osten

Dammam, Saudi-Arabien (me-central2) Doha, Katar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Global (Vorabversion)

Global (global)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Bearbeitung und Anpassung von Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud Standort des Endpunkts des Partnermodells

Endpunkte für Partnermodelle für die generative KI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, South Carolina (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Sonnet v2 von Anthropic
Claude 3.5 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Claude 3 Opus von Anthropic
Claude 3 Haiku von Anthropic
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Vorabversion)
Jamba 1.5 Mini (Vorabversion)

Europa

Niederlande (europe-west4) Belgien (europe-west1)
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Sonnet v2 von Anthropic
Claude 3.5 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Claude 3 Opus von Anthropic
Claude 3 Haiku von Anthropic
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Vorabversion)
Jamba 1.5 Mini (Vorabversion)

Asiatisch-pazifischer Raum

Singapur (asia-southeast1)
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Sonnet v2 von Anthropic
Claude 3.5 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Claude 3 Opus von Anthropic
Claude 3 Haiku von Anthropic
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Vorabversion)
Jamba 1.5 Mini (Vorabversion)

Nächste Schritte