Déploiements et points de terminaison

Les modèles Google et des partenaires, ainsi que les fonctionnalités d'IA générative sur Vertex AI, sont exposés sous la forme de points de terminaison régionaux spécifiques et d'un point de terminaison global. Les points de terminaison globaux couvrent le monde entier et offrent une disponibilité et une fiabilité supérieures à celles des régions uniques.

Notez que les points de terminaison des modèles ne garantissent pas la disponibilité régionale ni le traitement ML dans la région. Pour en savoir plus sur la résidence des données, consultez Résidence des données.

Point de terminaison global

La sélection d'un point de terminaison global pour vos requêtes peut améliorer la disponibilité générale tout en réduisant les erreurs d'épuisement des ressources (429). N'utilisez pas le point de terminaison global si vous avez des exigences en termes de traitement ML, car vous ne pouvez pas contrôler ni savoir à quelle région vos requêtes de traitement ML sont envoyées lorsqu'une requête est effectuée.

Modèles compatibles

L'utilisation du point de terminaison global est compatible avec les modèles Google suivants dans les régions spécifiées. Pour savoir quelles régions sont compatibles avec le point de terminaison mondial, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles Google.

Pour en savoir plus sur la disponibilité mondiale des points de terminaison pour les modèles partenaires, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles partenaires.Google Cloud

Utiliser le point de terminaison global

Pour utiliser le point de terminaison global, excluez l'emplacement du nom du point de terminaison et configurez l'emplacement de la ressource sur global. Voici un exemple d'URL de point de terminaison global :

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Pour le SDK Google Gen AI, créez un client qui utilise l'emplacement global :

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Pour le SDK Vertex AI pour Python, initialisez le SDK à l'aide de l'emplacement global :

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limites

Les fonctionnalités suivantes ne sont pas disponibles lorsque vous utilisez le point de terminaison global :

  • Réglage
  • Prédiction par lot
  • Corpus de génération augmentée par récupération (RAG) (les requêtes RAG sont acceptées)

L'utilisation du point de terminaison global avec le débit provisionné n'est disponible que pour les modèles suivants :

Modèle Dernière version du modèle compatible
Aperçu de l'image Gemini 2.5 Flash (aperçu) gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.0 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Emplacements des points de terminaison des modèles Google

Des points de terminaison des modèles Google pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes.

États-Unis

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Caroline du Sud (us-east1) Virginie du Nord (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (preview)
(veo-3.0-generate-preview)
Veo 3 Fast (preview)
(veo-3.0-fast-generate-preview)

Canada

Montréal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

Amérique du Sud

São Paulo, Brésil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

Europe

Pays-Bas (europe-west4) Paris, France (europe-west9) Londres, Royaume-Uni (europe-west2) Francfort, Allemagne (europe-west3) Belgique (europe-west1) Zurich, Suisse (europe-west6) Madrid, Espagne (europe-southwest1) Milan, Italie (europe-west8) Finlande (europe-north1) Varsovie, Pologne (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
+ * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

Asie-Pacifique

Tokyo, Japon (asia-northeast1) Sydney, Australie (australia-southeast1) Singapour (asia-southeast1) Séoul, Corée (asia-northeast3) Taïwan (asia-east1) Hong Kong, Chine (asia-east2) Mumbai, Inde (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

Moyen-Orient

Dammam, Arabie saoudite (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israël (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

Monde

Global (monde)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Imagen pour le sous-titrage et Visual Question Answering (VQA)
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Modification et personnalisation Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Génération expérimentale Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)

* La région n'est disponible que lorsque vous utilisez le débit provisionné d'une seule zone.

+ L'affinage supervisé n'est pas disponible dans cette région.

Emplacements des points de terminaison des modèles de partenairesGoogle Cloud

Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Points de terminaison régionaux et mondiaux" dans Modèles partenaires Vertex AI pour MaaS.

Les points de terminaison des modèles de partenaires pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes :

États-Unis

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Caroline du Sud (us-east1) Virginie du Nord (us-east4) Oregon (us-west1)
Claude 4.1 Opus d'Anthropic
Claude Opus 4 d'Anthropic
Claude Sonnet 4 d'Anthropic
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Sonnet v2 d'Anthropic (obsolète)
Claude 3.5 Sonnet d'Anthropic (obsolète)
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Preview)
Llama 4 Scout 17B-16E (Preview)
Llama 3.3 70B (Preview)
Llama 3.2 90B (Preview)
Llama 3.1 405B
Llama 3.1 70B (Preview)
Llama 3.1 8B (Preview)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsolète)
Jamba 1.5 Mini (obsolète)

Europe

Pays-Bas (europe-west4) Belgique (europe-west1)
Claude 4.1 Opus d'Anthropic
Claude Opus 4 d'Anthropic
Claude Sonnet 4 d'Anthropic
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Sonnet v2 d'Anthropic (obsolète)
Claude 3.5 Sonnet d'Anthropic (obsolète)
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Preview)
Llama 4 Scout 17B-16E (Preview)
Llama 3.3 70B (Preview)
Llama 3.2 90B (Preview)
Llama 3.1 405B
Llama 3.1 70B (Preview)
Llama 3.1 8B (Preview)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsolète)
Jamba 1.5 Mini (obsolète)

Asie-Pacifique

Singapour (asia-southeast1) Taïwan (asia-east1)
Claude 4.1 Opus d'Anthropic
Claude Opus 4 d'Anthropic
Claude Sonnet 4 d'Anthropic
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Sonnet v2 d'Anthropic (obsolète)
Claude 3.5 Sonnet d'Anthropic (obsolète)
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Preview)
Llama 4 Scout 17B-16E (Preview)
Llama 3.3 70B (Preview)
Llama 3.2 90B (Preview)
Llama 3.1 405B
Llama 3.1 70B (Preview)
Llama 3.1 8B (Preview)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsolète)
Jamba 1.5 Mini (obsolète)

Monde

Global (monde)
Claude 4.1 Opus d'Anthropic
Claude Opus 4 d'Anthropic
Claude Sonnet 4 d'Anthropic
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Sonnet v2 d'Anthropic (obsolète)
Claude 3.5 Sonnet d'Anthropic (obsolète)
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Preview)
Llama 4 Scout 17B-16E (Preview)
Llama 3.3 70B (Preview)
Llama 3.2 90B (Preview)
Llama 3.1 405B
Llama 3.1 70B (Preview)
Llama 3.1 8B (Preview)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsolète)
Jamba 1.5 Mini (obsolète)

Étapes suivantes