Despliegues y endpoints

Los modelos de Google y de partners, así como las funciones de IA generativa de Vertex AI, se exponen como endpoints regionales específicos y un endpoint global. Los endpoints globales cubren todo el mundo y ofrecen una disponibilidad y una fiabilidad mayores que las regiones únicas.

Ten en cuenta que los endpoints de los modelos no garantizan la disponibilidad de la región ni el procesamiento de aprendizaje automático en la región. Para obtener información sobre la residencia de datos, consulta el artículo Residencia de datos.

Endpoint global

Si seleccionas un endpoint global para tus solicitudes, puedes mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No utilices el endpoint global si tienes requisitos de procesamiento de aprendizaje automático, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de aprendizaje automático cuando se hace una solicitud.

Modelos admitidos

El uso del endpoint global está disponible para los siguientes modelos de Google en las regiones especificadas. Para obtener información sobre las regiones que admiten el endpoint global, consulta la pestaña Global de la tabla de ubicaciones de endpoints de modelos de Google.

Para obtener información sobre la disponibilidad de los endpoints globales de los modelos de partners, consulta la pestaña Global de la Google Cloud tabla de ubicaciones de los endpoints de los modelos de partners.

Usar el endpoint global

Para usar el endpoint global, excluye la ubicación del nombre del endpoint y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

En el caso del SDK de Gen AI de Google, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes funciones no están disponibles cuando se usa el endpoint global:

  • Ajuste
  • Predicción por lotes
  • Corpus de generación aumentada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del endpoint global con Provisioned Throughput solo está disponible para los siguientes modelos:

Modelo Versión de modelo más reciente admitida
Versión preliminar de Gemini 2.5 Flash Image (preview) gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Ubicaciones de los endpoints de los modelos de Google

Los endpoints de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

Columbus (Ohio) (us-east5) Dallas, Texas (us-south1) Iowa (us‑central1) Las Vegas, Nevada (us-west4) Moncks Corner (Carolina del Sur) (us-east1) Norte de Virginia (us‑east4) Oregón (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 - Rapidez
(veo-3.0-fast-generate-001)
Veo 3 (versión preliminar)
(veo-3.0-generate-preview)
Veo 3 Fast (versión preliminar)
(veo-3.0-fast-generate-preview)

Canadá

Montreal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

Sudamérica

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

Europa

Países Bajos (europe-west4) París, Francia (europe-west9) Londres (Reino Unido) (europe-west2) Fráncfort (Alemania) (europe-west3) Bélgica (europe‑west1) Zúrich (Suiza) (europe-west6) Madrid, España (europe-southwest1) Milán, Italia (europe-west8) Finlandia (europe-north1) Varsovia, Polonia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
+ * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

Asia-Pacífico

Tokio (Japón) (asia-northeast1) Sídney (Australia) (australia-southeast1) Singapur (asia-southeast1) Seúl (Corea del Sur) (asia-northeast3) Taiwán (asia-east1) Hong Kong (China) (asia-east2) Bombay (India) (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

Oriente Próximo

Dammam (Arabia Saudí) (me-central2) Doha (Catar) (me-central1) Tel Aviv (Israel) (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

Global

Global (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones para multimodal
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)

* La región solo está disponible si se usa la capacidad de procesamiento reservada de una sola zona.

+ El ajuste fino supervisado no está disponible en esta región.

Google Cloud ubicaciones de endpoints de modelos de partners

Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" en Modelos de partners de Vertex AI para MaaS.

Los endpoints de modelos de partners de la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus (Ohio) (us-east5) Dallas, Texas (us-south1) Iowa (us‑central1) Las Vegas, Nevada (us-west4) Moncks Corner (Carolina del Sur) (us-east1) Norte de Virginia (us‑east4) Oregón (us-west1)
Claude Opus 4.1 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic (obsoleto)
Claude 3.5 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsoleto)
Jamba 1.5 Mini (obsoleto)

Europa

Países Bajos (europe-west4) Bélgica (europe‑west1)
Claude Opus 4.1 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic (obsoleto)
Claude 3.5 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsoleto)
Jamba 1.5 Mini (obsoleto)

Asia-Pacífico

Singapur (asia-southeast1) Taiwán (asia-east1)
Claude Opus 4.1 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic (obsoleto)
Claude 3.5 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsoleto)
Jamba 1.5 Mini (obsoleto)

Global

Global (global)
Claude Opus 4.1 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic (obsoleto)
Claude 3.5 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (obsoleto)
Jamba 1.5 Mini (obsoleto)

Siguientes pasos