Los modelos de Google y de partners, así como las funciones de IA generativa de Vertex AI, se exponen como endpoints regionales específicos y un endpoint global. Los endpoints globales cubren todo el mundo y ofrecen una disponibilidad y una fiabilidad mayores que las regiones únicas.
Ten en cuenta que los endpoints de los modelos no garantizan la disponibilidad de la región ni el procesamiento de aprendizaje automático en la región. Para obtener información sobre la residencia de datos, consulta el artículo Residencia de datos.
Endpoint global
Si seleccionas un endpoint global para tus solicitudes, puedes mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No utilices el endpoint global si tienes requisitos de procesamiento de aprendizaje automático, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de aprendizaje automático cuando se hace una solicitud.
Modelos admitidos
El uso del endpoint global está disponible para los siguientes modelos de Google en las regiones especificadas. Para obtener información sobre las regiones que admiten el endpoint global, consulta la pestaña Global de la tabla de ubicaciones de endpoints de modelos de Google.
- Versión preliminar de Gemini 2.5 Flash Image
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Para obtener información sobre la disponibilidad de los endpoints globales de los modelos de partners, consulta la pestaña Global de la Google Cloud tabla de ubicaciones de los endpoints de los modelos de partners.
Usar el endpoint global
Para usar el endpoint global, excluye la ubicación del nombre del endpoint y configura la ubicación del recurso como global
. Por ejemplo, la siguiente es una URL de endpoint global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
En el caso del SDK de Gen AI de Google, crea un cliente que use la ubicación global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
En el SDK de Vertex AI para Python, inicializa el SDK con la ubicación global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitaciones
Las siguientes funciones no están disponibles cuando se usa el endpoint global:
- Ajuste
- Predicción por lotes
- Corpus de generación aumentada por recuperación (RAG) (se admiten solicitudes de RAG)
El uso del endpoint global con Provisioned Throughput solo está disponible para los siguientes modelos:
Modelo | Versión de modelo más reciente admitida |
---|---|
Versión preliminar de Gemini 2.5 Flash Image (preview) | gemini-2.5-flash-image-preview |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Ubicaciones de los endpoints de los modelos de Google
Los endpoints de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.
Estados Unidos
Columbus (Ohio) (us-east5) | Dallas, Texas (us-south1) | Iowa (us‑central1) | Las Vegas, Nevada (us-west4) | Moncks Corner (Carolina del Sur) (us-east1) | Norte de Virginia (us‑east4) | Oregón (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings de texto | |||||||
Incrustaciones para multimodal | |||||||
Imagen para subtitulado y VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 - Rapidez
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3 (versión preliminar)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast (versión preliminar)
( veo-3.0-fast-generate-preview ) |
Canadá
Montreal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones para multimodal | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
Sudamérica
São Paulo, Brasil (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones para multimodal | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
Europa
Países Bajos (europe-west4) | París, Francia (europe-west9) | Londres (Reino Unido) (europe-west2) | Fráncfort (Alemania) (europe-west3) | Bélgica (europe‑west1) | Zúrich (Suiza) (europe-west6) | Madrid, España (europe-southwest1) | Milán, Italia (europe-west8) | Finlandia (europe-north1) | Varsovia, Polonia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
+ | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
||||||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings de texto | ||||||||||
Incrustaciones para multimodal | ||||||||||
Imagen para subtitulado y VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
Asia-Pacífico
Tokio (Japón) (asia-northeast1) | Sídney (Australia) (australia-southeast1) | Singapur (asia-southeast1) | Seúl (Corea del Sur) (asia-northeast3) | Taiwán (asia-east1) | Hong Kong (China) (asia-east2) | Bombay (India) (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | ||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings de texto | |||||||
Incrustaciones para multimodal | |||||||
Imagen para subtitulado y VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
Oriente Próximo
Dammam (Arabia Saudí) (me-central2) | Doha (Catar) (me-central1) | Tel Aviv (Israel) (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||
Gemini Embeddings ( gemini-embedding-001 ) |
|||
Embeddings de texto | |||
Incrustaciones para multimodal | |||
Imagen para subtitulado y VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
|||
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||
Imagen 4
( imagen-4.0-generate-001 ) |
|||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
Global
Global (global) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones para multimodal | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
* La región solo está disponible si se usa la capacidad de procesamiento reservada de una sola zona.
+ El ajuste fino supervisado no está disponible en esta región.
Google Cloud ubicaciones de endpoints de modelos de partners
Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" en Modelos de partners de Vertex AI para MaaS.
Los endpoints de modelos de partners de la IA generativa en Vertex AI están disponibles en las siguientes regiones:
Estados Unidos
Columbus (Ohio) (us-east5) | Dallas, Texas (us-south1) | Iowa (us‑central1) | Las Vegas, Nevada (us-west4) | Moncks Corner (Carolina del Sur) (us-east1) | Norte de Virginia (us‑east4) | Oregón (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Opus 4.1 de Anthropic | |||||||
Claude Opus 4 de Anthropic | |||||||
Claude Sonnet 4 de Anthropic | |||||||
Claude 3.7 Sonnet de Anthropic | |||||||
Claude 3.5 Sonnet v2 de Anthropic (obsoleto) | |||||||
Claude 3.5 Sonnet de Anthropic (obsoleto) | |||||||
Claude 3.5 Haiku de Anthropic | |||||||
Claude 3 Haiku de Anthropic | |||||||
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E (versión preliminar) | |||||||
Llama 4 Scout 17B-16E (versión preliminar) | |||||||
Llama 3.3 70B (versión preliminar) | |||||||
Llama 3.2 90B (versión preliminar) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B (versión preliminar) | |||||||
Llama 3.1 8B (versión preliminar) | |||||||
Mistral OCR (25.05) | |||||||
Mistral Small 3.1 (25.03) | |||||||
Mistral Large | |||||||
Codestral | |||||||
Jamba 1.5 Large (obsoleto) | |||||||
Jamba 1.5 Mini (obsoleto) |
Europa
Países Bajos (europe-west4) | Bélgica (europe‑west1) | ||
---|---|---|---|
Claude Opus 4.1 de Anthropic | |||
Claude Opus 4 de Anthropic | |||
Claude Sonnet 4 de Anthropic | |||
Claude 3.7 Sonnet de Anthropic | |||
Claude 3.5 Sonnet v2 de Anthropic (obsoleto) | |||
Claude 3.5 Sonnet de Anthropic (obsoleto) | |||
Claude 3.5 Haiku de Anthropic | |||
Claude 3 Haiku de Anthropic | |||
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E (versión preliminar) | |||
Llama 4 Scout 17B-16E (versión preliminar) | |||
Llama 3.3 70B (versión preliminar) | |||
Llama 3.2 90B (versión preliminar) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (versión preliminar) | |||
Llama 3.1 8B (versión preliminar) | |||
Mistral OCR (25.05) | |||
Mistral Small 3.1 (25.03) | |||
Mistral Large | |||
Codestral | |||
Jamba 1.5 Large (obsoleto) | |||
Jamba 1.5 Mini (obsoleto) |
Asia-Pacífico
Singapur (asia-southeast1) | Taiwán (asia-east1) | |
---|---|---|
Claude Opus 4.1 de Anthropic | ||
Claude Opus 4 de Anthropic | ||
Claude Sonnet 4 de Anthropic | ||
Claude 3.7 Sonnet de Anthropic | ||
Claude 3.5 Sonnet v2 de Anthropic (obsoleto) | ||
Claude 3.5 Sonnet de Anthropic (obsoleto) | ||
Claude 3.5 Haiku de Anthropic | ||
Claude 3 Haiku de Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (versión preliminar) | ||
Llama 4 Scout 17B-16E (versión preliminar) | ||
Llama 3.3 70B (versión preliminar) | ||
Llama 3.2 90B (versión preliminar) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (versión preliminar) | ||
Llama 3.1 8B (versión preliminar) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (obsoleto) | ||
Jamba 1.5 Mini (obsoleto) |
Global
Global (global) | ||
---|---|---|
Claude Opus 4.1 de Anthropic | ||
Claude Opus 4 de Anthropic | ||
Claude Sonnet 4 de Anthropic | ||
Claude 3.7 Sonnet de Anthropic | ||
Claude 3.5 Sonnet v2 de Anthropic (obsoleto) | ||
Claude 3.5 Sonnet de Anthropic (obsoleto) | ||
Claude 3.5 Haiku de Anthropic | ||
Claude 3 Haiku de Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (versión preliminar) | ||
Llama 4 Scout 17B-16E (versión preliminar) | ||
Llama 3.3 70B (versión preliminar) | ||
Llama 3.2 90B (versión preliminar) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (versión preliminar) | ||
Llama 3.1 8B (versión preliminar) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (obsoleto) | ||
Jamba 1.5 Mini (obsoleto) |
Siguientes pasos
- Para ver un tutorial en un cuaderno que muestre el endpoint global, consulta Introducción al endpoint global de Vertex AI.
- Consulta más información sobre la residencia de datos de la IA generativa en Vertex AI.
- Consulta información sobre las Google Cloud regiones.
- Consulta más información sobre los controles de seguridad por función.
- Consulta información sobre los modelos que ofrecen compatibilidad con la IA generativa en Vertex AI. Consulta la referencia del modelo fundamental de IA generativa.
- Consulta información sobre las ubicaciones de Vertex AI.