Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Ten en cuenta que los extremos del modelo no garantizan la disponibilidad de la región ni el procesamiento de AA en la región. Para obtener información sobre la residencia de los datos, consulta Residencia de los datos.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

Se admite el uso del extremo global para los siguientes modelos de Google:

Para obtener más información sobre los modelos de socios, consulta Google Cloud ubicaciones de extremos de modelos de socios

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes
  • El almacenamiento de contexto en caché
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Modelo Versión del modelo compatible más reciente
Gemini 2.5 Flash-Lite (versión preliminar) gemini-2.5-flash-lite-preview-06-17
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Ubicaciones de los extremos de los modelos de Google

Los extremos de los modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-preview-06-06)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-preview-06-06)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-preview)

Canadá

Montreal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Sudamérica

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Europa

Países Bajos (europe-west4) París, Francia (europe-west9) Londres, Reino Unido (europe-west2) Fráncfort, Alemania (europe-west3) Bélgica (europe-west1) Zúrich, Suiza (europe-west6) Madrid, España (europe-southwest1) Milán, Italia (europe-west8) Finlandia (europe-north1) Varsovia, Polonia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Asia-Pacífico

Tokio, Japón - asia-northeast1 Sídney, Australia (australia-southeast1) Singapur (asia-southeast1) Seúl, Corea (asia-northeast3) Taiwán (asia-east1) Hong Kong, China (asia-east2) Bombay, India (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Oriente Medio

Dammam, Arabia Saudita (me-central2) Doha, Catar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Global

Global (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global (versión preliminar) para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto de cuotas independiente del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.

Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic
Claude 3.5 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Opus de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek-R1-0528 (versión preliminar)
Llama 4 Maverick 17B-128E (vista previa)
Llama 4 Scout 17B-16E (vista previa)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

Europa

Países Bajos (europe-west4) Bélgica (europe-west1)
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic
Claude 3.5 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Opus de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek-R1-0528 (versión preliminar)
Llama 4 Maverick 17B-128E (vista previa)
Llama 4 Scout 17B-16E (vista previa)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

Asia-Pacífico

Singapur (asia-southeast1)
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic
Claude 3.5 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Opus de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek-R1-0528 (versión preliminar)
Llama 4 Maverick 17B-128E (vista previa)
Llama 4 Scout 17B-16E (vista previa)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

Global (vista previa)

Global (global)
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Sonnet v2 de Anthropic
Claude 3.5 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Opus de Anthropic
Claude 3 Haiku de Anthropic
DeepSeek-R1-0528 (versión preliminar)
Llama 4 Maverick 17B-128E (vista previa)
Llama 4 Scout 17B-16E (vista previa)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

¿Qué sigue?