Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI, se exponen como extremos regionales y un extremo global específicos. Los extremos globales abarcan todo el mundo y proporcionan una disponibilidad y confiabilidad más altas que las regiones individuales.

Ten en cuenta que los extremos de modelos no garantizan la disponibilidad de la región ni el procesamiento de IA en la región. Para obtener información sobre la residencia de datos, consulta Residencia de datos.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y, al mismo tiempo, reducir los errores de agotamiento de recursos (429). No uses el extremo global si tienes requisitos de procesamiento de IA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de IA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos:

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso en global. Por ejemplo, la siguiente es la URL del extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de Google Gen AI, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Limitaciones

Las siguientes funciones no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes
  • El almacenamiento de contexto en caché
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)
  • Controles del servicio de VPC
  • Capacidad de procesamiento aprovisionada

IA generativa en ubicaciones de extremos de Vertex AI

Ubicaciones de los extremos de los modelos de Google

Los extremos de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Imagen 3: Edición y personalización
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Canadá

Montreal (northamerica-northeast1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Sudamérica

São Paulo, Brasil (southamerica-east1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Europa

Países Bajos (europe-west4) París, Francia (europe-west9) Londres, Reino Unido (europe-west2) Fráncfort, Alemania (europe-west3) Bélgica (europe-west1) Zúrich, Suiza (europe-west6) Madrid, España (europe-southwest1) Milán, Italia (europe-west8) Finlandia (europe-north1) Varsovia, Polonia (europe-central2)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Asia-Pacífico

Tokio, Japón - asia-northeast1 Sídney, Australia (australia-southeast1) Singapur (asia-southeast1) Seúl, Corea (asia-northeast3) Taiwán (asia-east1) Hong Kong, China (asia-east2) Bombay, India (asia-south1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Oriente Medio

Dammam, Arabia Saudita (me-central2) Doha, Catar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Global (versión preliminar)

Global (global)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 rápida
(imagen-3.0-fast-generate-001)
Edición y personalización de la imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud ubicaciones de los extremos del modelo de socio

Los extremos de modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Anthropic Claude 3.7 Sonnet
Anthropic Claude 3.5 Sonnet v2
Anthropic Claude 3.5 Sonnet
Anthropic Claude 3.5 Haiku
Claude 3 Opus de Anthropic
Anthropic Claude 3 Haiku
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral Small 3.1 (25.03)
Mistral grande
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

Europa

Países Bajos (europe-west4) Bélgica (europe-west1)
Anthropic Claude 3.7 Sonnet
Anthropic Claude 3.5 Sonnet v2
Anthropic Claude 3.5 Sonnet
Anthropic Claude 3.5 Haiku
Claude 3 Opus de Anthropic
Anthropic Claude 3 Haiku
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral Small 3.1 (25.03)
Mistral grande
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

Asia-Pacífico

Singapur (asia-southeast1)
Anthropic Claude 3.7 Sonnet
Anthropic Claude 3.5 Sonnet v2
Anthropic Claude 3.5 Sonnet
Anthropic Claude 3.5 Haiku
Claude 3 Opus de Anthropic
Anthropic Claude 3 Haiku
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Mistral Small 3.1 (25.03)
Mistral grande
Mistral Nemo
Codestral
Jamba 1.5 Large (versión preliminar)
Jamba 1.5 Mini (versión preliminar)

¿Qué sigue?