Implementaciones

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI están disponibles para regiones específicas y un extremo global. Los extremos globales cubren todo el mundo y proporcionan una mayor disponibilidad y confiabilidad que las regiones individuales.

Para obtener información sobre la residencia de datos, consulta Residencia de datos.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y, al mismo tiempo, reducir los errores de agotamiento de recursos (429). No uses el extremo global si tienes requisitos de procesamiento de IA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de IA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos:

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso en global. Por ejemplo, la siguiente es la URL del extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de Google Gen AI, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Limitaciones

Las siguientes funciones no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes
  • El almacenamiento de contexto en caché
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)
  • Controles del servicio de VPC
  • Capacidad de procesamiento aprovisionada

¿Qué sigue?