Para obtener información sobre la residencia de datos, consulta Residencia de datos.
Extremo global
Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y, al mismo tiempo, reducir los errores de agotamiento de recursos (429). No uses el extremo global si tienes requisitos de procesamiento de IA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de IA cuando se realiza una solicitud.
Modelos compatibles
El uso del extremo global es compatible con los siguientes modelos:
Usa el extremo global
Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso en global
. Por ejemplo, la siguiente es la URL del extremo global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para el SDK de Google Gen AI, crea un cliente que use la ubicación global
:
client = genai.Client(
vertexai=True, project='your-project-id', location='global'
)
Limitaciones
Las siguientes funciones no están disponibles cuando se usa el extremo global:
- Ajuste
- Predicción por lotes
- El almacenamiento de contexto en caché
- Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)
- Controles del servicio de VPC
- Capacidad de procesamiento aprovisionada
¿Qué sigue?
- Para obtener un instructivo de notebook que demuestre el extremo global, consulta Introducción al extremo global de Vertex AI.
- Obtén más información sobre la residencia de datos de la IA generativa en Vertex AI.
- Obtén información sobre las regiones deGoogle Cloud .
- Obtén más información sobre los controles de seguridad por función.
- Conoce los modelos que proporcionan asistencia para la generación generativa de Vertex AI. Consulta Referencia básica de modelos generativos de IA.
- Obtén información sobre las ubicaciones de Vertex AI.