Per informazioni sulla residenza dei dati, consulta Residenza dei dati.
Endpoint globale
La selezione di un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo al contempo gli errori di risorse esaurite (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le richieste di elaborazione ML quando viene effettuata una richiesta.
Modelli supportati
L'utilizzo dell'endpoint globale è supportato per i seguenti modelli:
Utilizzare l'endpoint globale
Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su global
. Ad esempio, il seguente è l'URL dell'endpoint globale:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Per l'SDK Google Gen AI, crea un client che utilizzi la posizione global
:
client = genai.Client(
vertexai=True, project='your-project-id', location='global'
)
Limitazioni
Le seguenti funzionalità non sono disponibili quando si utilizza l'endpoint globale:
- Ottimizzazione
- Previsione batch
- Memorizzazione nella cache del contesto
- Corpus RAG (Retrieval-Augmented Generation) (le richieste RAG sono supportate)
- Controlli di servizio VPC
- Throughput riservato
Passaggi successivi
- Per un tutorial del notebook che mostra l'endpoint globale, consulta Introduzione all'endpoint globale di Vertex AI.
- Scopri di più sulla residenza dei dati dell'IA generativa su Vertex AI.
- Scopri di più sulle regioniGoogle Cloud .
- Scopri di più sui controlli di sicurezza per funzionalità.
- Scopri i modelli che forniscono il supporto dell'IA generativa su Vertex AI. Consulta la documentazione di riferimento sul modello di base dell'IA generativa.
- Scopri di più sulle località di Vertex AI.