Para informações sobre a residência de dados, consulte Residência de dados.
Endpoint global
A seleção de um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de esgotamento de recursos (429). Não use o endpoint global se tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.
Modelos compatíveis
O uso do endpoint global é compatível com os seguintes modelos:
Usar o endpoint global
Para usar o endpoint global, exclua o local do nome do endpoint e
configure o local do recurso como global
. Por exemplo, o URL de endpoint global a seguir:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para o SDK da IA generativa do Google, crie um cliente que use o local global
:
client = genai.Client(
vertexai=True, project='your-project-id', location='global'
)
Limitações
Os seguintes recursos não estão disponíveis ao usar o endpoint global:
- Ajuste
- Previsão em lote
- O armazenamento em cache de contexto
- Corpus de geração aumentada de recuperação (RAG, na sigla em inglês) (somente para solicitações RAG)
- VPC Service Controls
- Capacidade de processamento provisionada
A seguir
- Para conferir um tutorial de notebook que demonstra o endpoint global, consulte Introdução ao endpoint global da Vertex AI.
- Saiba mais sobre a IA generativa na residência de dados da Vertex AI.
- Saiba mais sobre as regiõesGoogle Cloud .
- Saiba mais sobre os controles de segurança por recurso.
- Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
- Saiba mais sobre os locais da Vertex AI.