Implantações

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI estão disponíveis para regiões específicas e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Para informações sobre a residência de dados, consulte Residência de dados.

Endpoint global

A seleção de um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de esgotamento de recursos (429). Não use o endpoint global se tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos:

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o URL de endpoint global a seguir:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

  • Ajuste
  • Previsão em lote
  • O armazenamento em cache de contexto
  • Corpus de geração aumentada de recuperação (RAG, na sigla em inglês) (somente para solicitações RAG)
  • VPC Service Controls
  • Capacidade de processamento provisionada

A seguir