Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Os endpoints de modelo não garantem a disponibilidade da região nem o processamento de ML na região. Para informações sobre a residência de dados, consulte Residência de dados.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de esgotamento de recursos (429). Não use o endpoint global se tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google:

Para mais informações sobre modelos de parceiros, consulte Google Cloud localizações de endpoint do modelo de parceiro.

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o URL de endpoint global a seguir:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

  • Ajuste
  • Previsão em lote
  • O armazenamento em cache de contexto
  • Corpus de geração aumentada de recuperação (RAG, na sigla em inglês) (somente para solicitações RAG)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

  • Gemini 2.0 Flash
  • Gemini 2.0 Flash-Lite

Locais de endpoint de modelo do Google

Os endpoints de modelo do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Norte da Virgínia (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagem 4
(imagen-4-0-generate-preview-05-20)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-exp-05-20)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-preview)

Canadá

Montreal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

América do Sul

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Europa

Países Baixos (europe-west4) Paris, França (europe-west9) Londres, Reino Unido (europe-west2) Frankfurt, Alemanha (europe-west3) Bélgica (europe-west1) Zurique, Suíça (europe-west6) Madri, Espanha (europe-southwest1) Milão, Itália (europe-west8) Finlândia (europe-north1) Varsóvia, Polônia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Ásia-Pacífico

Tóquio, Japão (asia-northeast1) Sydney, Austrália (australia-southeast1) Singapura (asia-southeast1) Seul, Coreia (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, Índia (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Oriente Médio

Damã, Arábia Saudita (me-central2) Doha, Catar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Global

Global (global)
Gemini 2.5 Flash
(gemini-2.5-flash-preview-05-20)
Gemini 2.5 Pro
(gemini-2.5-pro-preview-05-06)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002, gemini-1.5-pro-001)
Gemini 1.5 Flash
(gemini-1.5-flash-002, gemini-1.5-flash-001)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud localizações de endpoint do modelo do parceiro

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global (pré-lançamento) para melhorar a disponibilidade geral e reduzir as taxas de erro. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não oferece suporte aos requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelo do parceiro para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Norte da Virgínia (us-east4) Oregon (us-west1)
Claude Opus 4 da Anthropic
Soneto 4 Claude Anthropic
Soneto Claude 3.7 da Anthropic
Soneto Claude 3.5 v2 da Anthropic
Soneto Claude 3.5 da Anthropic
Haiku Claude 3.5 da Anthropic
Claude 3 Opus da Anthropic
Haiku Claude 3 da Anthropic
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

Europa

Países Baixos (europe-west4) Bélgica (europe-west1)
Claude Opus 4 da Anthropic
Soneto 4 Claude Anthropic
Soneto Claude 3.7 da Anthropic
Soneto Claude 3.5 v2 da Anthropic
Soneto Claude 3.5 da Anthropic
Haiku Claude 3.5 da Anthropic
Claude 3 Opus da Anthropic
Haiku Claude 3 da Anthropic
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

Ásia-Pacífico

Singapura (asia-southeast1)
Claude Opus 4 da Anthropic
Soneto 4 Claude Anthropic
Soneto Claude 3.7 da Anthropic
Soneto Claude 3.5 v2 da Anthropic
Soneto Claude 3.5 da Anthropic
Haiku Claude 3.5 da Anthropic
Claude 3 Opus da Anthropic
Haiku Claude 3 da Anthropic
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

Global (pré-lançamento)

Global (global)
Soneto 4 Claude Anthropic
Soneto Claude 3.7 da Anthropic
Soneto Claude 3.5 v2 da Anthropic
Soneto Claude 3.5 da Anthropic
Haiku Claude 3.5 da Anthropic
Claude 3 Opus da Anthropic
Haiku Claude 3 da Anthropic
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

A seguir