Os endpoints de modelo não garantem a disponibilidade da região nem o processamento de ML na região. Para informações sobre a residência de dados, consulte Residência de dados.
Endpoint global
Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.
Modelos compatíveis
O uso do endpoint global é compatível com os seguintes modelos do Google:
Para mais informações sobre modelos de parceiros, consulte Google Cloud locais de endpoint do modelo de parceiro.
Usar o endpoint global
Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global
. Por exemplo, o seguinte é um URL de endpoint global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para o SDK da IA generativa do Google, crie um cliente que use o local global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Para o SDK da Vertex AI para Python,
inicialize o SDK usando o local global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitações
Os seguintes recursos não estão disponíveis ao usar o endpoint global:
- Ajuste
- Previsão em lote
- O armazenamento em cache de contexto
- Corpus de geração aumentada de recuperação (RAG). As solicitações de RAG são aceitas.
O uso do endpoint global com a capacidade de processamento provisionada está disponível apenas para os seguintes modelos:
Modelo | Versão mais recente do modelo compatível |
---|---|
Gemini 2.5 Flash-Lite (pré-lançamento) | gemini-2.5-flash-lite-preview-06-17 |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Locais de endpoints de modelos do Google
Os endpoints de modelo do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.
Estados Unidos
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Norte da Virgínia (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para texto | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para multimodal | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagem para legendas e VQA | ✔ | ✔ | ✔ | ✔ | |||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ✔ | |||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ✔ | |||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 4
( imagen-4.0-generate-preview-06-06 ) |
✔ | ||||||
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-preview-06-06 ) |
✔ | ||||||
Veo 2
( veo-2.0-generate-001 ) |
✔ | ||||||
Veo 3
( veo-3.0-generate-preview ) |
✔ |
Canadá
Montreal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ |
Embeddings para texto | ✔ |
Embeddings para multimodal | ✔ |
Imagem para legendas e VQA | ✔ |
Imagen ( imagegeneration@002 ) |
✔ |
Imagen 2 ( imagegeneration@005 ) |
✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ |
América do Sul
São Paulo, Brasil (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ |
Embeddings para texto | ✔ |
Embeddings para multimodal | ✔ |
Imagem para legendas e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
✔ |
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ |
Europa
Países Baixos (europe-west4) | Paris, França (europe-west9) | Londres, Reino Unido (europe-west2) | Frankfurt, Alemanha (europe-west3) | Bélgica (europe-west1) | Zurique, Suíça (europe-west6) | Madri, Espanha (europe-southwest1) | Milão, Itália (europe-west8) | Finlândia (europe-north1) | Varsóvia, Polônia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para texto | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para multimodal | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagem para legendas e VQA | ✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ✔ | ✔ | |||||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Ásia-Pacífico
Tóquio, Japão (asia-northeast1) | Sydney, Austrália (australia-southeast1) | Singapura (asia-southeast1) | Seul, Coreia (asia-northeast3) | Taiwan (asia-east1) | Hong Kong, China (asia-east2) | Mumbai, Índia (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para texto | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Embeddings para multimodal | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagem para legendas e VQA | ✔ | ✔ | ✔ | ||||
Imagen ( imagegeneration@002 ) |
✔ | ✔ | ✔ | ||||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
✔ | ✔ | ✔ | ||||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Oriente Médio
Damã, Arábia Saudita (me-central2) | Doha, Catar (me-central1) | Tel Aviv, Israel (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
✔ | ✔ | ✔ |
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
✔ | ✔ | ✔ |
Embeddings do Gemini ( gemini-embedding-001 ) |
✔ | ✔ | ✔ |
Embeddings para texto | ✔ | ✔ | ✔ |
Embeddings para multimodal | ✔ | ✔ | ✔ |
Imagem para legendas e VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
✔ | ✔ | ✔ |
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
✔ | ✔ | ✔ |
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
✔ | ✔ | ✔ |
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
✔ | ✔ | ✔ |
Imagen 3 ( imagen-3.0-generate-002 ) |
✔ | ✔ | ✔ |
Global
Global (global) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
✔ |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
✔ |
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite-preview-06-17 ) |
✔ |
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
✔ |
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
✔ |
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Embeddings do Gemini ( gemini-embedding-001 ) |
|
Embeddings para texto | |
Embeddings para multimodal | |
Imagem para legendas e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
Google Cloud locais de endpoints de modelos de parceiros
O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.
Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:
Estados Unidos
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Norte da Virgínia (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Opus 4 da Anthropic | ✔ | ||||||
Claude Sonnet 4 da Anthropic | ✔ | ||||||
Claude 3.7 Sonnet da Anthropic | ✔ | ||||||
Claude 3.5 Sonnet v2 da Anthropic | ✔ | ||||||
Claude 3.5 Sonnet da Anthropic | ✔ | ||||||
Claude 3.5 Haiku da Anthropic | ✔ | ||||||
Haiku do Claude 3 da Anthropic | ✔ | ||||||
DeepSeek-R1-0528 | ✔ | ||||||
Llama 4 Maverick 17B-128E (pré-lançamento) | ✔ | ||||||
Llama 4 Scout 17B-16E (pré-lançamento) | ✔ | ||||||
Llama 3.3 70B (pré-lançamento) | ✔ | ||||||
Llama 3.2 90B (pré-lançamento) | ✔ | ||||||
Llama 3.1 405B | ✔ | ||||||
Llama 3.1 70B (pré-lançamento) | ✔ | ||||||
Llama 3.1 8B (pré-lançamento) | ✔ | ||||||
OCR do Mistral (25/05) | ✔ | ||||||
Mistral Small 3.1 (25/03) | ✔ | ||||||
Mistral Large | ✔ | ||||||
Codestral | ✔ | ||||||
Jamba 1.5 Large (pré-lançamento) | ✔ | ||||||
Jamba 1.5 Mini (pré-lançamento) | ✔ |
Europa
Países Baixos (europe-west4) | Bélgica (europe-west1) | ||
---|---|---|---|
Claude Opus 4 da Anthropic | |||
Claude Sonnet 4 da Anthropic | ✔ | ||
Claude 3.7 Sonnet da Anthropic | ✔ | ||
Claude 3.5 Sonnet v2 da Anthropic | ✔ | ||
Claude 3.5 Sonnet da Anthropic | ✔ | ||
Claude 3.5 Haiku da Anthropic | |||
Haiku do Claude 3 da Anthropic | ✔ | ||
DeepSeek-R1-0528 | |||
Llama 4 Maverick 17B-128E (pré-lançamento) | |||
Llama 4 Scout 17B-16E (pré-lançamento) | |||
Llama 3.3 70B (pré-lançamento) | |||
Llama 3.2 90B (pré-lançamento) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (pré-lançamento) | |||
Llama 3.1 8B (pré-lançamento) | |||
OCR do Mistral (25/05) | ✔ | ||
Mistral Small 3.1 (25/03) | ✔ | ||
Mistral Large | ✔ | ||
Codestral | ✔ | ||
Jamba 1.5 Large (pré-lançamento) | ✔ | ||
Jamba 1.5 Mini (pré-lançamento) | ✔ |
Ásia-Pacífico
Singapura (asia-southeast1) | |
---|---|
Claude Opus 4 da Anthropic | |
Claude Sonnet 4 da Anthropic | |
Claude 3.7 Sonnet da Anthropic | |
Claude 3.5 Sonnet v2 da Anthropic | |
Claude 3.5 Sonnet da Anthropic | ✔ |
Claude 3.5 Haiku da Anthropic | |
Haiku do Claude 3 da Anthropic | ✔ |
DeepSeek-R1-0528 | |
Llama 4 Maverick 17B-128E (pré-lançamento) | |
Llama 4 Scout 17B-16E (pré-lançamento) | |
Llama 3.3 70B (pré-lançamento) | |
Llama 3.2 90B (pré-lançamento) | |
Llama 3.1 405B | |
Llama 3.1 70B (pré-lançamento) | |
Llama 3.1 8B (pré-lançamento) | |
OCR do Mistral (25/05) | |
Mistral Small 3.1 (25/03) | |
Mistral Large | |
Codestral | |
Jamba 1.5 Large (pré-lançamento) | |
Jamba 1.5 Mini (pré-lançamento) |
Global
Global (global) | ||
---|---|---|
Claude Opus 4 da Anthropic | ✔ | |
Claude Sonnet 4 da Anthropic | ✔ | |
Claude 3.7 Sonnet da Anthropic | ✔ | |
Claude 3.5 Sonnet v2 da Anthropic | ✔ | |
Claude 3.5 Sonnet da Anthropic | ||
Claude 3.5 Haiku da Anthropic | ||
Haiku do Claude 3 da Anthropic | ||
DeepSeek-R1-0528 | ||
Llama 4 Maverick 17B-128E (pré-lançamento) | ||
Llama 4 Scout 17B-16E (pré-lançamento) | ||
Llama 3.3 70B (pré-lançamento) | ||
Llama 3.2 90B (pré-lançamento) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (pré-lançamento) | ||
Llama 3.1 8B (pré-lançamento) | ||
OCR do Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large | ||
Codestral | ||
Jamba 1.5 Large (pré-lançamento) | ||
Jamba 1.5 Mini (pré-lançamento) |
A seguir
- Para um tutorial de notebook que demonstra o endpoint global, consulte Introdução ao endpoint global da Vertex AI.
- Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
- Saiba mais sobre as Google Cloud regiões.
- Saiba mais sobre os controles de segurança por recurso.
- Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
- Saiba mais sobre os locais da Vertex AI.