A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.

Esta página foi traduzida pela API Cloud Translation.

Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que regiões únicas.

Os endpoints de modelo não garantem a disponibilidade da região nem o processamento de ML na região. Para informações sobre a residência de dados, consulte Residência de dados.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google:

Para mais informações sobre modelos de parceiros, consulte Google Cloud locais de endpoint do modelo de parceiro.

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK da Vertex AI para Python, inicialize o SDK usando o local global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

Ajuste
Previsão em lote
O armazenamento em cache de contexto
Corpus de geração aumentada de recuperação (RAG). As solicitações de RAG são aceitas.

O uso do endpoint global com a capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Modelo	Versão mais recente do modelo compatível
Gemini 2.5 Flash-Lite (pré-lançamento)	`gemini-2.5-flash-lite-preview-06-17`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Locais de endpoints de modelos do Google

Os endpoints de modelo do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
Gemini 2.5 Flash (`gemini-2.5-flash`)	✔	✔	✔	✔	✔	✔	✔
Gemini 2.5 Pro (`gemini-2.5-pro`)	✔	✔	✔	✔	✔	✔	✔
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)	✔	✔	✔	✔	✔	✔	✔
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)	✔	✔	✔	✔	✔	✔	✔
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔	✔	✔	✔	✔	✔	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔	✔	✔	✔	✔	✔	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔	✔	✔	✔	✔	✔	✔
Embeddings para texto	✔	✔	✔	✔	✔	✔	✔
Embeddings para multimodal	✔	✔	✔	✔	✔	✔	✔
Imagem para legendas e VQA			✔	✔		✔	✔
Imagen (`imagegeneration@002`)			✔	✔		✔	✔
Imagen 2 (`imagegeneration@005`)	✔	✔	✔	✔	✔	✔	✔
Imagen 2 (`imagegeneration@006`)			✔	✔		✔	✔
Imagen 3 (`imagen-3.0-generate-001`)	✔	✔	✔	✔	✔	✔	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔	✔	✔	✔	✔	✔	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔	✔	✔	✔	✔	✔	✔
Imagen 3 (`imagen-3.0-generate-002`)	✔	✔	✔	✔	✔	✔	✔
Imagen 4 (`imagen-4.0-generate-preview-06-06`)			✔
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-preview-06-06`)			✔
Veo 2 (`veo-2.0-generate-001`)			✔
Veo 3 (`veo-3.0-generate-preview`)			✔

Canadá

	Montreal (northamerica-northeast1)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔
Embeddings para texto	✔
Embeddings para multimodal	✔
Imagem para legendas e VQA	✔
Imagen (`imagegeneration@002`)	✔
Imagen 2 (`imagegeneration@005`)	✔
Imagen 2 (`imagegeneration@006`)	✔
Imagen 3 (`imagen-3.0-generate-001`)	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔
Imagen 3 (`imagen-3.0-generate-002`)	✔

América do Sul

	São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔
Embeddings para texto	✔
Embeddings para multimodal	✔
Imagem para legendas e VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)	✔
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔
Imagen 3 (`imagen-3.0-generate-002`)	✔

Europa

	Países Baixos (europe-west4)	Paris, França (europe-west9)	Londres, Reino Unido (europe-west2)	Frankfurt, Alemanha (europe-west3)	Bélgica (europe-west1)	Zurique, Suíça (europe-west6)	Madri, Espanha (europe-southwest1)	Milão, Itália (europe-west8)	Finlândia (europe-north1)	Varsóvia, Polônia (europe-central2)
Gemini 2.5 Flash (`gemini-2.5-flash`)	✔				✔		✔	✔	✔	✔
Gemini 2.5 Pro (`gemini-2.5-pro`)	✔				✔		✔	✔	✔	✔
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)	✔				✔		✔	✔	✔	✔
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)	✔				✔		✔	✔	✔	✔
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Embeddings para texto	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Embeddings para multimodal	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Imagem para legendas e VQA	✔	✔	✔	✔	✔
Imagen (`imagegeneration@002`)	✔	✔	✔	✔	✔
Imagen 2 (`imagegeneration@005`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Imagen 2 (`imagegeneration@006`)	✔	✔	✔	✔	✔
Imagen 3 (`imagen-3.0-generate-001`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔
Imagen 3 `imagen-3.0-generate-002`)	✔	✔	✔	✔	✔	✔	✔	✔	✔	✔

Ásia-Pacífico

	Tóquio, Japão (asia-northeast1)	Sydney, Austrália (australia-southeast1)	Singapura (asia-southeast1)	Seul, Coreia (asia-northeast3)	Taiwan (asia-east1)	Hong Kong, China (asia-east2)	Mumbai, Índia (asia-south1)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔	✔	✔	✔	✔	✔	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔	✔	✔	✔	✔	✔	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔	✔	✔	✔	✔	✔	✔
Embeddings para texto	✔	✔	✔	✔	✔	✔	✔
Embeddings para multimodal	✔	✔	✔	✔	✔	✔	✔
Imagem para legendas e VQA	✔		✔	✔
Imagen (`imagegeneration@002`)	✔		✔	✔
Imagen 2 (`imagegeneration@005`)	✔	✔	✔	✔	✔	✔	✔
Imagen 2 (`imagegeneration@006`)	✔		✔	✔
Imagen 3 (`imagen-3.0-generate-001`)	✔	✔	✔	✔	✔	✔	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔	✔	✔	✔	✔	✔	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔	✔	✔	✔	✔	✔	✔
Imagen 3 (`imagen-3.0-generate-002`)	✔	✔	✔	✔	✔	✔	✔

Oriente Médio

	Damã, Arábia Saudita (me-central2)	Doha, Catar (me-central1)	Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini 1.5 Pro (`gemini-1.5-pro-002`)	✔	✔	✔
Gemini 1.5 Flash (`gemini-1.5-flash-002`)	✔	✔	✔
Embeddings do Gemini (`gemini-embedding-001`)	✔	✔	✔
Embeddings para texto	✔	✔	✔
Embeddings para multimodal	✔	✔	✔
Imagem para legendas e VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)	✔	✔	✔
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)	✔	✔	✔
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)	✔	✔	✔
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)	✔	✔	✔
Imagen 3 (`imagen-3.0-generate-002`)	✔	✔	✔

Global

	Global (global)
Gemini 2.5 Flash (`gemini-2.5-flash`)	✔
Gemini 2.5 Pro (`gemini-2.5-pro`)	✔
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite-preview-06-17`)	✔
Gemini 2.0 Flash (`gemini-2.0-flash-001`)	✔
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)	✔
Gemini 1.5 Pro (`gemini-1.5-pro-002`)
Gemini 1.5 Flash (`gemini-1.5-flash-002`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagem para legendas e VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Iowa (us-central1)
Claude Opus 4 da Anthropic	✔
Claude Sonnet 4 da Anthropic	✔
Claude 3.7 Sonnet da Anthropic	✔
Claude 3.5 Sonnet v2 da Anthropic	✔
Claude 3.5 Sonnet da Anthropic	✔
Claude 3.5 Haiku da Anthropic	✔
Haiku do Claude 3 da Anthropic	✔
DeepSeek-R1-0528		✔
Llama 4 Maverick 17B-128E (pré-lançamento)	✔
Llama 4 Scout 17B-16E (pré-lançamento)	✔
Llama 3.3 70B (pré-lançamento)		✔
Llama 3.2 90B (pré-lançamento)		✔
Llama 3.1 405B		✔
Llama 3.1 70B (pré-lançamento)		✔
Llama 3.1 8B (pré-lançamento)		✔
OCR do Mistral (25/05)		✔
Mistral Small 3.1 (25/03)		✔
Mistral Large		✔
Codestral		✔
Jamba 1.5 Large (pré-lançamento)		✔
Jamba 1.5 Mini (pré-lançamento)		✔

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic		✔
Claude 3.7 Sonnet da Anthropic		✔
Claude 3.5 Sonnet v2 da Anthropic		✔
Claude 3.5 Sonnet da Anthropic		✔
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic		✔
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
OCR do Mistral (25/05)	✔
Mistral Small 3.1 (25/03)	✔
Mistral Large	✔
Codestral	✔
Jamba 1.5 Large (pré-lançamento)	✔
Jamba 1.5 Mini (pré-lançamento)	✔

Ásia-Pacífico

	Singapura (asia-southeast1)
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Sonnet v2 da Anthropic
Claude 3.5 Sonnet da Anthropic	✔
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic	✔
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

Global

	Global (global)
Claude Opus 4 da Anthropic	✔
Claude Sonnet 4 da Anthropic	✔
Claude 3.7 Sonnet da Anthropic	✔
Claude 3.5 Sonnet v2 da Anthropic	✔
Claude 3.5 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 3.2 90B (pré-lançamento)
Llama 3.1 405B
Llama 3.1 70B (pré-lançamento)
Llama 3.1 8B (pré-lançamento)
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large
Codestral
Jamba 1.5 Large (pré-lançamento)
Jamba 1.5 Mini (pré-lançamento)

A seguir

Para um tutorial de notebook que demonstra o endpoint global, consulte Introdução ao endpoint global da Vertex AI.
Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
Saiba mais sobre as Google Cloud regiões.
Saiba mais sobre os controles de segurança por recurso.
Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
Saiba mais sobre os locais da Vertex AI.

Implantações e endpoints Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Endpoint global

Modelos compatíveis

Usar o endpoint global

Limitações

Locais de endpoints de modelos do Google

Estados Unidos

Canadá

América do Sul

Europa

Ásia-Pacífico

Oriente Médio

Global

Google Cloud locais de endpoints de modelos de parceiros

Estados Unidos

Europa

Ásia-Pacífico

Global

A seguir

Implantações e endpoints