部署和端点

Vertex AI 上的 Google 及合作伙伴模型以及生成式 AI 功能以特定区域级端点和全球端点的形式公开。全球端点覆盖全球，与单区域相比，可提供更高的可用性和可靠性。

请注意，模型端点不保证区域可用性或区域内机器学习处理功能。如需了解数据驻留，请参阅数据驻留。

全球端点

为请求选择全球端点可以提高整体可用性，同时减少资源耗尽 (429) 错误。如果您有机器学习处理要求，请勿使用全球端点，因为在发出请求时，您无法控制或知道自己的机器学习处理请求会发送到哪个区域。

支持的模型

以下 Google 模型支持在指定区域中使用全球端点。如需详细了解哪些区域支持全球端点，请参阅 Google 模型端点位置表中的全球标签页。

如需了解合作伙伴模型的全球端点可用性，请参阅 Google Cloud 合作伙伴模型端点位置表中的全球标签页。

使用全球端点

如需使用全球端点，请清除端点名称中的相应位置，并将资源位置配置为 global。例如，下面就是一个全球端点网址：

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

对于 Google Gen AI SDK，请创建一个使用 global 位置的客户端：

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

对于 Vertex AI SDK for Python，请使用 global 位置初始化 SDK：

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端点时，以下功能不可用：

调优
批量预测
检索增强生成 (RAG) 语料库（支持 RAG 请求）

只有以下模型支持将全球端点与预配吞吐量搭配使用：

模型	支持的最新模型版本
Gemini 2.5 Flash（预览版）	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite（预览版）	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash 图片	`gemini-2.5-flash-image`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Google 模型端点位置

Vertex AI 上的生成式 AI 的 Google 模型端点在以下区域提供。

美国

	俄亥俄州哥伦布市 (us-east5)	德克萨斯州达拉斯 (us-south1)	爱荷华 (us-central1)	内华达州拉斯维加斯 (us-west4)	美国南卡罗来纳州蒙克斯科纳 (us-east1)	北弗吉尼亚 (us-east4)	俄勒冈 (us-west1)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3（预览版） (`veo-3.0-generate-preview`)
Veo 3 Fast（预览版） (`veo-3.0-fast-generate-preview`)

加拿大

	蒙特利尔 (northamerica-northeast1)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)	*
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

南美洲

	巴西圣保罗 (southamerica-east1)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

欧洲

	法国巴黎 (europe-west9)	英国伦敦 (europe-west2)	德国法兰克福 (europe-west3)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)	*	*	*
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 `imagen-3.0-generate-002`
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

亚太地区

	日本东京 (asia-northeast1)	澳大利亚悉尼 (australia-southeast1)	新加坡 (asia-southeast1)	韩国首尔 (asia-northeast3)	印度孟买 (asia-south1)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)	*	*	*	*	*
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

中东

	沙特阿拉伯达曼 (me-central2)	卡塔尔多哈 (me-central1)	以色列特拉维夫 (me-west1)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

全局

	全球 (global)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 修改和自定义 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate 实验版 (`imagen-4.0-ultra-generate-001`)

*该区域仅在使用单可用区预配吞吐量时可用，并且该区域不支持监督式微调。

Google Cloud 合作伙伴模型端点位置

Google 会从您指定的区域处理请求。对于部分模型，Google 还提供全球端点，以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算，并且不支持数据驻留要求。如需了解详情，请参阅 Vertex AI 中以 MaaS 形式提供的合作伙伴模型中的“区域级端点和全球端点”部分。

Vertex AI 上的生成式 AI 的合作伙伴模型端点在以下区域提供：

美国

	俄亥俄州哥伦布市 (us-east5)	德克萨斯州达拉斯 (us-south1)	爱荷华 (us-central1)	内华达州拉斯维加斯 (us-west4)	美国南卡罗来纳州蒙克斯科纳 (us-east1)	北弗吉尼亚 (us-east4)	俄勒冈 (us-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

欧洲

	荷兰 (europe-west4)	比利时 (europe-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

亚太地区

	新加坡 (asia-southeast1)	台湾 (asia-east1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

全局

	全球 (global)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

Google Cloud 开放模型端点位置

Google 会从您指定的区域处理请求。对于部分模型，Google 还提供全球端点，以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算，并且不支持数据驻留要求。如需了解详情，请参阅 Vertex AI 中以 MaaS 形式提供的开放模型中的“区域级端点和全球端点”部分。

Vertex AI 上的生成式 AI 的开放模型端点在以下区域提供：

美国

	俄亥俄州哥伦布市 (us-east5)	德克萨斯州达拉斯 (us-south1)	爱荷华 (us-central1)	内华达州拉斯维加斯 (us-west4)	美国南卡罗来纳州蒙克斯科纳 (us-east1)	北弗吉尼亚 (us-east4)	俄勒冈 (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E（预览版）
Llama 4 Scout 17B-16E（预览版）
Llama 3.3 70B（预览版）
Llama 3.2 90B（预览版）
Llama 3.1 405B
Llama 3.1 70B（预览版）
Llama 3.1 8B（预览版）

欧洲

	荷兰 (europe-west4)	比利时 (europe-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E（预览版）
Llama 4 Scout 17B-16E（预览版）
Llama 3.3 70B（预览版）
Llama 3.2 90B（预览版）
Llama 3.1 405B
Llama 3.1 70B（预览版）
Llama 3.1 8B（预览版）

亚太地区

	新加坡 (asia-southeast1)	台湾 (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E（预览版）
Llama 4 Scout 17B-16E（预览版）
Llama 3.3 70B（预览版）
Llama 3.2 90B（预览版）
Llama 3.1 405B
Llama 3.1 70B（预览版）
Llama 3.1 8B（预览版）

全局

	全球 (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E（预览版）
Llama 4 Scout 17B-16E（预览版）
Llama 3.3 70B（预览版）
Llama 3.2 90B（预览版）
Llama 3.1 405B
Llama 3.1 70B（预览版）
Llama 3.1 8B（预览版）

后续步骤

如需查看演示全球端点的笔记本教程，请参阅 Vertex AI 全球端点简介。
详细了解 Vertex AI 上的生成式 AI 数据驻留。
了解 Google Cloud 区域。
详细了解各种功能的安全控制措施。
了解提供 Vertex AI 上的生成式 AI 支持的模型。请参阅生成式 AI 基础模型参考文档。
了解 Vertex AI 位置。

部署和端点 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

全球端点

支持的模型

使用全球端点

限制

Google 模型端点位置

美国

加拿大

南美洲

欧洲

亚太地区

中东

全局

Google Cloud 合作伙伴模型端点位置

美国

欧洲

亚太地区

全局

Google Cloud 开放模型端点位置

美国

欧洲

亚太地区

全局

后续步骤

部署和端点