部署和端點

Vertex AI 上的 Google 和合作夥伴模型,以及生成式 AI 功能,會以特定區域端點和全域端點的形式公開。全域端點涵蓋全球,與單一區域相比,可用性和可靠性更高。

請注意,模型端點無法保證區域可用性或區域內 ML 處理作業。如要瞭解資料落地,請參閱「資料落地」。

全域端點

為要求選取全域端點,可提高整體可用性,同時減少資源耗盡 (429) 錯誤。如有機器學習處理需求,請勿使用全域端點,因為發出要求時,您無法控管或瞭解機器學習處理要求傳送至哪個區域。

支援的模型

下列 Google 模型支援使用全域端點:

如要進一步瞭解合作夥伴模型,請參閱Google Cloud 合作夥伴模型端點位置

使用全域端點

如要使用全域端點,請從端點名稱中排除位置,並將資源位置設為 global。舉例來說,下列是全域端點網址:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

如果是 Google Gen AI SDK,請建立使用 global 位置的用戶端:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

如要使用 Vertex AI SDK for Python,請使用 global 位置初始化 SDK:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端點時,無法使用下列功能:

  • 調整
  • 批次預測
  • 脈絡快取
  • 檢索增強生成 (RAG) 語料庫 (支援 RAG 要求)

搭配佈建輸送量使用全域端點時,僅適用於下列模型:

型號 最新支援的模型版本
Gemini 2.5 Flash-Lite (預先發布版) gemini-2.5-flash-lite-preview-06-17
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Google 模型端點位置

您可以在下列區域使用 Generative AI on Vertex AI 的 Google 模型端點。

美國

美國俄亥俄州哥倫布 (us-east5) 美國德州達拉斯 (us-south1) 愛荷華州 (us-central1) 內華達州拉斯維加斯 (us-west4) 美國南卡羅來納州蒙克斯科納 (us-east1) 北維吉尼亞州 (us-east4) 奧勒岡州 (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-preview-06-06)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-preview-06-06)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-preview)

加拿大

蒙特婁 (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

南美洲

巴西聖保羅 (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

歐洲

荷蘭 (europe-west4) 法國巴黎 (europe-west9) 英國倫敦 (europe-west2) 德國法蘭克福 (europe-west3) 比利時 (europe-west1) 瑞士蘇黎世 (europe-west6) 西班牙馬德里 (europe-southwest1) 義大利米蘭 (europe-west8) 芬蘭 (europe-north1) 波蘭華沙 (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

亞太地區

日本東京 (asia-northeast1) 澳洲雪梨 (australia-southeast1) 新加坡 (asia-southeast1) 韓國首爾 (asia-northeast3) 台灣 (asia-east1) 中國香港 (asia-east2) 印度孟買 (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

中東

沙烏地阿拉伯達曼 (me-central2) 卡達杜哈 (me-central1) 以色列特拉維夫 (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

全球

全球 (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud 合作夥伴模型端點位置

Google 會從您指定的區域提供要求。對於部分模型,Google 也提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱 MaaS 適用的 Vertex AI 合作夥伴模型中的「區域和全域端點」一節。

Vertex AI 的生成式 AI 合作夥伴模型端點適用於下列區域:

美國

美國俄亥俄州哥倫布 (us-east5) 美國德州達拉斯 (us-south1) 愛荷華州 (us-central1) 內華達州拉斯維加斯 (us-west4) 美國南卡羅來納州蒙克斯科納 (us-east1) 北維吉尼亞州 (us-east4) 奧勒岡州 (us-west1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet v2
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic Claude 3 Haiku
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

歐洲

荷蘭 (europe-west4) 比利時 (europe-west1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet v2
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic Claude 3 Haiku
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

亞太地區

新加坡 (asia-southeast1)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet v2
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic Claude 3 Haiku
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

全球

全球 (global)
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Sonnet v2
Anthropic 的 Claude 3.5 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic Claude 3 Haiku
DeepSeek-R1-0528
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (預先發布版)
Jamba 1.5 Mini (預先發布版)

後續步驟