Deployment dan endpoint

Model Google dan Partner serta fitur AI generatif di Vertex AI ditampilkan sebagai endpoint regional tertentu dan endpoint global. Endpoint global mencakup seluruh dunia dan memberikan ketersediaan dan keandalan yang lebih tinggi daripada region tunggal.

Perhatikan bahwa endpoint model tidak menjamin ketersediaan wilayah atau pemrosesan ML dalam wilayah. Untuk mengetahui informasi tentang residensi data, lihat Residensi data.

Endpoint global

Memilih endpoint global untuk permintaan Anda dapat meningkatkan ketersediaan secara keseluruhan sekaligus mengurangi error resource habis (429). Jangan gunakan endpoint global jika Anda memiliki persyaratan pemrosesan ML, karena Anda tidak dapat mengontrol atau mengetahui region tempat permintaan pemrosesan ML Anda dikirim saat permintaan dibuat.

Model yang didukung

Penggunaan endpoint global didukung untuk model Google berikut di wilayah tertentu. Untuk mengetahui detail tentang region yang mendukung endpoint global, lihat tab Global di tabel lokasi endpoint model Google.

Untuk mengetahui informasi tentang ketersediaan endpoint global untuk model partner, lihat tab Global di Google Cloud tabel lokasi endpoint model partner.

Menggunakan endpoint global

Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke global. Misalnya, berikut adalah URL endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Untuk Google Gen AI SDK, buat klien yang menggunakan lokasi global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Untuk Vertex AI SDK untuk Python, lakukan inisialisasi SDK menggunakan lokasi global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Batasan

Kemampuan berikut tidak tersedia saat menggunakan endpoint global:

  • Penyesuaian
  • Prediksi batch
  • Korpus retrieval-augmented generation (RAG) (permintaan RAG didukung)

Penggunaan endpoint global dengan Throughput yang Disediakan hanya tersedia untuk model berikut:

Model Versi model terbaru yang didukung
Pratinjau Gambar Gemini 2.5 Flash (pratinjau) gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Lokasi endpoint model Google

Endpoint model Google untuk AI Generatif di Vertex AI tersedia di wilayah berikut.

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (Pratinjau)
(veo-3.0-generate-preview)
Veo 3 Fast (Pratinjau)
(veo-3.0-fast-generate-preview)

Kanada

Montréal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

Amerika Selatan

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

Eropa

Belanda (europe-west4) Paris, Prancis (europe-west9) London, Inggris Raya (europe-west2) Frankfurt, Jerman (europe-west3) Belgia (europe-west1) Zürich, Swiss (europe-west6) Madrid, Spanyol (europe-southwest1) Milan, Italia (europe-west8) Finlandia (europe-north1) Warsaw, Polandia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
+ * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

Asia Pasifik

Tokyo, Jepang (asia-northeast1) Sydney, Australia (australia-southeast1) Singapura (asia-southeast1) Seoul, Korea (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, India (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

Timur Tengah

Dammam, Arab Saudi (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

Global

Global (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)

* Region hanya tersedia saat menggunakan Throughput yang Disediakan Zona Tunggal

+ Penyesuaian terawasi tidak didukung di wilayah ini.

Lokasi endpoint model partnerGoogle Cloud

Google melayani permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model partner Vertex AI untuk MaaS.

Endpoint model partner untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Claude Opus 4.1 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic (tidak digunakan lagi)
Claude 3.5 Sonnet dari Anthropic (tidak digunakan lagi)
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (Tidak digunakan lagi)
Jamba 1.5 Mini (Tidak digunakan lagi)

Eropa

Belanda (europe-west4) Belgia (europe-west1)
Claude Opus 4.1 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic (tidak digunakan lagi)
Claude 3.5 Sonnet dari Anthropic (tidak digunakan lagi)
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (Tidak digunakan lagi)
Jamba 1.5 Mini (Tidak digunakan lagi)

Asia Pasifik

Singapura (asia-southeast1) Taiwan (asia-east1)
Claude Opus 4.1 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic (tidak digunakan lagi)
Claude 3.5 Sonnet dari Anthropic (tidak digunakan lagi)
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (Tidak digunakan lagi)
Jamba 1.5 Mini (Tidak digunakan lagi)

Global

Global (global)
Claude Opus 4.1 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic (tidak digunakan lagi)
Claude 3.5 Sonnet dari Anthropic (tidak digunakan lagi)
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral
Jamba 1.5 Large (Tidak digunakan lagi)
Jamba 1.5 Mini (Tidak digunakan lagi)

Langkah berikutnya