Deployment dan endpoint

Model Google dan Partner serta fitur AI generatif di Vertex AI ditampilkan sebagai endpoint regional tertentu dan endpoint global. Endpoint global mencakup seluruh dunia dan memberikan ketersediaan dan keandalan yang lebih tinggi daripada region tunggal.

Perhatikan bahwa endpoint model tidak menjamin ketersediaan region atau pemrosesan ML dalam region. Untuk mengetahui informasi tentang residensi data, lihat Residensi data.

Endpoint global

Memilih endpoint global untuk permintaan Anda dapat meningkatkan ketersediaan secara keseluruhan sekaligus mengurangi error resource habis (429). Jangan gunakan endpoint global jika Anda memiliki persyaratan pemrosesan ML, karena Anda tidak dapat mengontrol atau mengetahui region tempat permintaan pemrosesan ML Anda dikirim saat permintaan dibuat.

Model yang didukung

Penggunaan endpoint global didukung untuk model Google berikut:

Untuk mengetahui informasi selengkapnya tentang model partner, lihat lokasi endpoint model partnerGoogle Cloud

Menggunakan endpoint global

Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke global. Misalnya, berikut adalah URL endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Untuk Google Gen AI SDK, buat klien yang menggunakan lokasi global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Untuk Vertex AI SDK untuk Python, lakukan inisialisasi SDK menggunakan lokasi global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Batasan

Kemampuan berikut tidak tersedia saat menggunakan endpoint global:

  • Penyesuaian
  • Prediksi batch
  • Context caching
  • Korpus retrieval-augmented generation (RAG) (permintaan RAG didukung)

Penggunaan endpoint global dengan Throughput yang Disediakan hanya tersedia untuk model berikut:

Model Versi model terbaru yang didukung
Gemini 2.5 Flash-Lite (pratinjau) gemini-2.5-flash-lite-preview-06-17
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Lokasi endpoint model Google

Endpoint model Google untuk AI Generatif di Vertex AI tersedia di wilayah berikut.

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-preview-06-06)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-preview-06-06)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-preview)

Kanada

Montréal (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Amerika Selatan

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Eropa

Belanda (europe-west4) Paris, Prancis (europe-west9) London, Inggris Raya (europe-west2) Frankfurt, Jerman (europe-west3) Belgia (europe-west1) Zürich, Swiss (europe-west6) Madrid, Spanyol (europe-southwest1) Milan, Italia (europe-west8) Finlandia (europe-north1) Warsaw, Polandia (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002)

Asia Pasifik

Tokyo, Jepang (asia-northeast1) Sydney, Australia (australia-southeast1) Singapura (asia-southeast1) Seoul, Korea (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, India (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Timur Tengah

Dammam, Arab Saudi (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Global

Global (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite-preview-06-17)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Embedding Gemini
(gemini-embedding-001)
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)

Google Cloud lokasi endpoint model partner

Google melayani permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global (Pratinjau) untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model partner Vertex AI untuk MaaS.

Endpoint model partner untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic
Claude 3.5 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Opus dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek-R1-0528 (Pratinjau)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Pratinjau)
Jamba 1.5 Mini (Pratinjau)

Eropa

Belanda (europe-west4) Belgia (europe-west1)
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic
Claude 3.5 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Opus dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek-R1-0528 (Pratinjau)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Pratinjau)
Jamba 1.5 Mini (Pratinjau)

Asia Pasifik

Singapura (asia-southeast1)
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic
Claude 3.5 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Opus dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek-R1-0528 (Pratinjau)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Pratinjau)
Jamba 1.5 Mini (Pratinjau)

Global (Pratinjau)

Global (global)
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Sonnet v2 dari Anthropic
Claude 3.5 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Opus dari Anthropic
Claude 3 Haiku dari Anthropic
DeepSeek-R1-0528 (Pratinjau)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Mistral Nemo
Codestral
Jamba 1.5 Large (Pratinjau)
Jamba 1.5 Mini (Pratinjau)

Langkah berikutnya