Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini menjelaskan apa yang dimaksud dengan Provisioned Throughput dan kapan harus menggunakan Provisioned Throughput.
Pengantar Throughput yang Disediakan
Throughput yang Disediakan adalah langganan dengan biaya tetap dan jangka waktu tetap
yang tersedia dalam beberapa durasi yang mencadangkan throughput untuk
model AI generatif yang didukung di Vertex AI.
Untuk mencadangkan throughput, Anda harus menentukan model dan lokasi
yang tersedia tempat model
berjalan.
Kapan harus menggunakan Throughput yang Disediakan
Jika salah satu pertimbangan berikut berlaku untuk kasus penggunaan Anda, pertimbangkan untuk menggunakan
Throughput yang Disediakan:
Anda sedang membangun aplikasi produksi AI generatif real-time, seperti
chatbot dan agen.
Beban kerja penting Anda secara konsisten memerlukan throughput tinggi. Pengukuran throughput
bergantung pada model.
Anda ingin memberikan pengalaman yang konsisten dan dapat diprediksi bagi pengguna
aplikasi Anda.
Anda menginginkan biaya AI generatif deterministik dengan membayar harga bulanan atau mingguan
tetap dengan kontrol kelebihan.
Throughput yang Disediakan adalah salah satu dari dua cara untuk menggunakan
model AI generatif Anda. Cara kedua adalah bayar sesuai pemakaian, yang juga disebut
sebagai on-demand.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-25 UTC."],[],[],null,["# Provisioned Throughput overview\n\nThis page explains what Provisioned Throughput is and when to use Provisioned Throughput.\n\nIntroduction to Provisioned Throughput\n--------------------------------------\n\nProvisioned Throughput is a fixed-cost, fixed-term subscription\navailable in several term-lengths that reserves throughput for\n[supported generative AI models](/vertex-ai/generative-ai/docs/supported-models) on Vertex AI.\nTo reserve your throughput, you must specify the model and [available\nlocations](/vertex-ai/generative-ai/docs/learn/locations#available-regions) in which the model\nruns.\n\nWhen to use Provisioned Throughput\n----------------------------------\n\nIf any of the following considerations apply to your use case, consider using\nProvisioned Throughput:\n\n- You are building real-time generative AI production applications, such as chatbots and agents.\n- Your critical workloads consistently require high throughput. Throughput measurement depends on the model.\n- You want to provide a consistent and predictable experience for users of your applications.\n- You want deterministic generative AI costs by paying a fixed monthly or weekly price with control of overages.\n\nProvisioned Throughput is one of two ways to consume your\ngenerative AI models. The second way is pay-as-you-go, which is also referred to\nas [on-demand](/vertex-ai/generative-ai/docs/error-code-429#troubleshoot-dynamic-shared-quota).\n\nWhat's next\n-----------\n\n- [Supported models](/vertex-ai/generative-ai/docs/supported-models) using Provisioned Throughput."]]