Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Auf dieser Seite erfahren Sie, was Provisioned Throughput ist und wann Sie ihn verwenden sollten.
Einführung in den bereitgestellten Durchsatz
Bereitgestellter Durchsatz ist ein Abo mit fester Laufzeit und fester Gebühr, das in mehreren Laufzeiten verfügbar ist und Durchsatz für unterstützte generative KI-Modelle in Vertex AI reserviert.
Wenn Sie den Durchsatz reservieren möchten, müssen Sie das Modell und die verfügbaren Standorte angeben, an denen das Modell ausgeführt wird.
Wann sollte Provisioned Throughput verwendet werden?
Wenn einer der folgenden Punkte auf Ihren Anwendungsfall zutrifft, sollten Sie Provisioned Throughput verwenden:
Sie entwickeln Produktionsanwendungen für generative KI in Echtzeit, z. B. Chatbots und Agenten.
Ihre kritischen Arbeitslasten erfordern einen konstant hohen Durchsatz. Die Messung des Durchsatzes hängt vom Modell ab.
Sie möchten Nutzern Ihrer Anwendungen eine einheitliche und vorhersehbare Umgebung bieten.
Sie möchten deterministische Kosten für generative KI, indem Sie einen festen monatlichen oder wöchentlichen Preis zahlen und die Kontrolle über Mehrausgaben haben.
Bereitgestellter Durchsatz ist eine von zwei Möglichkeiten, Ihre Modelle für generative KI zu verwenden. Die zweite Möglichkeit ist die Abrechnung nach Verbrauch, die auch als On-Demand-Verfahren bezeichnet wird.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-25 (UTC)."],[],[],null,["# Provisioned Throughput overview\n\nThis page explains what Provisioned Throughput is and when to use Provisioned Throughput.\n\nIntroduction to Provisioned Throughput\n--------------------------------------\n\nProvisioned Throughput is a fixed-cost, fixed-term subscription\navailable in several term-lengths that reserves throughput for\n[supported generative AI models](/vertex-ai/generative-ai/docs/supported-models) on Vertex AI.\nTo reserve your throughput, you must specify the model and [available\nlocations](/vertex-ai/generative-ai/docs/learn/locations#available-regions) in which the model\nruns.\n\nWhen to use Provisioned Throughput\n----------------------------------\n\nIf any of the following considerations apply to your use case, consider using\nProvisioned Throughput:\n\n- You are building real-time generative AI production applications, such as chatbots and agents.\n- Your critical workloads consistently require high throughput. Throughput measurement depends on the model.\n- You want to provide a consistent and predictable experience for users of your applications.\n- You want deterministic generative AI costs by paying a fixed monthly or weekly price with control of overages.\n\nProvisioned Throughput is one of two ways to consume your\ngenerative AI models. The second way is pay-as-you-go, which is also referred to\nas [on-demand](/vertex-ai/generative-ai/docs/error-code-429#troubleshoot-dynamic-shared-quota).\n\nWhat's next\n-----------\n\n- [Supported models](/vertex-ai/generative-ai/docs/supported-models) using Provisioned Throughput."]]