自 2025 年 4 月 29 日起,Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案,包括新專案。詳情請參閱「
模型版本和生命週期」。
已佈建的處理量總覽
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
本頁面說明預配置吞吐量,以及使用預配置吞吐量的時機。
佈建輸送量簡介
「已佈建的處理量」是固定費率的固定期限訂閱服務,可在多個期限長度中選擇,為 Vertex AI 上的支援的生成式 AI 模型保留處理量。如要保留處理量,您必須指定模型和模型執行的可用位置。
使用佈建輸送量功能的時機
如果您的用途符合下列任一考量因素,請考慮使用佈建輸送量:
- 您正在建構即時生成式 AI 實際應用程式,例如聊天機器人和服務機器人。
- 您的重要工作負載需要持續提供高處理量。吞吐量評估結果取決於模型。
- 您希望為應用程式使用者提供一致且可預測的體驗。
- 您希望支付固定的每月或每週費用,並控管超額費用,以便確保生成式 AI 的費用是確定的。
佈建的處理量是使用生成式 AI 模型的兩種方式之一。第二種方法是「隨用付費」,也稱為隨選。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-06-23 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-06-23 (世界標準時間)。"],[],[]]