已佈建的處理量總覽

本頁面說明預配置吞吐量,以及使用預配置吞吐量的時機。

佈建輸送量簡介

「已佈建的處理量」是固定費率的固定期限訂閱服務,可在多個期限長度中選擇,為 Vertex AI 上的支援的生成式 AI 模型保留處理量。如要保留處理量,您必須指定模型和模型執行的可用位置

使用佈建輸送量功能的時機

如果您的用途符合下列任一考量因素,請考慮使用佈建輸送量:

  • 您正在建構即時生成式 AI 實際應用程式,例如聊天機器人和服務機器人。
  • 您的重要工作負載需要持續提供高處理量。吞吐量評估結果取決於模型。
  • 您希望為應用程式使用者提供一致且可預測的體驗。
  • 您希望支付固定的每月或每週費用,並控管超額費用,以便確保生成式 AI 的費用是確定的。

佈建的處理量是使用生成式 AI 模型的兩種方式之一。第二種方法是「隨用付費」,也稱為隨選

後續步驟