購買已佈建的輸送量

本頁面提供訂閱預設吞吐量前應考量的詳細資訊、下單或查看預設吞吐量訂單時必須具備的權限,以及下單和查看訂單的操作說明。

購買前應考量的問題

如要決定是否購買佈建輸送量服務,請考量下列事項:

  • 你無法在訂閱期中途取消訂單。

    您購買的預設吞吐量是一種承諾,也就是說,您無法在訂購期中途取消訂單。不過,您可以增加購買的 GSU 數量。如果您不小心購買了承諾產品,或是設定發生問題,請與Google Cloud 帳戶代表聯絡,尋求協助。

  • 你可以自動續訂訂閱項目。

    提交訂單時,您可以選擇在訂閱期結束時自動續約,或讓訂閱方案到期。您可以取消自動續訂程序。如要在自動續訂前取消訂閱,請在下個期限開始前 30 天取消自動續訂。

    您可以設定每月訂閱方案,讓系統每個月自動續訂。每週方案不支援自動續約。

    詳情請參閱「變更已配置的傳送量順序」。你也可以與 Google Cloud 帳戶代表聯絡,尋求協助。

  • 您可以變更自動續約行為、模型、模型版本或區域,但必須事先通知我們。

    選擇專案、地區、模型、模型版本和自動續約行為,並且訂單獲得核准及啟用後,系統就會啟用佈建輸送量服務,但須視可用容量而定。您可以使用 Google Cloud 控制台變更自動續約行為、模式或模式版本,並用來修改現有訂單。詳情請參閱「變更已配置的傳輸量訂單」。

    如要變更區域,請與 Google Cloud 帳戶代表聯絡尋求協助。可能需要訂購新的訂單,並設定新的訂閱結束日期。

    我們會盡力處理所有變更,通常會在初始要求後的 10 個工作天內完成。

    模型變更僅限於特定發布商。舉例來說,您可以將已配置吞吐量的模型指派作業從 Google Gemini 2.0 Pro 切換至 Google Gemini 2.0 Flash,但無法從 Google Gemini 2.0 Flash 切換至 Anthropic 的 Claude 3.5 Sonnet v2。

  • 根據預設,超出部分會以即付即用計費。

    如果處理量超過預配置處理量訂單金額,系統會以標準即付即用價格處理及計費超出部分。您可以針對個別要求控制超出部分。詳情請參閱「使用已配置的傳送量」。

如需定價資訊,請參閱「已配置的傳送量」。

為預先發布版模型購買佈建輸送量

您可以在預覽期間為 Google 模型購買已配置的傳輸量,前提是模型尚未發布一般版本。

如果您有預先發布模型的有效佈建輸送量訂單,且模型的一般版本已發布,則可採取下列任一做法:

  • 將訂單移至模型的正式版。請注意,將訂單移至一般可用的模型後,您就無法將訂單切換回預覽模型。如要進一步瞭解如何變更訂單,請參閱「變更已配置傳輸量訂單」。

  • 或者,只要預覽版穩定,就繼續為模型的預覽版使用已佈建輸送量。如要進一步瞭解穩定和已淘汰的模型,請參閱「模型版本和生命週期」。

角色和權限

下列角色具備管理 Vertex AI 已佈建處理量的完整存取權:

  • roles/aiplatform.provisionedThroughputAdmin:您可以存取 Vertex AI 已佈建處理量的資源。

這個角色具備下列權限:

權限 說明
aiplatform.googleapis.com/provisionedThroughputs.create 提交新的預留傳送量訂單。
aiplatform.googleapis.com/provisionedThroughputs.get 查看特定「佈建的處理量」訂單。
aiplatform.googleapis.com/provisionedThroughputs.list 查看所有佈建輸送量訂單。
aiplatform.googleapis.com/provisionedThroughputs.update 修改佈建的處理量訂單。
aiplatform.googleapis.com/provisionedThroughputs.cancel 取消待處理的訂單或待處理的更新。

下單訂購已佈建的處理量

部分 Imagen 功能可能未對外公開。詳情請參閱「受限制的 GA 和預覽功能」。

如要使用 MedLM-large-1.5,請先與 Google Cloud 客戶服務代表聯絡,申請使用權限。

如果預期 QPM 會超過 30,000 項,為確保佈建輸送量訂單發揮最大效益,請使用下列資訊,申請調高預設 Vertex AI 系統配額:

  • 服務:Vertex AI API。
  • Name (名稱):Online prediction requests per minute per region
  • 服務類型:配額。
  • 維度:您訂購佈建輸送量時的所在區域。
  • :您選擇的線上預測流量上限。

系統會根據訂單大小和可用運算資源,處理佈建的處理量訂單。視您要求的 GSU 數量和可用容量而定,訂單處理時間可能需要幾分鐘到幾週不等。

如要購買已配置的傳輸量,請按照下列步驟操作:

控制台

  1. 在 Google Cloud 控制台中,前往「已配置的傳送量」頁面。

    前往「已佈建的處理量」

  2. 如要開始新訂單,請按一下「新訂單」
  3. 輸入訂單名稱
  4. 選取「Model」
  5. 選取「區域」
  6. 輸入您必須購買的生成式 AI 擴充單元 (GSU) 數量

    選用步驟:您可以使用生成式 AI 擴充單元預估工具,預估所需的 GSU 數量。如要使用這項工具,請按照下列步驟操作:

    1. 按一下「估算工具」
    2. 選取模型
    3. 根據所選模型輸入詳細資料,以估算所需的 GSU 數量。

      • 針對 Gemini 2.5 型號,請輸入以下內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入文字詞元數
        • 每項查詢的輸入圖像詞元數
        • 各查詢的輸入影片詞元數
        • 每項查詢的輸入音訊詞元數
        • 每項查詢的輸出回覆文字符號
        • 每項查詢的輸出推論文字詞元數
      • 如果是 Gemini 2.5 Flash 搭配 Live API 模型,請輸入以下內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入符記數
        • 每項查詢的輸入音訊詞元數
        • 每項查詢的輸入影片詞元數
        • 每項查詢的輸入工作階段記憶體符記
        • 每項查詢的輸出文字符號
        • 每項查詢的輸出音訊符記
      • 如要使用 Gemini 2.5 Flash-Lite (預先發布版) 模型,請輸入以下內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入文字詞元數
        • 每項查詢的輸入圖像詞元數
        • 各查詢的輸入影片詞元數
        • 每項查詢的輸入音訊詞元數
        • 每項查詢的輸出文字符號
      • 針對 Gemini 2.0 模型,請輸入以下內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入符記數
        • 每項查詢的輸入圖像詞元數
        • 各查詢的輸入影片詞元數
        • 每項查詢的輸入音訊詞元數
        • 每項查詢的輸出文字符號
      • 針對 Imagen 模型,請輸入以下內容:

        • 每秒查詢次數
        • 每項查詢的輸出圖片數
    4. 如果您想使用在估算工具中輸入的值,請按一下「使用計算值」

  7. 選取「Term」。可用的選項如下:

    • 1 週
    • 1 個月
    • 3 個月
    • 1 年
  8. 選用步驟:選取學期的開始日期和時間 (預覽)。

    您可以提供開始日期和時間,時間範圍為下單後的兩週內。如果未指定開始日期和時間,系統會在可用容量出現時立即處理訂單。系統會盡力按照所要求的開始日期與時間處理訂單。如果訂單狀態未設為「已核准」,系統不會保證會在指定日期前完成訂單。

    如果您要求的開始日期與目前日期過於接近,訂單可能會在您要求的開始日期後才核准並啟用。在這種情況下,系統會根據所選期限的時間長度調整結束日期,並從啟用日期開始計算。如要瞭解如何取消待處理的訂單,請參閱「變更已佈建的吞吐量訂單」。

  9. 在「續訂」清單中,指定是否要在約期結束時自動續訂訂單。如要指定續訂選項,您必須將期限設為「1 個月」、「3 個月」或「1 年」

  10. 按一下「繼續」

  11. 在「摘要」部分,查看訂單的價格和預估吞吐量。請詳閱表單中列出的條款和連結。

  12. 如要完成訂單,請按一下「確認」

    視訂單大小和可用容量而定,處理訂單可能需要幾分鐘到幾週的時間。處理完訂單後, Google Cloud 控制台中的狀態會變更為「有效」。訂單生效後,我們才會向您收取費用。

變更「已佈建的處理量」訂單

本表說明如何根據訂單狀態和任何現有條件,透過 Google Cloud 控制台修改預先配置傳送量訂單。修改訂單是預覽功能,僅適用於透過控制台下單的線上訂單。如要變更離線訂單,請與Google Cloud 帳戶代表聯絡,尋求協助。

此外,使用 Google Cloud 資訊主頁對模型或模型版本所做的變更,會修改現有訂單,同時保留相同的訂閱結束日期。

訂單狀態 動作 注意事項 Google Cloud 控制台中的步驟
待審查 你可以取消訂單。

如需變更其他訂單項目,請取消待處理的訂單,然後重新下單。

如果您有多個模型,每個模型一次只能有一個待訂單修訂或待訂單。

如要在 Google Cloud 控制台中取消待處理的訂單,請按照下列步驟操作:
  1. 前往「已佈建的輸送量」頁面
  2. 選取待處理訂單所在的地區
  3. 如要前往「訂單詳細資料」頁面,請按一下要取消的訂單的「訂單 ID」
  4. 按一下「取消」
  5. 在「Are you sure you want to cancel the order?」對話方塊中,按一下「Cancel Order」
已核准 你無法修改訂單。 訂單正在等待啟用。 你目前無法變更訂單。 不適用
已啟用 只有在訂單在接下來五天內未到期或自動續訂的情況下,才能執行下列操作:
  • 您可以為現有訂單增加 GSU。
  • 您可以啟用或停用自動續約功能。
  • 您可以變更模型或模型版本。
如果有效訂單的到期日不到五天,且未設定自動續約,您就無法變更該訂單。 如要在 Google Cloud 控制台中變更有效訂單,請使用下列其中一種方法:
  • 在「已配置的傳送量」頁面中,按一下「動作」欄中的符號,然後點選「編輯」
  • 在「訂單詳細資料」頁面中,按一下「編輯」按鈕。

檢查訂單狀態

提交預先配置傳送量訂單後,訂單狀態可能會顯示為下列任一狀態:

  • 待審查:你已下單。由於核准結果取決於可用容量是否足以配置訂單,因此您的訂單仍在等待審查及核准。如要進一步瞭解待處理訂單的狀態,請與 Google Cloud 帳戶代表聯絡
  • 已核准:Google 已核准您的訂單,訂單正在等待啟用。訂單核准後,你就無法進行變更。
  • 已啟用:Google 已啟用訂單,並開始計費。
  • 已過期:您的訂單已過期。

查看已佈建輸送量訂單

如要查看預留傳送量訂單,請按照下列步驟操作:

控制台

  1. 在 Google Cloud 控制台中,前往「已配置的傳送量」頁面。

    前往「已佈建的處理量」

  2. 選取「區域」。系統會顯示訂單清單。

後續步驟