配額與限制

本文列出 Gemini for Google Cloud適用的配額和系統限制。

  • 配額會指定您可使用的可計數共用資源數量。配額是由 Google Cloud 服務定義,例如 Gemini for Google Cloud。
  • 系統限制是無法變更的固定值。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

Gemini 資源也有系統限制。 系統限制無法變更。

每秒要求數

Gemini for Google Cloud 會對專案中每位使用者的每秒要求數強制執行配額。

配額
每秒要求數 2

每日要求數

Gemini for Google Cloud 會為專案中每位使用者每天的要求總數設下配額。

配額
Gemini Code Assist 或 Gemini in BigQuery 程式碼要求 (例如程式碼生成和程式碼補全) 的每日要求數。 6000
每天可發出的要求次數上限,適用於在 Google Cloud 控制台和 IDE 的「Cloud Assist」面板中顯示回覆的聊天、視覺化、資料洞察表格掃描、中繼資料產生、資料準備和其他要求。 960

Gemini Code Assist 配額

Gemini Code Assist 會對特定功能強制執行配額。

配額
本機程式碼集認知 128,000 個詞元的脈絡窗口
程式碼自訂存放區 20,000

代理程式模式和 Gemini CLI 的配額

Gemini Code Assist 代理程式模式和 Gemini CLI 的要求配額會合併計算。在代理程式模式下或使用 Gemini CLI 時,一個提示可能會產生多個要求。

配額 Gemini Code Assist 版本
每位使用者每分鐘的要求數 標準 120
Enterprise 120
每位使用者每日的要求數 標準 1500
Enterprise 2000

Gemini in BigQuery 的配額

程式碼輔助功能方面,Gemini Code Assist 和 Gemini in BigQuery 程式碼要求 (例如程式碼完成和程式碼生成) 的配額相同。

如果客戶使用 Gemini in BigQuery,並搭配 BigQuery 隨選運算或 Enterprise/Enterprise Plus 版,系統會根據上一個完整日曆月的每日平均掃描 TiB 數或時段時數,提供資料洞察等進階功能配額。這項配額適用於機構層級,且該機構中的所有專案都能使用。配額會無條件進位至最接近的 100 個時段小時用量。

每 100 個時段小時的配額 (Enterprise 或 Enterprise Plus 版每日平均用量),或使用隨選運算模型掃描的每 TiB 配額
在 Google Cloud 控制台的「Cloud Assist」面板中顯示回覆的聊天、視覺化、表格掃描和其他要求,每日要求次數。 5

示例:假設某機構預訂了 Enterprise 版本,並以 100 個運算單元做為基準,則每天平均會使用 2,400 個運算單元小時 (100 個運算單元 * 24 小時 = 2,400 個運算單元小時)。因此,他們在下個月會獲得下列每日配額:

  • 每天 120 次的對話、視覺化、資料洞察資料表掃描和自動中繼資料生成

如果貴機構目前尚未購買任何 BigQuery Enterprise 版、Enterprise Plus 版運算單元或隨選運算 (TiB),首次使用後,您會在第一個完整曆月收到下列預設配額:

  • 每天 250 次的對話、視覺化、資料洞察資料表掃描和自動產生中繼資料

如果您在當月開始使用隨選運算資源、Enterprise 版或 Enterprise Plus 版預留項目,則預設配額會套用至下個月底。

申請提高配額

如要調整大部分配額,請使用 Google Cloud 控制台。 詳情請參閱「要求調整配額」。