這份文件列出 AI 應用程式適用的配額和系統限制。
- 配額會指定您可使用的可計數共用資源數量。配額是由 Google Cloud AI 應用程式等服務定義。
- 系統限制是無法變更的固定值。
Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。
Cloud Quotas 系統會執行下列操作:
在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。
配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。
AI 應用程式資源也有系統限制。 系統限制無法變更。
分配配額
下列配額不會隨時間重設。而是會在您釋放資源時釋出。如果預設配額不足,您可以申請提高配額。
配額 | 值 |
---|---|
每項專案的文件數 | 10,000,000 |
每個專案的資料存放區數量 | 100* |
每項專案的引擎數量 | 150† |
每項專案待處理的匯入長時間執行作業數 | 300 |
每個專案待處理的清除文件長時間執行作業數量 | 100 |
每項專案的放送控制項數量 | 1,000 |
每個供應設定的升幅供應控制項數量 | 100 |
每個放送設定的篩選器放送控制項數量 | 100 |
每個供應設定的重新導向供應控管機制數量 | 100 |
每個服務設定的同義字服務控制項數量 | 100 |
每項專案的使用者事件數 | 40,000,000,000 |
每個專案在每個位置的資料儲存區數量 (全球或 global ) |
100 |
歐盟多區域或 eu 的每個專案每個位置的資料儲存空間區域數量 |
100 |
每個專案在美國多區域或 us 的每個位置,可擁有的資料儲存區數量 |
100 |
每個專案在每個位置的區域文件數量 (適用於 Global 或 global ) |
10,000,000 |
歐盟多區域或 eu 每個專案每個位置的區域文件數量 |
10,000,000 |
美國多區域或 us 的每個專案每個位置的文件數量上限 |
10,000,000 |
每個專案在每個位置的引擎區域數量 (適用於全球或 global ) |
150 |
歐盟多地區或 eu 的每個專案每個位置的引擎數量上限 |
150 |
美國多區域或 us 的每個專案每個位置引擎數量上限 |
150 |
全球或global 每項專案每個位置的區域使用者事件數 |
40,000,000,000 |
歐盟多區域或 eu 的每個專案和位置,使用者事件的區域數量 |
40,000,000,000 |
美國多區域或 us 中,每個專案在每個位置的使用者事件區域數 |
40,000,000,000 |
* 由於技術限制,每個專案的資料儲存庫配額上限為 500。如需更多資料儲存庫,請使用新專案。
† 由於技術限制,每個專案的引擎配額上限為 500 個。如需更多引擎,請使用新專案。
要求配額
下列配額適用於 AI Applications API 要求。如果預設配額不足,可以要求增加配額。
配額 | 值 |
---|---|
每項專案每分鐘的完整查詢要求數 | 300 |
每項專案每分鐘的對話式搜尋讀取要求數 | 300 |
每項專案每分鐘的對話式搜尋寫入要求數 | 300 |
每項專案每分鐘的文件批次要求 (例如內嵌匯入和清除) | 100 |
每項專案每分鐘的文件非同步匯入 (Cloud Storage、BigQuery 等) 要求數 | 5 |
每項專案每分鐘的文件清除要求數 | 100 |
每項專案每分鐘的文件讀取要求數 | 300 |
每項專案每分鐘的文件寫入要求數 | 12,000 |
每項專案每日的評估建立要求數 | 5 |
每項專案每分鐘的評估讀取要求數 | 100 |
每項專案每分鐘的評估寫入要求數 | 100 |
每項專案每分鐘的 LLM 查詢要求數 (搜尋摘要、多輪搜尋) | 60 |
每分鐘待處理的 FHIR 或 BigQuery 串流寫入次數 | 6,000 |
每個專案的範例查詢集數量 | 100 |
每項專案每分鐘的 Ranking API 要求數 | 500 |
每項專案每分鐘的建議要求數 | 60,000 |
每項專案每分鐘的查詢讀取要求數範例 | 200 |
每項專案每分鐘的樣本查詢集讀取要求數 | 100 |
每項專案每分鐘的樣本查詢集寫入要求數 | 100 |
每項專案每分鐘的查詢寫入要求數範例 | 200 |
每項專案每分鐘的結構定義讀取要求數 | 100 |
每項專案每分鐘的結構定義寫入要求數 | 100 |
每項專案每分鐘的搜尋要求數 | 300 |
每項專案每分鐘的使用者事件批次要求 (例如匯入和清除) | 100 |
每位使用者每分鐘每項專案的使用者事件收集要求數 | 240 |
每項專案每分鐘的使用者事件寫入要求數 | 60,000 |
網頁索引配額
如果資料儲存庫已啟用進階網站索引建立功能,您建立索引的每個網頁都會計入「每個專案的文件數量」配額,並顯示在「配額分配」清單中。您也可以在資料商店的「資料」頁面中,查看專案中的頁面數量,以及該專案的頁面配額。方法是查看「專案頁面與配額」欄位。
如果您在專案的資料存放區中新增網站,且這些網站中的網頁超出專案配額,系統就不會為這些網站建立索引。如果資料儲存庫中已有建立索引的網站,這些網站會繼續照常建立索引。您可以隨時要求提高配額。
申請提高配額
如要調整大部分配額,請使用 Google Cloud 控制台。 詳情請參閱「要求調整配額」。