本文列出 Document AI 適用的配額和系統限制。
- 配額會指定您可使用的可計數共用資源數量。配額是由 Google Cloud 服務定義,例如 Document AI。
- 系統限制是固定值,無法變更。
Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性突然暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。
Cloud Quotas 系統會執行下列操作:
在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。
配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。
本文列出 Document AI 適用的配額。
服務級別
Document AI 支援兩種服務層級,以及與線上處理要求相關的配額,可供生成式 AI 處理器版本使用:已佈建和盡力服務層級。
在佈建層級,基本處理器版本 (例如自訂擷取器 v1.4 和 v1.5) 的配額為每分鐘 120 頁,基本處理器版本 (例如自訂擷取器 v1.5 Pro) 的配額為每分鐘 30 頁。
盡力服務層級配額為基本處理器版本提供 120 個配額,例如自訂擷取器 v1.4 和 v1.5;為 Pro 處理器版本提供 60 個配額,例如自訂擷取器 v1.5 Pro。只有在已用盡佈建配額時,才會使用盡力服務層級配額。這項功能適用於控制台中的配額 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(指標 best_effort_online_process_document_pages_us
) 和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(指標 best_effort_online_process_document_pages_eu
)。
附註 | 自訂擷取器 1.4 版 (以 Gemini 2.0 Flash 為基礎) | 自訂擷取器 1.5 版 (以 Gemini 2.5 Flash 為基礎) | 自訂擷取器 1.5 Pro 版 (以 Gemini 2.5 Pro 為基礎) |
---|---|---|---|
已佈建 | 120 | 120 | 30 |
盡可能取得容量 | 120 | 120 | 60 |
機構層級佈建 | 240 | 240 | 60 |
如果需要超過盡可能清除重複配額所列的數量,請與銷售團隊代表聯絡,提出配額增加要求 (QIR)。
最佳盡力服務層級不適用服務水準協議。
配額清單
Document AI 適用下列配額規定。 每項 Google Cloud 控制台專案都會受到這些配額規定的限制,且使用同一項專案的所有應用程式和 IP 位址會共用這些配額。
如要處理更多要求,請在Google Cloud 控制台中,針對您的專案提交 Document AI 配額要求。
在要求中提供您的具體需求和用途資訊。
要求配額 | 預設值 | 附註 |
---|---|---|
每分鐘要求數 | 每位使用者 1,800 個 | 在 Google Cloud 控制台中查看配額 |
每分鐘線上處理要求數 (僅限 v1beta2) | 每項專案 600 個 | 在 Google Cloud 控制台中查看配額 |
每分鐘線上處理要求數 (美國) | 每項專案每種處理器類型 120 個 | 在 Google Cloud 控制台中查看配額 |
每分鐘線上處理要求數 (歐盟) | 每項專案每種處理器類型 120 個 | 在 Google Cloud 控制台中查看配額 |
每分鐘每個處理器類型和模型版本 (僅限使用 Gemini 2.0 Flash 的 Custom Extractor v1.4) 的線上處理文件頁數 (美國) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
每分鐘每個處理器類型和模型版本 (僅限使用 Gemini 2.0 Flash 的 Custom Extractor v1.4) 的線上處理文件頁數 (歐盟) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
每分鐘的線上處理文件頁數 (美國),依處理器類型和模型版本計算 (僅限使用 Gemini 2.5 Flash 的 Custom Extractor v1.5) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
每分鐘處理的線上文件頁數 (歐盟),依處理器類型和模型版本計算 (僅限使用 Gemini 2.5 Flash 的 Custom Extractor v1.5) | 每分鐘 120 頁* | 在 Google Cloud 控制台中查看配額 |
每分鐘線上處理要求數 (單一區域) | 每種處理器類型每項專案 6 個 | 在 Google Cloud 控制台中查看配額 |
每個專案和區域的並行批次處理要求數 (美國) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
每個專案和區域 (歐盟) 的並行批次處理要求數 | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
每個處理器的並行批次處理要求數 (單一地區) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
有效處理的頁數 (僅限 v1beta2) | 每項專案 10,000 個 | 在 Google Cloud 控制台中查看配額 |
並行處理器版本訓練要求數 (美國) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
並行處理器版本訓練要求數 (歐盟) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
並行處理器版本訓練要求 (單一區域) | 每項專案 1 個† | 在 Google Cloud 控制台中查看配額 |
已部署的自訂處理器版本 (美國) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
已部署的自訂處理器版本 (歐盟) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
已部署的自訂處理器版本 (單一區域) | 每項專案 5 個 | 在 Google Cloud 控制台中查看配額 |
已部署的生成式處理器版本 (美國) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
已部署的生成式處理器版本 (歐盟) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
已部署的生成式處理器版本 (單一區域) | 每項專案每個自訂擷取處理器 100 個 | 在 Google Cloud 控制台中查看配額 |
並行匯入文件要求 (美國) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
並行匯入文件要求 (歐盟) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
並行匯入文件要求 (單一區域) | 每項專案 3 個 | 在 Google Cloud 控制台中查看配額 |
並行匯出文件要求 (美國) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
並行匯出文件要求 (歐盟) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
並行匯出文件要求 (單一區域) | 每項專案 1 個 | 在 Google Cloud 控制台中查看配額 |
* 這個版本目前不支援配額調整要求。
† 支援透過 australia-southeast1
申請調整配額。