本文档列出了适用于 Document AI 的配额和系统限制。
- 配额具有默认值,但您通常可以申请调整。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
本文档列出了适用于 Document AI 的配额。
服务层级
Document AI 支持两种服务层级,并为向依托生成式 AI 技术的处理器版本发送的在线处理请求提供相关联的配额:预配层级和尽力而为层级。
预配层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供每分钟 120 页的配额,为基本处理器版本(例如自定义提取器 v1.5 Pro)提供每分钟 30 页的配额。
尽力而为层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供 120 个配额,为 Pro 处理器版本(例如自定义提取器 v1.5 Pro)提供 60 个配额,并且仅在已用完预配的配额后使用。这适用于控制台中的配额 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(指标 best_effort_online_process_document_pages_us
)和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(指标 best_effort_online_process_document_pages_eu
)。
备注 | 自定义提取器 v1.4(基于 Gemini 2.0 Flash) | 自定义提取器 v1.5(基于 Gemini 2.5 Flash) | 自定义提取器 v1.5 Pro(基于 Gemini 2.5 Pro) |
---|---|---|---|
已预配 | 120 | 120 | 30 |
尽力而为 | 120 | 120 | 60 |
组织级已配置 | 240 | 240 | 60 |
如果您需要的配额超出尽力型配额中列出的数量,可以与销售团队代表联系,提出配额增加申请 (QIR)。
如需在高流量期间确保有更多可用容量,请参阅有关如何提出容量预留请求的部分。
尽力而为层级没有服务等级协议。
配额列表
以下配额适用于 Document AI。 这些配额适用于每个 Google Cloud 控制台项目,并由使用该项目的所有应用和 IP 地址共享。
如果您想处理更多请求,请在 Google Cloud 控制台中为您的项目提交 Document AI 配额申请。
在请求中提供有关您的具体需求和使用情形的信息。
请求配额 | 默认值 | 备注 |
---|---|---|
每分钟请求数 | 每位用户 1800 个 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(仅限 v1beta2) | 每个项目 600 个 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(美国) | 每个项目每种处理器类型 120 次 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线流程请求数(欧盟) | 每个项目每种处理器类型 120 次 | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) | 每分钟 120 页* | 在 Google Cloud 控制台中查看配额 |
每分钟的在线处理请求数(单个区域) | 每个项目每种处理器类型 6 个 | 在 Google Cloud 控制台中查看配额 |
每个项目和区域(美国)的并发批处理请求数 | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
每个项目和区域的并发批量处理请求数(欧盟) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
每个处理器的并发批处理请求数(单区域) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
处理中的页面数(仅限 v1beta2) | 每个项目 10,000 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(美国) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(欧盟) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发处理器版本训练请求数(单区域) | 每个项目 1 个† | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本(美国) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本 (欧盟) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的自定义处理器版本(单区域) | 每个项目 5 个 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本(美国) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本 (EU) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
已部署的生成式处理器版本(单区域) | 每个项目每个自定义提取处理器 100 次 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(美国) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(欧盟) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导入文档请求数(单个区域) | 每个项目 3 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(美国) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(欧盟) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
并发导出文档请求数(单个区域) | 每个项目 1 个 | 在 Google Cloud 控制台中查看配额 |
* 此版本尚不支持配额调整请求。
† 在 australia-southeast1
中受支持,但需要提交配额调整申请。
提出容量预留请求
Document AI 容量预留功能可提供预留容量,以便在订阅期内处理实时、大容量的预测流量,从而帮助满足服务等级协议 (SLA) 要求。每个单位对应于超出默认配额的每分钟页数。
容量预留功能受支持,并且是提高自定义提取器模型(包括基于这些模型构建的微调处理器版本)v1.4 和 v1.5 的预配层级配额所必需的。
容量预留的定价为每分钟每页每月 300 美元。
如需发出容量预留请求,请执行以下操作:
控制台
在 Google Cloud 控制台中,依次前往 IAM 和管理 > 容量预留页面:
点击页面标题附近的 Create new capacity reservation(创建新的容量预留)按钮。系统会将您转到一份包含两页的申请表单。
在配置页面上填写以下内容:
- 填写订单名称。
- 选择区域。
- 从下拉菜单中选择处理器版本。
- 写下每月每分钟所需的额外页面数。
- 选择按月订阅期。
- 选择开始日期和时间。
- 从下拉菜单中选择自动续订选项。
点击继续。
在第二页上,您会看到每月估算费用。您必须输入 CONFIRM 才能验证购买交易。
点击确认并提交以确认订单。
您可以在容量预留标签页中查看请求状态。
可能的状态有三种:
- 无效:订阅尚未开始。
- 有效:订阅正在进行中。
- 已完成:订阅已结束。
购买容量预留之前要考虑的事项
在决定是否要购买容量预留时,请考虑以下事项:
您无法在订阅期内取消订阅。
容量预留购买交易属于承诺,这意味着您无法在订阅期内取消订单。不过,您可以增加购买的 GSU 数量。如果您无意中购买了承诺,或者配置出现问题,请与您的 Google Cloud 客户代表联系以获取帮助。
您可以自动续订订阅。
提交订单时,您可以选择在订阅期结束时自动续订订阅,也可以让订阅到期。您可以取消自动续订流程。如需在自动续订前取消订阅,请在下一个订阅期开始前 30 天取消自动续订。
您可以将按月订阅配置为每月自动续订。 按周订阅期不支持自动续期。