配额

本文档列出了适用于 Document AI 的配额和系统限制。

  • 配额具有默认值,但您通常可以申请调整。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

本文档列出了适用于 Document AI 的配额。

服务层级

Document AI 支持两种服务层级,并为向依托生成式 AI 技术的处理器版本发送的在线处理请求提供相关联的配额:预配层级和尽力而为层级。

预配层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供每分钟 120 页的配额,为基本处理器版本(例如自定义提取器 v1.5 Pro)提供每分钟 30 页的配额。

尽力而为层级配额为基本处理器版本(例如自定义提取器 v1.4 和 v1.5)提供 120 个配额,为 Pro 处理器版本(例如自定义提取器 v1.5 Pro)提供 60 个配额,并且仅在已用完预配的配额后使用。这适用于控制台中的配额 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS(指标 best_effort_online_process_document_pages_us)和 BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU(指标 best_effort_online_process_document_pages_eu)。

备注 自定义提取器 v1.4(基于 Gemini 2.0 Flash) 自定义提取器 v1.5(基于 Gemini 2.5 Flash) 自定义提取器 v1.5 Pro(基于 Gemini 2.5 Pro)
已预配 120 120 30
尽力而为 120 120 60
组织级已配置 240 240 60

如果您需要的配额超出尽力型配额中列出的数量,可以与销售团队代表联系,提出配额增加申请 (QIR)。

如需在高流量期间确保有更多可用容量,请参阅有关如何提出容量预留请求的部分。

尽力而为层级没有服务等级协议

配额列表

以下配额适用于 Document AI。 这些配额适用于每个 Google Cloud 控制台项目,并由使用该项目的所有应用和 IP 地址共享。

如果您想处理更多请求,请在 Google Cloud 控制台中为您的项目提交 Document AI 配额申请。

在请求中提供有关您的具体需求和使用情形的信息。

请求配额 默认值 备注
每分钟请求数 每位用户 1800 个 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(仅限 v1beta2) 每个项目 600 个 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(美国) 每个项目每种处理器类型 120 次 在 Google Cloud 控制台中查看配额
每分钟的在线流程请求数(欧盟) 每个项目每种处理器类型 120 次 在 Google Cloud 控制台中查看配额
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.0 Flash 的自定义提取器 v1.4) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟的在线处理文档页数(美国),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟在线处理的文档页数(欧盟),按处理器类型和模型版本(仅限使用 Gemini 2.5 Flash 的自定义提取器 v1.5) 每分钟 120 页* 在 Google Cloud 控制台中查看配额
每分钟的在线处理请求数(单个区域) 每个项目每种处理器类型 6 个 在 Google Cloud 控制台中查看配额
每个项目和区域(美国)的并发批处理请求数 每个项目 5 个 在 Google Cloud 控制台中查看配额
每个项目和区域的并发批量处理请求数(欧盟) 每个项目 5 个 在 Google Cloud 控制台中查看配额
每个处理器的并发批处理请求数(单区域) 每个项目 5 个 在 Google Cloud 控制台中查看配额
处理中的页面数(仅限 v1beta2) 每个项目 10,000 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(美国) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(欧盟) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发处理器版本训练请求数(单区域) 每个项目 1 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本(美国) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本 (欧盟) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的自定义处理器版本(单区域) 每个项目 5 个 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本(美国) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本 (EU) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
已部署的生成式处理器版本(单区域) 每个项目每个自定义提取处理器 100 次 在 Google Cloud 控制台中查看配额
并发导入文档请求数(美国) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导入文档请求数(欧盟) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导入文档请求数(单个区域) 每个项目 3 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(美国) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(欧盟) 每个项目 1 个 在 Google Cloud 控制台中查看配额
并发导出文档请求数(单个区域) 每个项目 1 个 在 Google Cloud 控制台中查看配额

* 此版本尚不支持配额调整请求。

australia-southeast1 中受支持,但需要提交配额调整申请。

提出容量预留请求

Document AI 容量预留功能可提供预留容量,以便在订阅期内处理实时、大容量的预测流量,从而帮助满足服务等级协议 (SLA) 要求。每个单位对应于超出默认配额的每分钟页数。

容量预留功能受支持,并且是提高自定义提取器模型(包括基于这些模型构建的微调处理器版本)v1.4 和 v1.5 的预配层级配额所必需的。

容量预留的定价为每分钟每页每月 300 美元。

如需发出容量预留请求,请执行以下操作:

控制台

  1. 在 Google Cloud 控制台中,依次前往 IAM 和管理 > 容量预留页面:

    容量预留

  2. 点击页面标题附近的 Create new capacity reservation(创建新的容量预留)按钮。系统会将您转到一份包含两页的申请表单。

  3. 配置页面上填写以下内容:

    1. 填写订单名称。
    2. 选择区域。
    3. 从下拉菜单中选择处理器版本。
    4. 写下每月每分钟所需的额外页面数。
    5. 选择按月订阅期。
    6. 选择开始日期和时间。
    7. 从下拉菜单中选择自动续订选项。
  4. 点击继续

  5. 在第二页上,您会看到每月估算费用。您必须输入 CONFIRM 才能验证购买交易。

  6. 点击确认并提交以确认订单。

您可以在容量预留标签页中查看请求状态。

可能的状态有三种:

  • 无效:订阅尚未开始。
  • 有效:订阅正在进行中。
  • 已完成:订阅已结束。

购买容量预留之前要考虑的事项

在决定是否要购买容量预留时,请考虑以下事项:

  • 您无法在订阅期内取消订阅。

    容量预留购买交易属于承诺,这意味着您无法在订阅期内取消订单。不过,您可以增加购买的 GSU 数量。如果您无意中购买了承诺,或者配置出现问题,请与您的 Google Cloud 客户代表联系以获取帮助。

  • 您可以自动续订订阅

    提交订单时,您可以选择在订阅期结束时自动续订订阅,也可以让订阅到期。您可以取消自动续订流程。如需在自动续订前取消订阅,请在下一个订阅期开始前 30 天取消自动续订。

    您可以将按月订阅配置为每月自动续订。 按周订阅期不支持自动续期。