本文档列出了适用于 AI 应用的配额和系统限制。
- 配额用于指定您可以使用的可计数共享资源的数量。配额由 AI Applications 等 Google Cloud 服务定义。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
AI Applications 资源也有系统限制。系统限制不能更改。
分配配额
以下配额不会在一段时间后重置。而是在您释放资源时释放。如果默认配额不够用,您可以申请增加配额。
配额 | 值 |
---|---|
每个项目的文档数量 | 1000 万 |
每个项目的数据存储区数量 | 100* |
每个项目的引擎数量 | 150† |
每个项目的待处理导入长时间运行的操作数 | 300 |
每个项目待处理的“清除文档”长时间运行的操作数 | 100 |
每个项目的服务控制变量数量 | 1000 |
每个投放配置的加推投放控制变量数量 | 100 |
每个服务配置的过滤服务控制变量数量 | 100 |
每个服务配置的重定向服务控制变量数量 | 100 |
每个服务配置的同义词服务控制变量数量 | 100 |
每个项目的用户事件数 | 400 亿 |
每个项目每个位置(对于全球或 global )的区域数据存储区数量 |
100 |
欧盟多区域或 eu 的每个项目每个位置的区域数据存储区数量 |
100 |
美国多区域或 us 的每个项目每个位置的区域数据存储区数量 |
100 |
全球或 global 的每个项目每个位置的区域级文档数量 |
1000 万 |
欧盟多区域或 eu 中每个项目每个位置的区域级文档数量 |
1000 万 |
美国多区域或 us 中每个位置的每个项目的区域级文档数量 |
1000 万 |
对于全局或 global ,每个位置每个项目的区域引擎数量 |
150 |
欧盟多区域或 eu 中每个位置每个项目的区域级引擎数量 |
150 |
美国多区域或 us 中每个位置每个项目的区域级引擎数量 |
150 |
全球或 global |
400 亿 |
对于欧盟多区域或 eu ,每个项目每个位置的区域级用户事件数 |
400 亿 |
美国多区域或 us 的每个项目每个位置的区域级用户事件数 |
400 亿 |
* 由于存在技术限制,每个项目的数据存储区配额上限为 500。如果您需要更多数据存储区,请使用新项目。
† 由于技术限制,每个项目的引擎配额上限为 500。如果您需要更多引擎,请使用新项目。
请求配额
以下配额适用于 AI Applications API 请求。如果默认配额不够用,您可以申请增加配额。
配额 | 值 |
---|---|
每个项目每分钟的完整查询请求数 | 300 |
每个项目每分钟的对话式搜索读取请求数 | 300 |
每个项目每分钟的对话式搜索写入请求数 | 300 |
每个项目每分钟的文档批量请求(例如内嵌导入和清除)数 | 100 |
每个项目每分钟的文档异步导入(Cloud Storage、BigQuery 等)请求数 | 5 |
每个项目每分钟的文档清除请求数 | 100 |
每个项目每分钟的文档读取请求数 | 300 |
每个项目每分钟的文档写入请求数 | 12000 |
每个项目每天的评估创建请求数 | 5 |
每个项目每分钟的评估读取请求数 | 100 |
每个项目每分钟的评估写入请求数 | 100 |
每个项目每分钟的 LLM 查询请求数(搜索总结、多轮搜索) | 60 |
每分钟待处理的 FHIR 或 BigQuery 流式写入次数 | 6000 |
每个项目的示例查询集数量 | 100 |
每项目每分钟的排名 API 请求数 | 500 |
每个项目每分钟的推荐请求数 | 60000 |
每个项目每分钟的抽样查询读取请求数 | 200 |
每个项目每分钟的示例查询集读取请求数 | 100 |
每个项目每分钟的示例查询集写入请求数 | 100 |
每个项目每分钟的示例查询写入请求数 | 200 |
每个项目每分钟的架构读取请求数 | 100 |
每个项目每分钟的架构写入请求数 | 100 |
每个项目每分钟的搜索请求数 | 300 |
每个项目每分钟的用户事件批量请求(例如导入和清除)数 | 100 |
每位用户每个项目每分钟的用户事件收集请求数 | 240 |
每个项目每分钟的用户事件写入请求数 | 60000 |
网页索引编制的配额
如果您的数据存储区启用了高级网站索引功能,那么您索引的每个网页都会计入分配配额列表中的“每个项目的文档数量”配额。您还可以在数据存储区的数据页面中,通过项目网页数与配额字段查看项目中的网页数量以及该项目的网页配额。
如果您将网站添加到项目中的数据存储区,并且这些网站中的网页数量超过了项目的配额,则系统不会为这些网站编制索引。如果您的数据存储区中包含已编入索引的网站,这些网站将继续像以前一样编入索引。您可以随时申请升级配额。
申请增加配额
如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整。