本文档列出了适用于 Gemini for Google Cloud 的配额和系统限制。
- 配额用于指定您可以使用的可计数共享资源的数量。配额由 Gemini for Google Cloud 等 Google Cloud 服务定义。
- 系统限制是无法更改的固定值。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
- 监控 Google Cloud 产品和服务的消耗情况
- 限制这些资源的消耗量
- 提供请求更改配额值的方法
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
Gemini 资源也有系统限制。系统限制不能更改。
每秒请求次数
Gemini for Google Cloud 会针对项目中每个用户每秒的请求数强制执行配额。
配额 | 值 |
---|---|
每秒请求次数 | 2 |
每日请求数
Gemini for Google Cloud 会针对项目中每位用户每天的请求总数强制执行配额。
配额 | 值 |
---|---|
Gemini Code Assist 或 BigQuery 中的 Gemini 代码请求(例如代码生成和代码补全)的每日请求次数。 | 6000 |
每天针对聊天、可视化、数据分析表扫描以及在 Google Cloud 控制台和 IDE 的 Gemini 窗格中显示回答的其他请求。 | 240 |
Gemini Code Assist 配额
Gemini Code Assist 会对某些功能强制执行配额。
配额 | 值 |
---|---|
本地代码库感知 | 128,000 个 token 的上下文窗口 |
代码自定义库 | 950 |
Gemini in BigQuery 的配额
对于将 Gemini in BigQuery 与 BigQuery 企业 Plus 版搭配使用的客户,我们会根据过去一个完整日历月的企业 Plus 版槽小时的每日平均使用量来提供配额。此配额适用于组织级别,可供该组织中分配了企业 Plus 版槽位的所有项目使用。配额会向上取整到最接近的 100 个槽小时用量。
每 100 个槽小时的配额(企业 Plus 版每日平均用量) | 值 |
---|---|
每天的代码补全请求数 | 150 |
每天的代码生成请求数 | 10 |
每天针对聊天、可视化、表扫描和其他在 Google Cloud 控制台的 Gemini 窗格中显示回答的请求。 | 5 |
示例:如果某个组织拥有以 100 个槽为基准的企业 Plus 版预留,则每天平均会使用 2,400 个槽小时(100 个槽 * 24 小时 = 2,400 个槽小时)。因此,在接下来的一个月内,他们将获得以下每日配额:
- 每天 3,600 个代码补全请求
- 每天 240 次代码生成请求
- 每天 120 次聊天、可视化和数据分析表扫描
如果贵组织到目前为止尚未购买任何 BigQuery 企业 Plus 版预订,那么在您购买企业 Plus 版预订后,您将在第一个完整日历月内获得以下默认配额:
- 每天 7,500 个代码补全请求
- 每天 500 次代码生成请求
- 每天 250 次聊天、可视化和数据洞察表扫描
如果您在月中开始使用企业 Plus 版预留功能,则默认配额将持续到次月月底。
申请增加配额
如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整。