配额和限制

本文档列出了适用于 Gemini for Google Cloud 的配额和系统限制。

  • 配额用于指定您可以使用的可计数共享资源的数量。配额由 Gemini for Google Cloud 等 Google Cloud 服务定义。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

  • 监控 Google Cloud 产品和服务的消耗情况
  • 限制这些资源的消耗量
  • 提供请求更改配额值的方法

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

Gemini 资源也有系统限制。系统限制不能更改。

每秒请求次数

Gemini for Google Cloud 会针对项目中每个用户每秒的请求数强制执行配额。

配额
每秒请求次数 2

每日请求数

Gemini for Google Cloud 会针对项目中每位用户每天的请求总数强制执行配额。

配额
Gemini Code Assist 或 BigQuery 中的 Gemini 代码请求(例如代码生成和代码补全)的每日请求次数。 6000
每天针对聊天、可视化、数据分析表扫描以及在 Google Cloud 控制台和 IDE 的 Gemini 窗格中显示回答的其他请求。 240

Gemini Code Assist 配额

Gemini Code Assist 会对某些功能强制执行配额。

配额
本地代码库感知 128,000 个 token 的上下文窗口
代码自定义库 950

Gemini in BigQuery 的配额

对于将 Gemini in BigQuery 与 BigQuery 企业 Plus 版搭配使用的客户,我们会根据过去一个完整日历月的企业 Plus 版槽小时的每日平均使用量来提供配额。此配额适用于组织级别,可供该组织中分配了企业 Plus 版槽位的所有项目使用。配额会向上取整到最接近的 100 个槽小时用量。

每 100 个槽小时的配额(企业 Plus 版每日平均用量)
每天的代码补全请求数 150
每天的代码生成请求数 10
每天针对聊天、可视化、表扫描和其他在 Google Cloud 控制台的 Gemini 窗格中显示回答的请求。 5

示例:如果某个组织拥有以 100 个槽为基准的企业 Plus 版预留,则每天平均会使用 2,400 个槽小时(100 个槽 * 24 小时 = 2,400 个槽小时)。因此,在接下来的一个月内,他们将获得以下每日配额:

  • 每天 3,600 个代码补全请求
  • 每天 240 次代码生成请求
  • 每天 120 次聊天、可视化和数据分析表扫描

如果贵组织到目前为止尚未购买任何 BigQuery 企业 Plus 版预订,那么在您购买企业 Plus 版预订后,您将在第一个完整日历月内获得以下默认配额:

  • 每天 7,500 个代码补全请求
  • 每天 500 次代码生成请求
  • 每天 250 次聊天、可视化和数据洞察表扫描

如果您在月中开始使用企业 Plus 版预留功能,则默认配额将持续到次月月底。

申请增加配额

如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整