Cloud Run 配额和限制

本页面介绍使用 Cloud Run 时需遵循的用量配额和限制。

Cloud Run 资源的数量是有限的。Cloud Run 的配额包含 API 速率限制,这些限制会影响 Cloud Run Admin API 的调用速率。

以下各项不存在直接限制:

  • 您可以部署的容器映像大小
  • 一项 Cloud Run 服务可以处理的并发请求数。

Cloud Run 的资源限制

如需超出可增加的限额,请申请增加配额。如需超出无法增加的每项目限额,请在其他 Google Cloud 项目或区域中创建新资源。

资源 范围 说明 限制 是否可以增加?
服务 每个项目和区域 服务数上限 1000
作业 每个项目和区域 作业数上限 1000
作业执行 每个项目和区域 正在运行的作业执行数上限 1000
修订版本 每项服务 每项服务的修订版本数上限。达到上限后,系统将按照历史顺序自动删除未在使用中的修订版本 1000
修订版本 每个项目和区域 处理流量的修订版本数上限 4000
修订版本标记 每个项目和区域 修订版本标记数量上限。当修订版本标记数超出限制时,Cloud Run 会对服务执行标记清理。对于要为其创建新代码的服务,系统会按历史顺序自动删除未指定流量百分比的代码。 2000
作业执行 每个作业 已完成的作业执行次数的保留限制。当作业的已完成执行次数达到此限制时,系统将按历史顺序自动删除执行次数 1000
作业执行任务1 每次执行作业 并行运行的任务数上限 取决于所选区域以及 CPU内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
作业执行任务 每次执行作业 任务超时值上限 168 小时(7 天)2
作业执行任务 每次执行作业 单个作业中的任务数上限 10000
作业执行任务 每次执行作业 作业中的任务重试次数上限 10
环境变量 每个作业或每项服务 每个容器的环境变量数量上限 1000
命令参数 每个作业或每项服务 每个容器的命令参数数量上限 1000
容器实例1 每个修订版本 容器实例数上限 取决于所选区域以及 CPU 和内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
容器实例1 每个项目和区域 所有正在运行的作业执行的容器实例数上限 取决于所选区域以及 CPU内存配置。此限制在高容量区域可能较高,在最近打开的区域可能较低。
容器实例 3 每个修订版本和区域 使用直接 VPC 出站流量的容器实例数上限 100-200,具体取决于所选的区域配置。
容器实例 每个容器实例 启动超时(以分钟为单位) 4
内存 每个容器实例 内存大小上限(以 GiB 为单位) 32
CPU 每个容器实例 vCPU 数量上限 8
CPU 每个项目和区域 在 1 分钟内,所有实例分配的总 CPU 上限(以毫微 vCPU 为单位)。 取决于所选区域。此限制在高容量区域可能较高,在最近打开的区域可能较低。
内存 每个项目和区域 在 1 分钟内,所有实例分配的总内存上限(以字节为单位)。 取决于所选区域。此限制在高容量区域可能较高,在最近打开的区域可能较低。
GPU 实例 4 按项目和区域 带有 GPU 的容器实例数上限 04
磁盘 每个容器实例 可写内存中文件系统大小上限(受实例内存限制,以 GiB 为单位) 32
环境变量 每个变量 变量长度上限(以 Kb 为单位) 32
网域映射 每个顶级网域和每周 SSL 证书数量上限 50
网域映射 每个顶级网域和每周 重复的 SSL 证书数量上限 5
访问令牌 每个容器实例每秒 生成的唯一访问令牌数量上限 50
身份令牌 每个容器实例每秒 生成的唯一身份令牌数量上限 50
已打开的文件数 每个容器实例 可以同时打开的文件数上限。对应于
/proc/sys/fs/file-max
25000

1此区域配额用于以下几种情况:

  1. 它控制可以为修订版本的实例数上限特性选择的最大值。在给定区域中授予该配额后,该区域中的所有修订版本都可以达到授予的上限。

  2. 它控制作业的最大并行性。在指定区域中授予该配额后,该区域中的所有作业都可以达到授予的上限。

  3. 它控制在一个区域中运行作业执行的容器实例总数。

2预览版支持超过 24 小时的超时。

3此区域配额用于以下几种情况

  1. 它控制可以为使用直接 VPC 出站流量的修订版本的实例数上限属性选择的最大值。在给定区域中授予该配额后,该区域中的所有修订版本都可以达到授予的上限。

  2. 它控制使用直接 VPC 出站流量的作业的最大并行性。在指定区域中授予该配额后,该区域中的所有作业都可以达到授予的上限。

4 如需访问 GPU,您必须为 Total Nvidia L4 GPU allocation, per project per region 申请增加配额

Cloud Run 的网络限制

Cloud Run 的请求限制

说明 限制 备注
每个实例的并发请求数上限 1000
每个 HTTP/2 客户端连接的并发流数量上限 100
每个请求的超时前的最长时间 60 分钟
HTTP/1 请求大小上限 如果使用 HTTP/1 服务器,则为 32 MiB。如果使用 HTTP/2 服务器,则无限制。
HTTP/1 响应大小上限 如果未使用 Transfer-Encoding: chunked 或流式传输机制,则为 32 MiB
每个实例每秒的出站连接数 700
每个实例每秒的出站 DNS 解析次数 1000
每个实例每秒发送到 HTTP/1 容器端口的入站请求数 800 不适用于 HTTP/2 容器端口。

Cloud Run 的带宽限制

以下带宽限制适用于 Cloud Run 实例:

说明 限制 备注
每个实例通过直接 VPC 的出站流量的位数上限 1 Gbps 通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。
每个实例的位数上限,不包括通过直接 VPC 的出站流量 600 Mbps 基于入站流量位数和出站流量位数的总和,不包括通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。
每个实例的数据包总速率上限,不包括通过直接 VPC 的出站流量 每秒 64,000 个数据包 基于入站流量数据包数和出站流量数据包数的总和,不包括通过直接 VPC 出站流量流向 VPC 网络中的目的地的出站流量。

如果达到这两个限制中的任何一个,则 Cloud Run 实例的带宽将受限。

Cloud Run Admin API 速率限制

以下速率限制适用于 Cloud Run Admin API,但不适用于传送至您部署的 Cloud Run 服务的请求。

配额 说明 限制 能否增加? 范围
Cloud Run Admin API 读取请求数 每个区域每 60 秒的 API 读取次数。这不是向您的 Cloud Run 服务发出的读取请求数,后者不受限制。 每 60 秒 3,000 次 每个项目和区域
Cloud Run Admin API 写入请求数 每个区域每 60 秒的 API 写入次数。这不是向您的 Cloud Run 服务发出的写入请求数,后者不受限制。 每 60 秒 180 次 每个项目和区域
作业运行 每个区域每 60 秒可执行的作业次数上限。 每 60 秒 180 次 每个项目和区域

如何增加配额

如需申请更高的配额值,请按以下步骤操作:

  1. 进入配额和系统限制页面:

    进入“配额和系统限制”

  2. 配额列中,找到要增加的配额。您可以使用过滤条件搜索框来搜索所需配额。

  3. 选中要增加的配额旁边的复选框。

  4. 点击 修改。此时将显示配额更改对话框。

  5. 可选:如果您想将配额值提高到超过屏幕上显示的数字,请选择申请更高配额。填写表单,提交表单,然后跳过其余步骤。

  6. 配额更改表单中,在新值字段中输入所需增加的配额。如果显示请求说明字段,请输入说明。点击完成

    如果您看到一个包含“我了解这项申请将移除所有替换设置”文本的方框,则表示您的配额值低于默认值。如果将配额值调整到默认值或超出默认值,则会移除替换设置。如要继续,请勾选相应复选框。详细了解配额覆盖

    如果显示下一步按钮,请点击下一步,然后在随后显示的屏幕中填写您的联系人详细信息。

  7. 点击提交请求

如果您发现无法在控制台中申请调整配额,请通过 Cloud Customer Care 申请增加配额。

Cloud 配额调整请求需要经过审核。如果您的配额调整请求需要审核,您会收到一封电子邮件,确认收到您的请求。如果您需要进一步的帮助,请回复该电子邮件。我们会在审核您的请求后向您发送电子邮件通知,告知您请求是否获得了批准。

如需详细了解配额增加流程的工作原理,请参阅配额增加申请简介

批量申请更高配额

您可以通过选中要添加的每个配额旁边的复选框来批量申请更高的配额。批量提交请求可能会增加 Google Cloud 审核您的请求所需的时间。为缩短审核时间,请按产品和区域对配额调整请求进行分组。例如,如果您想申请调整网络配额和 Compute Engine 虚拟机配额,请针对网络配额创建一个申请,针对 Compute Engine 虚拟机配额再创建一个申请。