本页介绍了如何设置可用于 Cloud Run 服务的实例数量上限。
通过在 Cloud Run 中指定实例数量上限,您可以限制服务响应传入请求的伸缩范围。不过,由于流量高峰等原因,实例数量可能会在短时间内超过此上限设置。
您可以使用此设置来控制费用或限制与备份服务(如数据库)的连接数。
如需了解可能适用于您的服务的实例数上限,请参阅实例数上限。
如需详细了解 Cloud Run 自动扩缩容器实例的方式,请参阅实例自动扩缩。
所需的角色
如需获得配置和部署 Cloud Run 服务所需的权限,请让您的管理员为您授予以下 IAM 角色:
-
Cloud Run 服务的 Cloud Run Developer (
roles/run.developer
) 角色 -
服务身份的 Service Account User (
roles/iam.serviceAccountUser
) 角色
如需查看与 Cloud Run 关联的 IAM 角色和权限的列表,请参阅 Cloud Run IAM 角色和 Cloud Run IAM 权限。如果您的 Cloud Run 服务与 Google Cloud API(例如 Cloud 客户端库)进行交互,请参阅服务身份配置指南。如需详细了解如何授予角色,请参阅部署权限和管理访问权限。
设置和更新实例数上限
任何配置更改都会导致新修订版本的创建。后续修订版本也将自动采用此配置设置,除非您进行了明确更新。
默认情况下,Cloud Run 服务配置为最多扩容到 100 个实例。
在以下情况下,您可以使用 Google Cloud 控制台、Google Cloud CLI 或 YAML 文件更改实例数上限设置:创建新服务或部署新的修订版本时。
控制台
在 Google Cloud 控制台中,前往 Cloud Run:
点击部署容器,然后选择服务以配置新服务。如果您要配置现有服务,请点击该服务,然后点击修改和部署新的修订版本。
如果您要配置新服务,请根据需要填写初始服务设置页面,然后点击容器、网络、安全性以展开服务配置页面。
点击容器标签页。
- 在“实例数上限”字段中,使用从
1
到最大限制的任意整数值指定所需的实例数量上限
- 在“实例数上限”字段中,使用从
点击创建或部署。
gcloud
您可以使用以下命令更新给定服务的实例数量上限:
gcloud run services update SERVICE --max-instances MAX-VALUE
替换
- 将 SERVICE 替换为您的服务名称。
- 将 MAX-VALUE 替换为所需的容器实例数上限(使用
1
到上限的任意整数值)。指定default
可清除任何实例数上限设置,并恢复默认的 100 个实例。
您还可以使用以下命令设置部署期间的实例数量上限:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
替换
- 将 IMAGE_URL 替换为对容器映像的引用,例如
us-docker.pkg.dev/cloudrun/container/hello:latest
。 如果您使用 Artifact Registry,则必须预先创建制品库 REPO_NAME。网址格式为LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
。 - 将 MAX-VALUE 替换为所需的容器实例数上限。
YAML
如果您要创建新的服务,请跳过此步骤。如果您要更新现有服务,请下载其 YAML 配置:
gcloud run services describe SERVICE --format export > service.yaml
更新
autoscaling.knative.dev/maxScale:
特性:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
您需要进行如下替换
- 将 SERVICE 替换为您的 Cloud Run 服务的名称
- 将 MAX-INSTANCE 替换为所需的数量上限。
- 将 REVISION 替换为新的修订版本名称或者将其删除(如果存在)。如果您提供新的修订版本名称,则该名称必须满足以下条件:
- 开头为
SERVICE-
- 仅包含小写字母、数字和
-
- 不以
-
结尾 - 不超过 63 个字符
- 开头为
使用以下命令创建或更新服务:
gcloud run services replace service.yaml
Terraform
如需了解如何应用或移除 Terraform 配置,请参阅基本 Terraform 命令。
以下 google_cloud_run_v2_service
资源在 template.scaling
下指定了 10
的实例数上限。将 10
替换为所需的实例数上限。
查看实例数上限设置
如需查看 Cloud Run 服务的当前实例数上限设置,请按照以下所述操作:
控制台
在 Google Cloud 控制台中,前往 Cloud Run:
点击您感兴趣的服务以打开“服务详细信息”页面。
点击修订版本标签页。
在右侧的详细信息面板中,“容器”标签页下列出了实例数上限设置。
gcloud
使用以下命令:
gcloud run services describe SERVICE
在返回的配置中找到实例数上限设置。