事件准备工作的关键组成部分是容量规划,您需要确定所需的云资源数量,确保工作负载拥有有效运行所需的资源,同时避免过度预配资源,以及不必要地为不需要的资源付费。
容量是指可供所有客户共享的特定资源的总量。不过,为了确保少数客户或项目无法独占资源, Google Cloud 通过配额限制您可以使用的特定共享 Google Cloud 资源的数量。
每个配额代表一个特定的可数资源,例如对特定服务的 API 调用次数、给定时间内您的项目使用的虚拟机数量、您的项目并发使用的负载平衡器数量或者您可以创建的项目数量。
虽然许多服务对某些资源设有默认配额,但适用于您的应用的配额专用于您、您的项目或您的组织。为项目启用结算功能可增加大多数服务的配额。随着您 Google Cloud 的使用量逐步增加,您的配额可能会相应地增加。
在为高流量活动或旺季做准备时,您需要确保配额与资源要求相符,以免发生意外失败。
建议您执行以下操作:
使用 Cloud Monitoring 工具可以了解应用使用情况和容量,以及应用和基础架构的整体运行状况。
评估主要云工作负载的平均利用率和峰值利用率,以及当前和未来的容量需求,以确定为应对流量高峰需要多少超额预配。
运行负载测试,以确定在给定固定数量的资源的情况下,系统能够在满足其延迟时间目标的情况下处理多少负载。
使用容量规划工具
借助容量规划工具,您可以查看虚拟机 (VM) 实例、永久性磁盘卷和 GPU 的历史用量和预测用量。此外,您还可以查看预订情况、提前预订资源,以及通过查看距离配额限制的距离和设置自动配额增加请求来管理项目的配额限制。如需了解详情,请参阅在容量规划工具中查看使用情况和预测数据。
启用配额调整工具
配额调整工具会监控您的资源消耗情况并代表您主动提交配额调整请求,这样您就不必手动发出请求。如需了解详情,请参阅配额调整器的运作方式。
申请配额调整
如果您的配额不足以满足您的需求,您可以申请配额调整。您可以通过以下三种主要方式提交配额增加请求:
- 通过 Google Cloud 控制台
- 通过支持请求
- 直接与您的客户支持团队或 TAM 联系
如果您需要快速处理配额增加请求,不妨考虑使用 Google Cloud 控制台。不过,如果请求需要进行更多分析,您可能需要与您的客户支持团队合作。
如需通过 Google Cloud 控制台调整配额值,请参阅查看和管理配额。
大多数配额增加请求由自动化系统评估。它们的决定取决于相应标准,包括资源可用性、您使用 Google Cloud的时长以及其他因素。不符合相应标准的申请会被拒绝。如果您的请求被拒,您可以尝试通过创建支持请求或与您的客户支持团队或 TAM 联系来申请提高配额。
创建预留
预留有助于确保您随时可以使用 Compute Engine 资源来创建具有相同硬件(内存和 vCPU)和可选资源(GPU 和本地 SSD 磁盘)的虚拟机。
按需预留会在您申请时预配(如果请求的容量可用)。未来预留可让您提前请求容量,并为您获取和保障用于峰值事件的容量提供高级别保证。我们建议您在活动前提前预订未来的空房。如需了解详情,请参阅以下内容: