规划资源分配

Last reviewed 2024-12-06 UTC

Google Cloud Well-Architected Framework 的性能优化支柱中的这一原则提供了一些建议,可帮助您为Google Cloud中的工作负载规划资源。它强调了在设计和开发应用以进行云部署或迁移之前,定义精细要求的重要性。

原则概览

为满足业务需求,请务必在设计和开发之前定义应用的性能要求。尽可能准确地定义这些要求,包括针对整个应用的要求和针对应用堆栈每一层的要求。例如,在存储层中,您必须考虑应用所需的吞吐量和每秒 I/O 操作次数 (IOPS)。

从一开始,就应在规划应用设计时考虑到性能和可伸缩性。考虑用户数量、数据量以及随时间推移的潜在增长等因素。

每种工作负载的性能要求各不相同,具体取决于工作负载的类型。每个工作负载都可以包含具有独特性能特征的组件系统和服务。例如,负责定期批量处理大型数据集的系统与交互式虚拟桌面解决方案相比,对性能的要求有所不同。您的优化策略必须满足每个工作负载的特定需求。

选择与每个工作负载的性能目标相符的服务和功能。在优化效果方面,没有一种解决方案能够适用于所有情况。优化每个工作负载后,整个系统可以实现最佳性能和效率。

请考虑以下可能会影响性能要求的工作负载特征:

  • 部署原型:您为应用选择的部署原型会影响您对产品和功能的选择,进而决定您可以从应用中获得的效果。
  • 资源放置:为应用资源选择 Google Cloud 区域时,我们建议您优先考虑最终用户的低延迟,遵守数据本地化法规,并确保所需 Google Cloud 产品和服务的可用性。
  • 网络连接:选择可优化数据访问和内容传送的网络服务。充分利用 Google Cloud的全球网络、高速骨干网、互连位置和缓存服务。
  • 应用托管选项:选择托管平台时,您必须评估每个选项的性能优势和劣势。 例如,考虑裸机、虚拟机、容器和无服务器平台。
  • 存储策略:根据您的性能要求选择最佳存储策略
  • 资源配置:机器类型、IOPS 和吞吐量可能会对性能产生重大影响。此外,在设计阶段的早期,您必须考虑适当的安全功能及其对资源的影响。规划安全功能时,请准备好接受必要的性能权衡,以免产生任何不可预见的影响。

建议

为确保资源分配达到最佳状态,请考虑以下各部分中的建议。

配置和管理配额

确保您的应用仅使用必要的资源,例如内存、存储空间和处理能力。过度分配会导致不必要的支出,而分配不足可能会导致性能下降。

为了适应弹性伸缩并确保有足够的资源可用,请定期监控配额容量。此外,您还可以跟踪配额用量,以发现潜在的伸缩限制或过度分配问题,然后就资源分配做出明智的决策。

普及知识并提高认知度

向用户告知性能要求,并提供有关有效性能管理技巧的教育资源

为了评估进展情况并确定需要改进的方面,请定期记录目标效果和实际效果。对应用进行负载测试,以找出潜在的断点并了解如何扩缩应用。

监控性能指标

使用 Cloud Monitoring 来分析性能指标的趋势、分析实验的影响、定义关键指标的提醒,以及执行回顾性分析。

Active Assist 是一组工具,可提供数据分析和建议,帮助您优化资源利用率。这些建议可帮助您调整资源分配并提升效果。