持续监控和改进性能

Last reviewed 2024-12-06 UTC

Google Cloud 架构完善框架的性能优化支柱中的这一原则提供了一些建议,可帮助您持续监控和提升性能。

部署应用后,您可以使用日志、跟踪、指标和提醒来持续监控其性能。随着应用的发展和发展,您可以根据这些数据点的趋势重新评估性能要求。您可能最终需要重新设计应用的某些部分才能维护或提高其性能。

原则概览

持续改进性能的过程需要强大的监控工具和策略。借助云可观测性工具,您可以收集延迟时间、吞吐量、错误率和资源利用率等关键绩效指标 (KPI)。云环境提供了多种方法,可对应用、网络和最终用户体验进行精细的性能评估。

提高性能是一项持续的工作,需要采取多方面的方法。以下关键机制和流程可帮助您提升效果:

  • 为了提供明确的方向并帮助跟踪进度,请确定与您的业务目标相符的效果目标。设定 SMART 目标:具体、可衡量、可实现、相关且有时限。
  • 为了衡量效果并找出有待改进的方面,请收集 KPI 指标。
  • 如需持续监控系统是否存在问题,请使用监控工具中的可视化工作流。使用架构流程映射技术来识别冗余和低效之处。
  • 为了打造持续改进的文化,请提供有助于员工成长的培训和计划。
  • 为了鼓励主动持续改进,您可以激励员工和客户持续提供有关应用性能的反馈。

建议

如需推广模块化设计,请考虑以下各部分中的建议。

定义明确的绩效目标和指标

确定与业务目标相符的明确效果目标。这需要深入了解应用的架构以及每个应用组件的性能要求。

优先优化直接影响核心业务功能和用户体验的最关键组件。为确保这些组件继续高效运行并满足您的业务需求,请设置具体且可衡量的效果目标。这些目标可以包括响应时间、错误率和资源利用率阈值。

这种主动式方法有助于您发现和解决潜在瓶颈、优化资源分配,并最终为用户提供顺畅且高性能的体验。

监控效果

持续监控云系统是否存在性能问题,并针对任何潜在问题设置提醒。借助监控和提醒,您可以及时发现并解决问题,以免影响到用户。应用分析有助于识别瓶颈,并有助于优化资源用量。

您可以使用有助于有效排查问题和优化网络的工具。使用 Google Cloud Observability 找出 CPU 消耗、内存消耗或网络消耗较高的区域。这些功能可帮助开发者提高效率、降低成本并提升用户体验。Network Intelligence Center 可直观呈现网络基础设施的拓扑,并帮助您识别高延迟路径。

激励持续改进

营造持续改进的文化,让应用和用户体验都能从中受益。

为员工提供培训和发展机会,以提升他们在各种云服务中的性能优化技巧方面的技能和知识。 建立实践社区 (CoP),并提供指导和辅导计划来支持员工成长。

为防止被动的绩效管理,并鼓励主动的绩效管理,请鼓励员工、客户和利益相关者持续提供反馈。您可以考虑将此流程游戏化,方法是跟踪绩效方面的 KPI,并以排行榜的形式定期向团队展示这些指标。

为了解您的表现和用户满意度随时间的变化情况,我们建议您从定量和定性两个方面衡量用户反馈。HEART 框架可帮助您收集五个类别的用户反馈:

  • 幸福感
  • 互动
  • 采用
  • 保留
  • 任务成功

通过使用此类框架,您可以利用数据驱动的反馈、以用户为中心的指标、可据以采取行动的数据洞见以及对目标的清晰了解来激励工程师。