此页面由 Cloud Translation API 翻译。

持续监控并提升性能

Last reviewed 2024-12-06 UTC

Google Cloud Well-Architected Framework 性能优化核心中的这一原则提供了一些建议，可帮助您持续监控和提升性能。

部署应用后，您可以使用日志、跟踪、指标和提醒来持续监控其性能。随着应用的发展和发展，您可以根据这些数据点的趋势重新评估性能要求。您可能最终需要重新设计应用的某些部分才能维护或提高其性能。

原则概览

持续改进性能的过程需要强大的监控工具和策略。借助云可观测性工具，您可以收集延迟时间、吞吐量、错误率和资源利用率等关键绩效指标 (KPI)。云环境提供了多种方法，可对应用、网络和最终用户体验进行精细的性能评估。

提高性能是一项持续的工作，需要采取多方面的方法。以下关键机制和流程可帮助您提升效果：

为了提供明确的方向并帮助跟踪进度，请确定与您的业务目标相符的效果目标。设定 SMART 目标：具体、可衡量、可实现、相关且有时限。
为了衡量效果并找出有待改进的方面，请收集 KPI 指标。
如需持续监控系统是否存在问题，请使用监控工具中的可视化工作流。使用架构流程映射技术来识别冗余和低效之处。
为了打造持续改进的文化，请提供有助于员工成长的培训和计划。
为了鼓励主动持续改进，您可以激励员工和客户持续提供有关应用性能的反馈。

建议

为了推广模块化设计，请考虑以下各部分中的建议。

定义明确的绩效目标和指标

确定与业务目标相符的明确效果目标。这需要深入了解应用的架构以及每个应用组件的性能要求。

优先优化直接影响核心业务功能和用户体验的最关键组件。为确保这些组件继续高效运行并满足您的业务需求，请设置具体且可衡量的效果目标。这些目标可以包括响应时间、错误率和资源利用率阈值。

这种主动式方法有助于您发现和解决潜在的瓶颈问题、优化资源分配，并最终为用户提供顺畅且高性能的体验。

监控效果

持续监控云系统是否存在性能问题，并针对任何潜在问题设置提醒。监控和提醒功能可帮助您在问题影响到用户之前发现并解决问题。应用分析有助于发现瓶颈，并有助于优化资源用量。

您可以使用有助于有效排查问题和优化网络的工具。使用 Google Cloud Observability 找出 CPU 消耗、内存消耗或网络消耗较高的区域。这些功能可帮助开发者提高效率、降低成本并提升用户体验。Network Intelligence Center 可直观呈现网络基础设施的拓扑，并帮助您识别高延迟路径。

激励持续改进

营造持续改进的文化，让应用和用户体验都能从中受益。

为员工提供培训和发展机会，以提升他们在云服务中运用性能技巧的技能和知识。建立实践社区 (CoP)，并提供指导和辅导计划来支持员工成长。

为防止被动的绩效管理，并鼓励主动的绩效管理，请鼓励员工、客户和利益相关者持续提供反馈。您可以考虑将此流程游戏化，方法是跟踪绩效方面的 KPI，并以排行榜的形式定期向团队展示这些指标。

为了解您的表现和用户满意度随时间的变化情况，我们建议您从定量和定性两个方面衡量用户反馈。HEART 框架可帮助您收集五个类别的用户反馈：

幸福感
互动
采用
保留
任务成功

通过使用此类框架，您可以利用数据驱动的反馈、以用户为中心的指标、可据以采取行动的数据洞见和清晰的目标理解来激励工程师。

推行模块化设计