在容量高峰事件发生之前,管理和优化您的工作负载使用的资源。 Google Cloud 这涉及根据实际使用情况和需求调整资源大小、使用自动扩缩功能进行动态资源分配,以及查看架构和安全建议。Cloud Monitoring 和 Recommender(Active Assist)都可以帮助您发现优化云资源的机会。通过使用这些工具,您可以深入了解资源使用情况,并在活动前做出明智的决策。
查看 Google Cloud 最佳实践
遵循您所用 Google Cloud 产品的建议最佳实践,可以避免许多容量高峰事件问题。以下是一些最佳实践指南示例:
常规 | |
BigQuery | |
Cloud Storage | |
Compute Engine | |
Dataflow | |
Dataproc | |
Google Kubernetes Engine |
审核可伸缩性
自动扩缩功能可确保您的基于云的应用拥有处理各种工作负载所需的资源,同时避免过度预配和不必要的费用。 Google Cloud 提供多种产品专用自动扩缩选项,包括:
- Compute Engine 托管式实例组 (MIG) 是指作为单个实体进行管理和扩缩的一组虚拟机。借助 MIG,您可以定义自动扩缩政策,指定要在组中维持的虚拟机数量下限和上限,以及触发自动扩缩的条件。
- Google Kubernetes Engine (GKE) 自动扩缩功能可动态调整集群资源,以满足应用的需求。它提供的工具可优化资源利用率、确保应用性能并简化集群管理。
- Cloud Run 提供内置的自动扩缩功能,可根据传入流量自动调整实例数量。
我们建议您在活动前手动扩容。虽然您可能已配置自动扩缩功能,但由于事件流量的速度,自动扩缩功能可能无法跟上需求。因此,请提前预热资源,包括:
- 虚拟机
- 缓存(如果您想预加载)
- 用于防止冷启动的无服务器组件
查看 Active Assist 建议
Active Assist 是指Google Cloud 中用于生成建议和数据分析的工具组合,可帮助您优化 Google Cloud 项目。如需了解详情,请参阅什么是 Active Assist。
查看商品版本
确保您的所有云产品和服务均为最新的稳定版。
查看提醒和信息中心
通过评估 Google Cloud 可观测性工具和第三方解决方案提供给您的提醒和信息中心,主动发现和解决问题。
查看 Google Cloud Observability 指标、日志和轨迹,深入了解资源利用率、性能特征和资源的整体运行状况。监控与系统运行状况指标一致的重要指标,例如 CPU 利用率、内存用量、网络流量、磁盘 I/O 和应用响应时间。您还应考虑业务专用指标。通过跟踪这些指标,您可以发现潜在的瓶颈、性能问题和资源限制。此外,您还可以设置提醒,以便在出现潜在问题或异常时主动通知相关团队。
对于提醒,请重点关注关键指标,设置适当的阈值以最大限度减少警报疲劳,并确保对重大问题及时做出响应。通过这种有针对性的方法,您可以主动维护工作负载可靠性。如需了解详情,请参阅提醒概览。