监控概览

深入了解应用和基础架构对于保持性能和稳定性至关重要。因此,Google Distributed Cloud (GDC) air-gapped 提供了一个监控平台,用于收集和分析指标。

借助 GDC 监控平台,您可以收集和查询已部署工作负载的指标。您可以使用监控平台的内置可观测性工具来监控和直观呈现系统。

通过有效地收集和查询指标,您可以深入了解与世隔绝的环境,并确保工作负载的最佳性能。

主要概念

GDC 监控平台引入了以下概念:

  • 指标是从 GDC 工作负载中收集的定量衡量数据,可提供有关资源利用率和性能的宝贵数据分析。GDC 使用 Prometheus 来实现这一目的。Prometheus 是一种开源监控系统,可确保高效可靠地收集数据。

  • 信息中心是指标的可视化表示形式,可用于观察趋势和系统行为。您的 GDC 项目包含一个用于指标可视化的专用 Grafana 实例。Grafana 是一款分析平台,可让您创建富有洞见的信息中心并探索指标数据。GDC 为标准组件提供预构建的信息中心,让您能够立即了解环境情况。

监控工作流

为了便于监控组件的进程,GDC 监控平台按以下工作流程运行:

  1. 收集指标:当 GDC 环境正常运行后,系统会自动收集核心组件的指标,并在预配置的 Grafana 信息中心内显示这些指标。此功能可提供即时网络和服务器监控。

    您还可以通过部署自定义资源来为自己的应用和服务配置抓取目标,这些自定义资源定义了要收集的工作负载特定指标以及收集频率。

  2. 查询指标:您可以使用 PromQL(Prometheus 查询语言)查询收集的指标。通过查询指标,您可以执行以下操作:

    • 根据标签和值过滤指标。
    • 随时间推移汇总数据。
    • 对指标值执行计算。
  3. 构建信息中心并直观呈现指标:使用 Grafana 构建可直观呈现指标的自定义信息中心。这些信息中心可清晰全面地显示系统性能,让您能够执行以下操作:

    • 发现趋势和异常情况。
    • 有效排查问题。
    • 做出明智的资源分配和优化决策。

指标保留

保留政策定义了指标和日志的存储时长。这些政策对于满足合规性要求和支持运营分析至关重要。

GDC 使用保留时间来设置指标的生命周期和保留政策。系统会为指标保留时间应用 90 天的默认值。

访问方法

您可以使用以下访问方法来处理组件指标:

  • Grafana 界面:您可以通过 GDC 控制台或直接使用网址访问项目的 Grafana 实例。通过该界面,您可以查询和直观呈现指标。
  • HTTP API:以编程方式使用 HTTP API 检索指标数据。 此方法可与外部工具和自动化脚本集成。

更多资源

如需详细了解从 GDC 组件收集的所有指标,请参阅全面的指标列表。此资源可提供有价值的背景信息,并有助于制定高级监控策略。