指标数据的保留和延迟时间

本页介绍了 Cloud Monitoring 的指标数据的保留时间,以及收集数据的延迟时间和该数据的公开时间。

配额和限制 提供了有关指标数据限制的更多信息。

保留指标数据

Cloud Monitoring 会获取指标数据并将其保存在指标类型的时间序列中一段时间。此时间段会因指标类型而异;如需了解详情,请参阅 数据保留

在该时间段结束时,Cloud Monitoring 将删除过期的数据点。

当时序中的所有时间点过期后,Cloud Monitoring 将删除该时序。已删除的时序不会显示在 Cloud Monitoring 图表或 Monitoring API 的结果中。

指标数据的延迟时间

延迟时间是指 Cloud Monitoring 对指标进行抽样到指标数据点以时序数据的形式显示之间的延迟时间。延迟时间取决于指标是 Google Cloud 服务的指标还是用户定义的指标:
  • Google Cloud 指标Google Cloud 指标列表包含 Google Cloud 服务的指标类型。其中许多说明都包含如下语句:“每 60 秒进行一次采样。采样后,数据在最长 240 秒的时间内不会显示。”

    语句中的值因具体指标而异。示例语句表示 Cloud Monitoring 每分钟收集一次测量结果(采样间隔),但由于其中一些指标在公开之前会接受额外处理,因此您可能需要等待额外的时间(延迟时间)才能检索此指标的数据。在此示例中,延迟时间最多可达 4 分钟。因此,对于此指标,记录收集时间的时间戳可能长达 4 分钟。此延迟时间不适用于用户定义的指标。

  • 用户定义的指标:如果您要将数据写入用户定义的指标(包括自定义指标、OpenTelemetry 收集的指标、Ops Agent 收集的应用指标和 Prometheus 指标),则这些指标中的数据通常会在 3 到 7 秒内显示并可供查询(不包括网络延迟时间)。

在某些情况下,您可能需要调整对有延迟时间的指标的使用方式。例如:

  • 使用客户端库检索指标数据时,您可能需要在查询间隔中使用偏移量来考虑延迟时间。

  • 使用指标来推动资源管理(例如在自动扩缩时),指标的延迟时间可能会影响自动扩缩的响应速度。例如,某些 Pub/Sub 指标的延迟时间介于 2 到 4 分钟之间。

  • 使用提醒政策时,请注意延迟时间可能会影响基于指标的提醒政策的突发事件创建时间。例如,如果被监控的指标的延迟时间最长为 180 秒,那么在指标违反提醒政策条件的阈值后,Cloud Monitoring 最长会在 180 秒后创建突发事件。在评估提醒政策时,Cloud Monitoring 会自动考虑基础指标的延迟时间(如果有)。