查看和管理指标使用情况

本文档介绍了 Cloud Monitoring 的指标管理页面,该页面可帮助您充分利用可计费指标。Google Cloud 项目有权访问对其指标范围可见的所有指标。您可以使用指标管理页面执行以下操作:

  • 一目了然地查看指标使用情况:查看指标在查询自定义信息中心提醒政策中的使用情况。

    • 未使用的可结算指标是指在过去 30 天内未被查询过且未在自定义信息中心或提醒政策中使用的活跃指标。
    • 如需查看指标范围中但在其他项目中定义的指标的提醒政策或自定义信息中心,请使用项目选择器选择存储该指标的 Google Cloud 项目。
  • 确定费用高但价值较低的指标:过滤和排序指标,以查看哪些未使用的可结算费用指标对您的账单影响最大。查看哪些项目和命名空间会导致高成本指标。

  • 管理费用创建规则以排除不必要的指标,以免其被提取到 Cloud Monitoring 中。您无需为排除的指标付费。无论指标的来源是什么,排除规则都适用。

    • 使用指标名称排除单个指标。
    • 使用正则表达式排除一组指标。
  • 利用有价值的指标:为未使用的可计费指标创建提醒政策信息中心

  • 排查指标提取问题

指标管理页面不会报告用户定义的基于日志的指标。这些指标通过统计日志条目中的值派生而来,前缀为 logging.googleapis.com/user

准备工作

如需查看指标管理页面中包含的图表和日志、创建提醒政策以及创建指标排除规则,您必须拥有正确的授权

指标管理会从数据收集和使用方面分析指标。 如需详细了解这些类别,请参阅术语

授权

  • 如需获得查看审核日志所需的权限,请让您的管理员为您授予项目的 Private Logs Viewer (roles/logging.privateLogViewer) IAM 角色。 如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

    如需详细了解角色,请参阅使用 Identity and Access Management 控制访问权限

  • 如需在指标管理页面上查看指标生成的审核日志,您必须在 Google Cloud 项目中启用审核日志记录。如需让项目在读取或写入数据时生成审核日志,请执行以下操作:

    1. 在 Google Cloud 控制台中,前往审核日志页面:

      前往审核日志

      如果您使用搜索栏查找此页面,请选择子标题为 IAM 和管理的结果。

    2. 在过滤栏中输入 Stackdriver Monitoring API
    3. 选择 Stackdriver Monitoring API
    4. 日志类型标签页中,选择数据写入数据读取,然后点击保存

    如需了解详情,请参阅配置数据访问审核日志

术语

指标管理页面使用以下术语来描述指标的状态以及您使用指标的方式:

  • 指标的状态
    • 活跃指标是指您的项目在过去 25 小时内提取了数据的指标。这些指标会产生费用。
    • 非活跃指标是指您的项目在过去 25 小时内未提取数据的可计费指标。这些指标不会产生费用。
  • 指标的使用

    • 已使用的指标是指在过去 30 天内通过 Cloud Monitoring API 或其他工具查询过,或者在自定义信息中心或提醒政策中使用过的指标。

      图表和提醒政策可以引用没有数据的指标(无效指标)并查询此类指标;在指标管理页面上,这些指标被视为已使用的指标,即使任何读取操作都不会返回数据也是如此。

    • 未使用的可结算指标是指在过去 30 天内未被查询过,并且未在自定义信息中心或提醒政策中使用过的有效指标。这些指标会产生提取费用,但不会提供可观测性优势。如果这些指标代表可观测性缺口,您可以为它们创建图表或提醒政策。如果这些指标不代表可观测性缺口,则可以将其排除,从而降低提取这些指标的费用。

    • 空闲指标是指在过去 30 天内未被查询过,并且未在自定义信息中心或提醒政策中使用过的非活跃指标。这些指标不会产生费用。

系统每 24 小时计算一次指标的使用状态,以反映最新的查询历史记录以及信息中心和提醒政策的更改。

查看指标用量摘要

如需查看可计费指标数量、指标注入速率和错误率的摘要,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示有关前一天收集的指标的信息。以下屏幕截图展示了一个示例:

    摘要窗格会显示指标范围内各个项目的指标使用情况。

    • 如需查看指标范围内的项目中当前有多少可结算指标处于有效状态的摘要,请参阅有效指标计分卡。如果在过去 25 小时内向某个指标写入过数据,则该指标处于活跃状态。

    • 如需确定有多少活跃可结算指标在图表或提醒政策中被查询或使用,请参阅指标使用情况统计信息摘要。未使用的可计费指标表示可能存在可通过创建自定义信息中心或提醒政策来填补的可观测性缺口,或者表示有机会通过完全排除指标来降低费用。

    • 如需确定费用产生的原因,请使用注入的结算字节数注入的结算样本数计分卡。如需了解详情,请参阅查看指标提取的整体趋势

    • 如需查找可能有助于您发现可计费指标设计或使用方面问题的信息,请使用指标写入错误计分卡。如需了解详情,请参阅调查指标问题

指标管理页面会显示您提取的数据量,而不是实际费用。如需查看当前的结算信息,请点击工具栏中的查看结算

查看指标范围的相关信息

指标管理页面中显示的一组指标取决于项目的指标范围。如果您的项目的指标范围中只有该项目本身,则 Metrics Management 页面上的指标来自当前项目。如果您的项目的指标范围中有多个项目,则指标管理页面上显示的指标包括所有这些项目的指标。导致费用最多的指标可能来自其他项目。

如需查看项目范围信息摘要,请点击指标范围。此摘要包含以下内容:

  • 具有对项目访问权限的 IAM 主账号。这组主账号包括用户、群组和服务账号。
  • 指标范围内可见的免费指标和可计费指标的数量。
  • 当前项目监控的项目列表。您可以在指标管理页面上查看所有这些项目的可结算指标。
  • 有关可以查看当前项目指标的所有项目的信息。

如需详细了解指标范围,请参阅配置多项目视图

调查您的可结算指标

指标管理页面提供了一个表格,其中包含指标范围内的每个计费指标。您可以使用此表格执行以下操作:

  • 确定任何指标对可结算交易量的贡献。
  • 确定指标在过去 30 天内的读取频率。指标读取包括 API 读取请求和图表生成的请求。
  • 确定收集但未在任何提醒政策或信息中心中使用的指标。未使用的指标数据可能表示可观察性存在缺口,或者排除指标后可以节省费用。
  • 为没有关联的提醒政策或自定义信息中心的指标创建提醒政策或图表。
  • 确定指标数据的来源项目。该表格包含指标范围内所有项目的指标,您可能需要了解特定指标是从哪个项目收集的。
  • 查看每个指标的标签和基数信息。在调查指标设计或使用方面的问题时,这些信息会很有帮助。

如需查看每个可结算指标的用量数据表格,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示有关前一天收集的指标的信息。以下屏幕截图显示了指标表格的示例:

    指标表会显示指标范围内项目中的每个指标的相关信息。

选择要查看的指标

如需管理费用,您需要了解哪些可结算指标会带来最多的流量。例如,仅知道每小时提取 60 MiB 的数据是不够的。不过,如果您知道大部分计费数据来自一个或两个指标,则可以调查这些指标的使用情况。

如需列出可结算费用的指标,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,此标签页会显示有关前一天收集的指标的信息。
  3. 如需将显示内容限制为特定组的指标,请使用快捷过滤条件直接过滤表格。查看指标类别可能会发现在查看表格中所有指标时难以检测到的模式。

“指标”表格列出了当前 Google Cloud 项目指标范围内的可结算指标。对于每个指标,该表都会显示该指标对可结算流量的贡献,并提供指向与该指标关联的提醒政策和自定义信息中心的链接,如下面的屏幕截图所示。如果指标没有关联的提醒政策或信息中心,表格中会显示一个按钮,您可以点击该按钮创建提醒政策或信息中心。

指标表会显示指标范围内项目中的每个指标的相关信息。

如需按对计费流量的贡献度对指标进行排序,请点击计费字节数/总计计费样本数/总计列标题。

指标表还会显示指标的网域、指标的一组标签、指标的提取来源项目以及指标的基数。以下屏幕截图显示了这些列的示例。

“指标”表会报告指标范围中指标的指标网域、标签、项目 ID 和基数。

标签和基数信息可能有助于确定可结算交易量增加的原因。在 Cloud Monitoring 中,基数是指指标与资源关联的时序数量,与标签及其值相关;每个标签值组合都有一个时序。如需了解详情,请参阅基数

如果可结算数据量发生变化,则表示您提取的数据量增加了。如果变化突然或意外,原因可能是与指标关联的标签数量发生变化,或者标签值的设置方式发生变化。这两种情况都会增加指标的基数,从而导致可结算数据量增加。如需了解如何使用指标管理来帮助发现指标存在的问题,请参阅调查指标存在的问题

使用快速过滤条件

如需仅查看以下组中的指标,请在快捷过滤条件窗格中选择相应条目:

使用过滤条件窗格按可过滤的特性选择指标。

  • 指标状态包括有效和无效指标。活跃指标已提取过去 25 小时内的时序数据。如需详细了解这些状态,请参阅术语

  • 指标使用情况。此类别按以下方式对指标进行分类:

    • 已使用的指标、未使用的指标和非活跃指标。

      • 已使用的指标是指已通过指标读取访问过,或者在自定义信息中心或提醒政策中使用过。
      • 未使用的可计费指标是指未通过指标读取访问过,或者在自定义信息中心或提醒政策中使用过。
      • 空闲指标既处于“非活跃”状态,也处于“未使用”状态。

      如需详细了解这些使用类别,请参阅术语

    • 当前 Google Cloud 项目中提醒政策中使用的或未使用的指标。

    • 当前 Google Cloud 项目中自定义信息中心中使用的或未使用的指标。这些过滤条件不包括 Cloud Monitoring 提供的预定义信息中心中使用的指标。

    系统每 24 小时计算一次指标的使用状态,以反映最新的查询历史记录以及信息中心和提醒政策的更改。

  • 按网域划分的一系列指标,如可结算指标摘要中所述。

如果您有指标未在提醒政策或自定义信息中心中使用,并且从未查询过,那么您可能正在为这些指标付费,但却无法从中获得任何可观测性方面的好处。您可以选择无提醒政策无自定义信息中心快速过滤条件,列出当前 Google Cloud 项目中未在任何提醒政策或自定义信息中心中显示的指标。

直接过滤表格

如果没有合适的快速过滤条件,您可以使用  Filter 栏搜索一组指标。例如,如果您有一个包含多个项目的指标范围,并且希望仅列出该项目中的指标,则无法使用快捷过滤条件。如需仅列出特定项目的指标,请从过滤条件列表中选择 Project,然后输入项目的标识符。

您还可以使用显式过滤条件搜索与过滤条件组合匹配的指标。您一次只能选择一个快速过滤条件,因此无法使用快速过滤条件仅列出既未显示在提醒政策中,也未显示在自定义信息中心中的有效指标。如需搜索与多项要求相符的指标,请在过滤栏中添加过滤条件。例如,如需列出未出现在任何提醒政策和任何自定义信息中心中的有效指标,请在过滤栏中添加以下过滤条件:

  • Status: Active
  • Alert Policies: (Empty)
  • Custom Dashboards: (Empty)

默认情况下,当您添加多个过滤条件时,如果某行满足所有过滤条件,表格就会包含该行。不过,您可以在两个其他过滤器元素之间插入 OR 过滤器。

查看指标读数的相关信息

表格中每个指标对应的行都包含一个条目,用于显示过去 30 天的指标读取次数。您可以使用此条目来确定查询的执行方式。查询来源分为“控制台”或“其他”。从 Metrics Explorer 或自定义信息中心的图表读取数据属于“控制台”读取,从其他来源读取 API 数据属于“其他”读取。

  • 如需查看指标读取来源的简明摘要,请点击相应条目旁边的  向下箭头
  • 如需查看显示指标读取来源随时间变化的图表,请点击指标读取次数。此值也是指向图表的链接。

为未监控的指标创建提醒政策

如果表格中的指标没有关联的提醒政策,则表格会提供创建提醒按钮。如需为指标创建提醒政策,请点击相应指标对应的行中的创建提醒

系统会打开提醒政策对话框,其中的条件字段已填充。我们建议您检查所有设置,并进行以下修改:

  • 更新条件阈值。默认值可能不太理想。
  • 将通知渠道添加到政策中。
  • 为政策命名。

您还可以为任何指标创建提醒政策,只需点击  操作,然后点击为指标创建提醒即可。

如需了解详情,请参阅创建提醒政策

如需查看指标范围中但在其他项目中定义的指标的提醒政策,请使用项目选择器选择存储该指标的 Google Cloud 项目。

为未监控的指标创建图表

如果表格中的指标没有关联的自定义信息中心,则表格会提供创建图表按钮。您可以使用此按钮创建图表并将其放置在自定义信息中心中。如需为指标创建图表,请执行以下操作:

  1. 在相应指标对应的行中,点击创建图表

    系统会打开 Explorer 面板,并预配置为显示所选指标。您可以修改图表配置。如需详细了解如何使用 Metrics Explorer,请参阅使用 Metrics Explorer 创建图表

  2. 如需将图表保存到自定义信息中心,请点击保存到信息中心

  3. 保存图表面板中,执行以下操作:

    1. 接受或修改图表的默认标题。
    2. 选择要将图表保存到的现有自定义信息中心,或选择新信息中心为图表创建新信息中心。
    3. 点击保存图表

如需查看指标范围中但在其他项目中定义的指标的自定义信息中心,请使用项目选择器选择存储该指标的 Google Cloud 项目。

使用指标

虽然您可以使用指标管理页面查看指标的一些相关信息,但您可能想要了解更多信息。例如,您可能希望查看特定指标的图表,或创建提醒政策以便在指标注入速率超出预期时收到通知。

如需获取有关特定指标的更多详细信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在表格中找到该指标,然后点击  操作以执行以下任一操作:

    • 如需查看显示当前指标的图表,请选择在 Metrics Explorer 中查看

      Metrics Explorer 随即打开,并预配置为显示所选指标。您可以修改图表配置、舍弃它,也可以将其添加到自定义信息中心。

    • 如需创建用于监控指标的提醒政策,请选择为指标创建提醒

      系统会打开提醒政策对话框,其中的条件字段已填充。我们建议您检查所有设置,并进行以下修改:

      • 更新条件阈值。默认值可能不太理想。
      • 将通知渠道添加到政策中。
      • 为政策命名。

      如需了解详情,请参阅创建提醒政策

    • 排除相应指标。如需详细了解此选项,请参阅排除不需要的指标

    • 如需查看与指标关联的审核日志,请选择查看指标审核日志

排除不需要的指标

您可以创建指标排除规则,以防止将所选指标提取到 Cloud Monitoring 中。例如,如果您有一组不需要的未使用的可计费指标,则可以排除这些指标,从而降低提取这些指标的费用。如果您的需求发生变化,您日后可以修改删除排除规则。

如需创建指标排除规则,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 点击  排除指标。您还可以通过排除的指标标签页或每个指标对应的行中的  操作创建排除对象。
  3. 选择要排除的指标。
    1. 如需排除单个指标,请从指标名称表格中选择该指标。
    2. 如需排除一组指标,请执行以下操作:
      1. 点击正则表达式
      2. 输入正则表达式。例如,如需排除所有 agent.googleapis.com/apache 指标,您可以输入 agent.googleapis.com/apache.*agent.*/apache.*
      3. 点击显示匹配项,验证表达式是否与预期指标匹配
    3. 点击创建规则

规则大约需要 5 分钟才能生效。

下表包含一些正则表达式,可能有助于从 statsd 或类似的动态命名指标中排除指标:

屏蔽名称包含以下字符串的指标 正则表达式
连续出现多个下划线 .*_{2,}.*
连续出现 7 个以上的数字(可能是时间戳) .*\d{7,}.*
非常长的片段(可能存在标签解析错误) .*[a-zA-Z0-9]{20,}.*
十六进制子字符串,包括 GUID .*[A-F0-9]{10,}.*
IP 地址子字符串 .*\d{1,3}_\d{1,3}_\d{1,3}_\d{1,3}.*
任何数字(对于 Prometheus 指标可能很有用) .*\d+.*

修改指标排除规则

如需修改指标排除规则,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 点击已排除的指标标签页。
  3. 在要删除的规则所在的行中,点击  操作,然后选择修改规则
  4. 清除所选指标或正则表达式
  5. 选择一个新指标或创建一个新正则表达式。
  6. 点击更新规则

修改规则会删除旧规则并创建新规则。

删除指标排除规则

如需删除指标排除规则,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 点击已排除的指标标签页。
  3. 在要删除的规则对应的行中,点击  操作,然后选择删除规则

查看已排除的指标的数量

如需在 Metrics Explorer 中以图表形式查看排除的字节数或样本数,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 点击已排除的指标标签页。
  3. 依次点击历史记录 排除时间轴

该图表已预先配置为显示指标排除数据。您还可以点击保存到信息中心,将图表保存到自定义信息中心。

查看计费指标的趋势并发出提醒

注入的收费字节数和收费样本数决定了大部分费用。如需预测因使用可结算指标而产生的每月费用,您需要知道数据注入速率。指标管理页面会提供指标使用情况摘要,可帮助您执行以下操作:

  • 查看计费指标的使用趋势。
  • 确定指标范围中的项目发送的指标数据是否比预期多或少。
  • 确定生成数据最多的指标。
  • 确定负责生成最多 Prometheus 数据的命名空间。
  • 查看指标中的写入错误率。错误率是指返回错误状态的指标写入次数占指标写入总次数的百分比。

指标使用情况摘要窗格提供了指向有关时间趋势的更多详细信息的链接,以及指向针对使用情况趋势预配置的可自定义提醒政策的链接。

修订了“摘要”窗格

查看指标提取的总体趋势

如需确定您的应用是否在生成稳定应用的预期行为(即一致的数据量),请使用提取评分卡查看收集率。通过更改查看指标的时间范围,您可能会发现数据出现下降、峰值或趋势。

如需查看一段时间内的收集速率,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。
  3. 在注入的字节或样本的统计信息摘要图表上,点击查看图表。本讨论涉及可结算的选段的图表,但可结算字节的图表也遵循相同的规则。您会看到一组图表,如下所示:

    汇总指标提取情况的图表示例。

    默认情况下,图表图例处于收起状态。如需查看图表中显示的时序列表,请点击  Legend(图例)。如需了解如何设置时间参考或在特定时间范围内展开图表,请参阅探索已绘制成图表的数据

例如,如果您将时间范围设置为一周,并发现随着时间的推移,提取的数据出现了持续但意外的增加,那么您可以看看这种增加是来自某个特定指标,还是一组指标的普遍趋势。如果某个指标是罪魁祸首,您可以进行调查,看看该指标的基数是否也在增加。

  • 如需查看注入到当前指标范围内的可结算样本的速率,请使用注入的可结算样本总数图表。

  • 如需查看指标范围内每个项目对总可结算价值的贡献,请使用按已提取的可结算样本数显示项目图表。通过此图表,您可以了解哪些项目发送的数据量最多,以及是否有项目发送的数据量在增加或减少。

  • 仅限可结算的样本)如需查找向可结算值贡献最多指标的命名空间,请使用命名空间卷注入图表。

  • 如需查看指标范围中对计费价值贡献最大的指标,请使用注入的计费样本数中排名前 10 的指标图表。您可以查看收集率是否出现峰值、下降或趋势,或者某个指标的线条是否与所有其他指标大不相同。

  • 如需查看指标范围内所有指标对计费价值的贡献,请使用所有指标(按注入的计费样本数)图表。此图表包含前 10 名图表中的指标,可显示指标的收集率总体分布情况。

如需详细分析其中任何一个图表,请点击  更多选项,然后选择 View in Metrics Explorer(在 Metrics Explorer 中查看)。如需查看从命名空间卷提取图表开始并使用 Metrics Explorer 执行提取量归因的示例,请参阅以下内容:

如需详细了解如何使用 Metrics Explorer 分析数据(包括将当前月的行为与上个月的行为进行比较等操作),请参阅探索图表数据

根据指标提取创建提醒

如需在可结算指标的指标收集速率出现峰值、下降或趋势时收到通知,请创建提醒政策。例如,指标收集量下降可能表示应用的性能不佳。同样,流量激增也可能会导致意外扣款。最后,上升趋势可能表明指标的标签过多或基数正在增加。在所有情况下,提醒政策都可以通知您出现异常行为,以便您解决相应问题。

如果您同时有按提取的字节数计费的指标和按提取的样本数计费的指标,则需要为这两种结算值分别创建提醒政策。

如需创建用于监控指标收集速率的提醒政策,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。
  3. 在注入的字节或样本的统计信息摘要图表上,点击查看图表
  4. 在要监控数据的图表中,点击创建提醒政策

    系统会打开提醒政策对话框,其中的条件字段已填充。我们建议您检查所有设置,并进行以下修改:

    • 更新条件阈值。默认值可能不太理想。
    • 将通知渠道添加到政策中。
    • 为政策命名。

    如需了解详情,请参阅创建提醒政策

调查指标存在的问题

您可以使用指标管理页面调查可结算指标的结构或使用方面的问题。例如,您可能会遇到以下问题:

  • 可归因于特定指标的可结算量增加。
  • 报告特定指标的查询延迟时间增加。
  • 写入指标数据时出错,这可能是因为写入数据量或速率达到了限制。

写入指标数据时出现错误可能与其他问题相关,例如可结算交易量意外增加或查询延迟时间增加。例如,更改指标的配置可能会导致基数问题,这可能会影响提取的数据量和查询延迟时间,也可能会导致指标写入错误。

查看指标写入错误

指标写入错误计分卡中,您可以执行以下操作:

  • 查看指标写入请求的状态。
  • 创建提醒政策,以便在指标写入错误率超过阈值值时通知您。
  • 查看指标写入错误的审核日志(如果您已启用审核日志)。 这些日志可以深入了解指标写入错误的原因。

如需查看与写入指标数据时出错有关的信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。
  3. 指标写入错误率计分卡上,点击查看错误

    • 如需查看 Cloud Monitoring API 指标写入请求的状态,请使用 API - 创建时间序列(状态代码)图表。此图显示了对 timeSeries.create 方法的调用。

      每个时序显示特定 HTTP 状态代码的写入速率。如果图表针对 2xx 状态结果显示一条线,则表示没有指标写入错误。以下屏幕截图显示了 2xx 状态结果以及少量 4xx 和 5xx 状态结果:

      “指标写入错误”图表显示写入时间序列数据的错误率。

      如果您发现指标写入请求数量增加,则可能存在基数问题。

    • 如果图表显示了错误的状态代码,并且您已为项目启用审核日志,则可以使用这些日志来调查错误的原因。日志的预配置查询会查找与 Monitoring API 方法 timeSeries.create 相关的错误。系统会在每次写入指标时调用此方法。

      timeSeries.create 错误的日志可以让您详细了解错误状态代码的原因。例如,如果您尝试一次性写入太多数据,或者超出有效时序数限制,该方法可能会失败。如需了解详情,请参阅“监控配额”文档中的用户定义的指标部分。

调查指标创建错误

与可能失败的指标相关的另一种方法是 metricDescriptors.create 方法。当您首次为新指标写入时间序列数据时,或者更改指标数据的结构(最有可能是添加新标签)时,系统会调用 metricDescriptors.create 方法。您可以通过指标表中每个指标的条目查看此方法产生的错误的审核日志。

如需查看特定指标的审核日志,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。
  3. 在表格中找到相应指标,然后点击  操作
  4. 选择查看指标审核日志

    针对日志的预配置查询会查找与 Monitoring API 方法 metricDescriptors.create 相关的错误。

metricDescriptors.create 方法中的错误有助于您找出指标设计中可能存在的问题。如果您超出允许的指标描述符数量或指标描述符中的标签数量,可能会看到此方法产生的错误。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

可计费指标的价格模式

一般来说,Cloud Monitoring 系统指标是免费的,而来自外部系统或应用的指标则需要付费。可计费指标按注入的字节数或样本数计费。本部分介绍基于字节和基于样本的提取。

如需详细了解 Cloud Monitoring 中的付费功能,请参阅价格文档中的 Cloud Monitoring。如需了解价格信息,请参阅 Cloud Monitoring 价格摘要

按注入的字节或样本数结算

可计费指标按字节数或提取的样本数收费。每次写入指标时,写入操作都会包含数据值。数据值可以是标量(例如整数或浮点数),也可以是分布,即包含多个不同值的复杂数据类型。如需详细了解指标可能会写入的值类型,请参阅值类型

无论是指标的写入频率(即采样率)还是指标写入的数据类型(标量或分布),都会影响提取的数据量,无论是按提取的字节还是按提取的样本收费。

  • “提取的字节数”是指费用取决于提取的数据量(以字节为单位)。为便于计算费用,每个标量值均计为 8 字节,每个分布均计为 80 字节。如需了解详情和示例,请参阅按提取的字节数计费的指标

  • “注入的样本数量”是指费用根据注入的测量数据数量计算。为了便于计费,每个标量值都算作一个样本,每个分布都算作两个样本,对于具有非零计数的每个直方图存储桶,再加 1。如需了解详情和示例,请参阅按注入的样本数收费的指标

这两种定价模式最大的区别在于分布值。基于字节的提取方式对分布采用固定费率,但基于样本的提取方式会考虑分布中的数据;与具有稠密直方图(即具有非零值的直方图存储分区较少)的分布相比,具有稀疏直方图(即具有非零值的直方图存储分区较多)的分布计为的样本数量较少。

指标管理页面上的可结算指标

指标管理页面会按网域报告计费指标。通过网域,您可以了解指标的收集方式和来源。

下表介绍了指标管理页面上提供的可计费指标类别,以及这些指标是按传入的字节还是样本进行衡量的:

网域 指标前缀 定价模式 含义
代理 agent.googleapis.com 字节 代理从外部资源收集的指标。 如需查看这些指标的列表,请参阅 Ops Agent 指标旧版 Monitoring 和 Logging 指标。 旧版 Monitoring 代理收集的第三方集成指标也会报告为“代理”指标;请参阅第三方应用指标

agent.googleapis.com/processes/ 指标的费率为其他收费指标的 5%。 例如,提取 100 MiB 的进程指标的费用与提取其他 5 MiB 的收费指标相同。

代理还会收集有关自身的指标。这些指标以 agent.googleapis.com/agent 为前缀,不计费,也不会显示在指标管理页面上。

用户定义的自定义 custom.googleapis.com 字节 您定义的指标。
外部 external.googleapis.com 字节 来自某些开源库或第三方提供商的指标。 如需了解详情,请参阅外部指标
工作负载 workload.googleapis.com 字节 Ops Agent 写入的第三方集成指标。 如需查看这些指标的列表,请参阅第三方应用指标
Prometheus prometheus.googleapis.com 示例 使用 Google Cloud Managed Service for Prometheus 或使用 Ops Agent 和 Prometheus 接收器OTLP 接收器收集的指标。

其他可结算费用的指标

指标管理页面不会报告用户定义的基于日志的指标。这些指标通过统计日志条目中的值派生而来,前缀为 logging.googleapis.com/user。用户定义的基于日志的指标按提取的字节数计费。

后续步骤