Cloud Monitoring 配额和限制

本文档列出了适用于 Cloud Monitoring 的配额和系统限制。

  • 配额用于指定您可以使用的可计数共享资源的数量。配额由 Cloud Monitoring 等 Google Cloud 服务定义。
  • 系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的 Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护 Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

  • 监控 Google Cloud 产品和服务的消耗情况
  • 限制这些资源的消耗量
  • 提供请求更改配额值的方法

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

如需调整大多数配额,请使用 Google Cloud 控制台。如需了解详情,请参阅申请配额调整

Monitoring 资源也有系统限制。系统限制不能更改。

用户定义的指标

Cloud Monitoring 指标管理页面提供的信息可帮助您控制在收费指标上支出的金额,而不会影响可观测性。指标管理页面报告以下信息:

  • 针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
  • 有关标签和指标基数的数据。
  • 每个指标的读取次数。
  • 指标在提醒政策和自定义信息中心内的使用。
  • 指标写入错误率。

您还可以使用指标管理排除不需要的指标,从而降低提取这些指标的费用。 如需详细了解指标管理页面,请参阅查看和管理指标使用情况

类别 上限
每个项目的自定义指标描述符数量 1 1 万
每个指标描述符的标签数量 30
标签键的字符串长度 100
标签值的字符串长度 1024
一个写入请求中包含的时间序列数量2 200
向单个时间序列写入数据的速率3 每 5 秒 1 个数据点
每个自定义分布指标的直方图分桶数量 200
每个项目的工作负载、Prometheus 和外部4指标描述符数量 25000
每项受监控资源的自定义指标中活跃的时间序列数量5 20 万
每项受监控资源的工作负载指标中活跃的时间序列数量5 20 万
每项受监控资源的 Prometheus 中活跃的时间序列数量5 100 万
每项受监控资源的外部指标中活跃的时间序列数量5 200000
可创建指标描述符的速率 每个项目每分钟 6,000 次

1 这是 Cloud Monitoring 施加的限制,其他服务施加的限制值可能会更低。自定义指标是指写入 custom.googleapis.com 的指标。
2 您在一个请求中只能为每个时序写入一个数据点,因此该上限也是每个请求可写入的最大数据点数量。
3 Cloud Monitoring API 要求各个数据点写入时序的结束时间的间隔至少为 5 秒。您可以将数据点批量写入时间序列,前提是这些数据点是按顺序写入的。
4 外部指标是指那些写入 external.googleapis.com 的指标,
5如果您在过去 24 小时内向某时序写入过数据点,则该时序便处于活跃状态。 该行中指定的限制是该行内所有用户定义指标(自定义、工作负载、Prometheus 或外部)的单个受监控的资源(例如单个 gce_instance 虚拟机或单个 k8s_container 容器)的活跃时序总数。global 受监控的资源例外,该类资源的每种用户定义指标均单独应用此限制。这是系统范围的安全限制,不可自定义。

Monitoring API 配额和限制

类别 上限
API 用量限制

如需查找 API 配额和限制,请执行以下操作之一:

API 页面令牌有效期 24 小时

Monitoring API 配额简介

Monitoring API 对时间序列提取请求和时间序列查询的速率设有配额限制。提取请求是指写入时间序列数据的调用,查询是指检索时间序列数据的调用。其他 Monitoring API 端点还设有内部限制,这些端点并非用于处理高速率请求。

为了减少您的服务写入时序数据时发出的 API 请求数,请使用一个 API 请求为多个时序写入数据。建议您每个请求至少写入 10 个对象。如需详细了解如何批处理 API 请求,请参阅 timeSeries.create

如果您在批量处理 API 请求后,仍需要更高的 Monitoring API 配额限制,请与 Google Cloud 支持团队联系。

其他限制是固定的,详情请参见本页中的介绍。

如需了解详情,请访问使用配额

数据保留

超过保留期限的指标数据点会从时间序列中删除。

类别
自定义、外部和代理指标类型的数据点的保留期,其中包括:
  • 自定义指标,前缀为 custom.googleapis.com
  • 来自 Google Cloud Managed Service for Prometheus 的指标,前缀为 prometheus.googleapis.com2
  • 代理指标,前缀为 agent.googleapis.com,其中包括
    processes/count_by_stateprocesses/fork_state
    其余 processes 指标的保留期不同;请参阅以下内容。
  • 外部指标,前缀为 external.googleapis.com
  • OpenTelemetry 和其他工作负载指标,前缀为 workload.googleapis.com
24 个月1
以下进程运行状况指标类型的数据点的保留期:agent.googleapis.com/processes
count_by_statefork_state 除外),如先前条目所述。
24 小时
部分 Google Cloud 服务的数据点保留期,包括以下类别中的大多数指标:
  • Compute Engine 指标,前缀为 compute.googleapis.com
  • GKE 和 GKE Enterprise 指标,前缀为 kubernetes.io
  • Cloud Storage 指标,前缀为 storage.googleapis.com
  • BigQuery 指标,前缀为 bigquery.googleapis.com
  • Cloud SQL 指标,前缀为 cloudsql.googleapis.com
  • 内部、HTTPS 和 L7 负载均衡器指标,前缀为 loadbalancing.googleapis.com
24 个月1
所有其他指标类型的数据点的保留期,其中包括: 6 周
API 页面令牌有效期 24 小时

1 指标数据会按照原始采样频率存储 6 周时间,随后会将采样频率降至 10 分钟一次并长期存储。
2 Google Cloud Managed Service for Prometheus 指标数据会按照原始采样频率处存储 1 周时间,则在接下来的 5 周内按 1 分钟一次的频率进行采样,然后以 10 分钟一次的频率进行降采样,以延长存储时间。

资源组

类别
每个指标范围 的资源组数 500
一份电子邮件报告中包含的资源组数量上限 1 10

1 配置 Cloud Monitoring 电子邮件报告时,您可以请求显示自己的资源组利用率信息。由于电子邮件报告工具的限制,生成的报告仅包含 10 个资源组的信息。

受监控的项目限制

Cloud Monitoring 为每个指标范围正式支持多达 375 个 Google Cloud 项目。

每个指标范围最多可以添加 1,000 个 Google Cloud 项目,但您可能会遇到性能问题,尤其是在查询自定义指标或历史数据时。Cloud Monitoring 仅保证每个指标范围内最多 375 个 Google Cloud 项目的查询和图表能够高效运行。

如需提高“每个指标范围的 Google Cloud 项目数”配额,您可以申请提高“受监控的项目数 / 监控指标范围”配额。如需了解详情,请参阅有关管理配额的文档。

有关创建和更新指标描述符的限制

Cloud Monitoring 会对创建新指标、向现有指标添加新标签名称以及删除指标施加每分钟速率限制。此速率限制通常仅在首次与 Cloud Monitoring 集成时才会达到,例如,将现有的成熟 Prometheus 部署迁移到 Cloud Monitoring。这不是注入数据点的速率限制。此速率限制仅在创建全新指标或向现有指标添加新标签名称时适用。

此配额是固定的,但在新指标和指标标签的创建达到每分钟限制时,任何问题都会自动解决。

提醒方面的限制

类别 政策类型1
每个指标范围的提醒政策(指标和日志的总和)2 500 指标、日志
每项基于指标的提醒政策的条件数量 6 指标
每个基于 SQL 的提醒政策的条件(公开预览版) 1 SQL
指标缺失条件评估的
最长时间段3
1 天 指标
指标阈值条件评估的
最长时间段3
23 小时 30 分钟 指标
指标阈值条件中使用的过滤条件的长度上限
2,048 个 Unicode 字符 指标
一个预测条件监控的时序的数量上限
64 指标
最短预测时段 1 小时(3,600 秒) 指标
预测时段上限 2.5 天(216,000 秒) 指标
每项提醒政策的通知渠道数量 16 指标、日志
通知率上限4 每项基于日志的提醒政策每 5 分钟 1 条通知 日志
通知数上限 每个基于日志的提醒政策每天 20 条通知 日志
每项提醒政策同时打开的突发事件数量上限
1000 指标
无新数据突发事件的
自动关闭期
7 天 指标
非手动关闭的突发事件最长持续时间 7 天 日志
已关闭的突发事件的保留期限 13 个月 不适用
未结突发事件的保留期限 无限期 不适用
每个指标范围的通知渠道 4000 不适用
每次延迟提醒时可设置的提醒政策数量上限 16 指标、日志
延后提醒的保留 13 个月 不适用
1指标:基于指标数据的提醒政策;日志:基于日志消息的提醒政策(基于日志的提醒)
2ApigeeApigee Hybrid 与 Cloud Monitoring 深度集成。所有 Apigee 订阅层级(标准版、企业版和企业加强版)的提醒限制与 Cloud Monitoring 相同,即每个指标范围 500 个。
3条件评估的最长时间段是校准时间段和时长窗口值的总和。例如,如果将校准时间段设置为 15 小时,并将时长窗口设置为 15 小时,则需要 30 小时的数据来评估条件。
4如果基于日志的提醒政策的查询会提取标签值,则提取的每个值组合都代表自己的通知时间轴。例如,假设基于日志的提醒政策会提取标签的值。假设标签可以有两个值。采用此配置后,您可能会在同一 5 分钟内收到两个通知,每个标签值对应一个通知。

合成监控工具的限制

类别
每个指标范围 的正常运行时间检查次数* 100
每个公开正常运行情况检查的 ICMP ping 数量上限 3
每个指标范围 的合成监控工具 100
*此限制适用于正常运行时间检查配置的数量。每个正常运行时间检查配置包括指定资源两次状态测试之间相隔的时间。
如需了解如何提高此限制,请参阅使用 Google Cloud 控制台管理配额

图表绘制限制

类别
每个指标范围的信息中心 1000
每个信息中心内的图表数量 40
每个图表中的线条数量 50*
表中的行 300
*出于性能方面的原因,系统会应用此限制。如果要绘制的时序图表超过 50 个,工具栏中会添加一个带有红点的图标。该图标的提示会显示消息 To improve performance, we've limited the time series displayed in this chart。如需显示所有时序,请展开提示,然后选择标记为显示所有时序的按钮。

服务等级目标

类别
每项服务的 SLO 数量 500