Cloud Monitoring 配额和限制

本文档列出了适用于 Cloud Monitoring 的配额和系统限制。

配额用于指定您可以使用的可计数共享资源的数量。配额由 Cloud Monitoring 等 Google Cloud 服务定义。
系统限制是无法更改的固定值。

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型，包括硬件、软件和网络组件。例如，配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载，从而保护Google Cloud 用户社区。配额还可以帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作：

监控 Google Cloud 产品和服务的消耗情况
限制这些资源的消耗量
提供一种请求更改配额值和自动调整配额的方法

在大多数情况下，当您尝试消耗的资源超出其配额允许的范围时，系统会阻止对资源的访问，并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中，配额在所有应用和 IP 地址间共享。

如需调整大多数配额，请使用 Google Cloud 控制台。如需了解详情，请参阅申请配额调整。

Monitoring 资源也有系统限制。系统限制不能更改。

用户定义的指标

Cloud Monitoring 指标管理页面提供的信息可帮助您控制在收费指标上支出的金额，而不会影响可观测性。指标管理页面报告以下信息：

针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
有关标签和指标基数的数据。
每个指标的读取次数。
指标在提醒政策和自定义信息中心内的使用。
指标写入错误率。

您还可以使用指标管理来排除不需要的指标，从而免除注入这些指标的费用。如需详细了解指标管理页面，请参阅查看和管理指标使用情况。

类别	最大值
每个项目的自定义指标描述符数量 ¹	10000
每个自定义、外部和工作负载指标描述符的标签	30
每个 Prometheus 指标描述符的标签数量	200
标签键的字符串长度	100
标签值的字符串长度	1024
一个写入请求中包含的时序数量 ²	200
向单个时间序列写入数据的速率³	每 5 秒 1 个数据点
每个自定义分布指标的直方图分桶数量	200
每个项目的工作负载、Prometheus 和外部⁴指标描述符数量	25000
每项受监控资源的自定义指标中活跃的时间序列数量⁵	200,000
每项受监控资源的工作负载指标中活跃的时间序列数量⁵	200,000
每项受监控资源的 Prometheus 中活跃的时间序列数量⁵	100 万
每项受监控资源的外部指标中活跃的时间序列数量⁵	200,000
可创建指标描述符的速率	每个项目每分钟 6,000 次

¹ 这是 Cloud Monitoring 施加的限制，其他服务施加的限制值可能会更低。自定义指标是写入 custom.googleapis.com 的指标。
² 您在一个请求中只能为每个时序写入一个数据点，因此该限制也是每个请求可写入的数据点最大数量。
³ Cloud Monitoring API 要求各个数据点写入时间序列的结束时间的间隔至少为 5 秒。您可以将数据点批量写入时间序列，前提是这些数据点是按顺序写入的。
⁴ 外部指标是指那些写入 external.googleapis.com 的指标，
⁵ 如果您在过去 24 小时内向某时间序列写入过数据点，则该时间序列便处于活跃状态。该行中指定的限制是该行内所有用户定义指标（自定义、工作负载、Prometheus 或外部）的单个受监控资源（例如单个 gce_instance 虚拟机或单个 k8s_container 容器）的活跃时间序列总数。global 受监控资源例外，该类资源的每种用户定义指标均单独应用此限制。这是系统范围的安全限制，不可自定义。

Monitoring API 配额和限制

类别最大值

API 用量限制

类别	最大值
API 用量限制	如需查找 API 配额和限制，请执行以下操作之一：在 Google Cloud 控制台中，进入配额信息中心页面。在 Cloud Shell 中，运行 `gcloud alpha services quota list` 命令。
API 页面令牌有效期	24 小时

如需查找 API 配额和限制，请执行以下操作之一：

在 Google Cloud 控制台中，进入配额信息中心页面。
在 Cloud Shell 中，运行 gcloud alpha services quota list 命令。

API 页面令牌有效期 24 小时

Monitoring API 配额简介

Monitoring API 对时间序列提取请求和时间序列查询的速率设有配额限制。提取请求是指写入时间序列数据的调用，查询是指检索时间序列数据的调用。其他 Monitoring API 端点还设有内部限制，这些端点并非用于处理高速率请求。

为了减少您的服务写入时序数据时发出的 API 请求数，请使用一个 API 请求为多个时序写入数据。建议您每个请求至少写入 10 个对象。如需详细了解如何批处理 API 请求，请参阅 timeSeries.create。

如果在批量处理 API 请求后仍需更高的 Monitoring API 配额上限，请联系Google Cloud 支持团队。

其他限制是固定的，详情请参见本页中的介绍。

如需了解详情，请访问使用配额。

数据保留

超过保留期限的指标数据点会从时间序列中删除。

类别	值
自定义、外部和代理指标类型的数据点的保留期，其中包括：自定义指标，前缀为 `custom.googleapis.com` 来自 Google Cloud Managed Service for Prometheus 的指标，前缀为 `prometheus.googleapis.com`² 代理指标，前缀为 `agent.googleapis.com`，其中包括 `processes/count_by_state` 和 `processes/fork_state`。其余 `processes` 指标的保留期不同；请参阅以下内容。外部指标，前缀为 `external.googleapis.com` OpenTelemetry 和其他工作负载指标，前缀为 `workload.googleapis.com`	24 个月¹
以下进程运行状况指标类型的数据点的保留期：`agent.googleapis.com/processes` （`count_by_state` 和 `fork_state` 除外），如先前条目所述。	24 小时
某些 Google Cloud 服务的数据点保留期，包括以下类别中的大多数指标： Compute Engine 指标，前缀为 `compute.googleapis.com` GKE 和 GKE Enterprise 指标，前缀为 `kubernetes.io` Cloud Storage 指标，前缀为 `storage.googleapis.com` BigQuery 指标，前缀为 `bigquery.googleapis.com` Cloud SQL 指标，前缀为 `cloudsql.googleapis.com` 内部、https 和 L7 负载均衡器指标，前缀为 `loadbalancing.googleapis.com`	24 个月¹
所有其他指标类型的数据点的保留期，其中包括：所有其他Google Cloud 指标 Istio 指标 AWS 指标基于日志的指标	6 周
API 页面令牌有效期	24 小时

¹ 指标数据会按照原始采样频率存储 6 周时间，随后会将采样频率降至 10 分钟一次并长期存储。
² Google Cloud Managed Service for Prometheus 指标数据将以原始采样频率存储 1 周，随后 5 周内降采样至每分钟一次，再降采样至每 10 分钟一次进行长期存储。

资源组

类别	值
每个指标范围的资源组数	500
一份电子邮件报告中包含的资源组数量上限 ¹	10

¹ 配置 Cloud Monitoring 电子邮件报告时，您可以请求显示自己的资源组利用率信息。由于电子邮件报告工具的限制，生成的报告仅包含 10 个资源组的信息。

受监控的项目限制

Cloud Monitoring 正式支持每个指标范围内最多 375 个 Google Cloud 项目。

每个指标范围最多可添加 3,500 个 Google Cloud 项目，但在查询用户定义指标或历史数据时可能会出现性能问题。Cloud Monitoring 仅对每个指标范围内的前 375 个 Google Cloud 项目保证查询和图表性能。

如需提高 Google Cloud 项目/指标范围配额，您可以申请增加“受监控的项目/Monitoring 指标范围”配额。如需了解详情，请参阅有关管理配额的文档。

有关创建和更新指标描述符的限制

Cloud Monitoring 会对创建新指标、向现有指标添加新标签名称以及删除指标的操作强制执行每分钟速率限制。此速率限制通常仅在首次与 Cloud Monitoring 集成时才会达到，例如，迁移现有的成熟 Prometheus 部署到 Cloud Monitoring。这不是注入数据点的速率限制。此速率限制仅在创建全新指标或向现有指标添加新标签名称时适用。

此配额是固定的，但在新指标和指标标签的创建达到每分钟限制时，任何问题都会自动解决。

提醒方面的限制

类别	值	政策类型¹
每个指标范围的提醒政策（指标和日志的总和）²	500	指标、日志
每项基于指标的提醒政策的条件数量	6	指标
每个基于 SQL 的提醒政策可包含的条件数量（公开预览版）	1	SQL
基于 SQL 的提醒政策的查询执行时间上限（公开预览版）	5 分钟	SQL
指标缺失条件评估的最长时间段³	1 天	指标
指标阈值条件评估的最长时间段³	23 小时 30 分钟	指标
在指标阈值条件中使用的过滤条件的长度上限	2,048 个 Unicode 字符	指标
最多由预测条件监控的时序数	64	指标
最短预测时段	1 小时（3,600 秒）	指标
预测时段上限	2.5 天（216,000 秒）	指标
每项提醒政策的通知渠道数量	16	全部
基于日志的提醒的突发事件率上限⁴	每 5 分钟发生 1 起突发事件	日志
基于日志的提醒的突发事件数量上限	每个基于日志的提醒政策每天 20 起突发事件	日志
基于日志的提醒的每个突发事件的通知数量上限为 ⁵	每天每起突发事件 20 条通知	日志
每个项目同时触发的提醒政策数量上限	80,000	全部
每项提醒政策同时打开的突发事件数量上限	1000	全部
无新数据突发事件的自动关闭期	7 天	指标、SQL
非手动关闭的突发事件最长持续时间	7 天	日志
已关闭的突发事件的保留期限	13 个月	不适用
未结突发事件的保留期限	无限期	不适用
每个指标范围的通知渠道	4000	不适用
每个稍后提醒的提醒政策数量上限	16	全部
稍后提醒的保留期限	13 个月	不适用

¹指标：基于指标数据的提醒政策；日志：基于日志消息的提醒政策（基于日志的提醒）
²Apigee 和 Apigee Hybrid 与 Cloud Monitoring 深度集成。所有 Apigee 订阅层级（标准版、企业版和企业加强版）的提醒限制与 Cloud Monitoring 相同，即每个指标范围 500 个。
³条件评估的最长时间段是校准时间段和时长窗口值的总和。例如，如果将校准时间段设置为 15 小时，并将时长窗口设置为 15 小时，则需要 30 小时的数据来评估条件。
⁴如果基于日志的提醒政策的查询提取标签值，则提取的每个值组合都代表自己的事件时间轴。例如，假设基于日志的提醒政策会提取标签的值，并且该标签可以有两个值。在同一 5 分钟时间窗口内可创建两个事件，每个标签值各一个。
⁵对于基于日志的提醒，如果收到与过滤条件匹配的日志条目，并且自上次通知发出以来至少已过去 5 分钟，Monitoring 会为未解决的事件发送新通知。每次突发事件每天最多发送 20 条通知。系统会将每条通知发送到为提醒政策配置的所有通知渠道。

短信数量限制

短信数量上限以 24 小时的滚动窗口为周期。

类别	值
短信验证码数量	40
每个电话号码的短信验证码数量	5
短信提醒消息数量	2500
每个手机号码收到的短信提醒数量	200

合成监控的限制

类别	值
每个指标范围的拨测^*	100
每个公共拨测的 ICMP ping 数量上限	3
每个指标范围的合成监控工具	100^†

^*此限制适用于拨测配置的数量。每个拨测配置包括指定资源两次状态测试之间相隔的时间。
^†如需了解如何提高此限制，请参阅使用 Google Cloud 控制台管理配额。

图表绘制限制

类别	值
每个指标范围的信息中心	1000
每个信息中心内的图表数量	100
信息中心版本记录保留期限	90 天
每个图表中的线条数量	50^*
表中的行	300

^*系统出于性能方面的原因而应用此限制。如果要绘制的时序超过 50 个，工具栏中会添加一个标有红点的图标。该图标的提示显示消息 To improve performance, we've limited the time series displayed in this chart。如需显示所有时序，请展开提示，然后选择标有显示所有时序的按钮。

服务等级目标

类别	值
每项服务的 SLO 数量	500

Cloud Monitoring 配额和限制 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。