本页面列出了 Memorystore for Valkey 可用的 Cloud Monitoring 指标,并介绍了每个指标所测量的内容。
Cloud Monitoring 指标
实例级指标
这些指标可简要概括实例的整体健康状况和性能。这些图表可帮助您了解实例的总体容量和利用率,并找出潜在的瓶颈或需要改进的方面。
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
实例中所有节点的平均当前客户端连接数。 |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
实例中单个节点的当前客户端连接数上限。 |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
实例中单个节点的客户端连接的最长持续时间。 |
memorystore.googleapis.com/instance/clients/total_connected_clients |
当前与实例建立的客户端连接数。 |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
过去一分钟内创建的实例级客户端连接总数。 |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
因达到 maxclients 上限而遭拒的连接数。 |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
每个命令消耗的总时间。 |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
相应命令在一分钟内的调用总次数。 |
memorystore.googleapis.com/instance/cpu/average_utilization |
实例中所有节点的平均 CPU 利用率,范围为 0.0 到 1.0。 |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
实例中单个节点的最大 CPU 利用率,范围为 0.0 到 1.0。 |
memorystore.googleapis.com/instance/stats/average_expired_keys |
实例中所有节点的主节点的平均键过期事件数。 |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
实例中单个节点在主节点上的键过期事件的最大数量。 |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
实例中所有节点的主节点的键过期事件总数。 |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
实例中所有节点的主节点因内存容量而逐出的键的平均数量。 |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
因主节点的内存容量而逐出的键的最大数量。 |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
实例中所有节点的主节点因内存容量而逐出的键的数量。 |
memorystore.googleapis.com/instance/keyspace/total_keys |
实例中存储的键数量。 |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
实例中所有节点上键查找成功的平均次数。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
实例中单个节点的键查找成功次数上限。 |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
相应实例的键查找成功次数。 |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
实例中所有节点上键查找失败的平均次数。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
实例中单个节点的键查找失败次数上限。 |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
相应实例的键查找失败总次数。 |
memorystore.googleapis.com/instance/memory/average_utilization |
实例中所有节点的平均内存利用率。值介于 0.0 到 1.0 之间。 |
memorystore.googleapis.com/instance/memory/maximum_utilization |
实例中单个节点的最大内存利用率,范围为 0.0 到 1.0。 |
memorystore.googleapis.com/instance/memory/total_used_memory |
实例的总内存用量。 |
memorystore.googleapis.com/instance/memory/size |
实例的内存大小。 |
memorystore.googleapis.com/instance/replication/average_ack_lag |
实例中所有节点的副本的平均复制延迟时间(以秒为单位)。 复制延迟时间(以秒为单位)表示副本滞后于主实例的程度。 |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
实例中单个副本的复制确认最大延迟时间(以秒为单位)。 复制确认延迟时间(以秒为单位)表示复制确认滞后于主实例的时间。 |
memorystore.googleapis.com/instance/replication/average_offset_diff |
实例中所有节点的平均复制确认偏移差(以字节为单位)。 复制确认偏移差是指副本与其主实例之间尚未复制的字节数。 |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
实例中单个节点的最大复制偏移差(以字节为单位)。 复制偏移差是指副本与其主实例之间尚未复制的字节数。 |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
实例端点接收的传入网络字节数。 |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
从实例端点发送的传出网络字节数。 |
节点级指标
这些指标可让您详细了解实例中各个节点的运行状况和性能。它们可帮助您排查节点问题并优化节点性能。
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
连接到实例节点的客户端数量。 |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
实例节点屏蔽的客户端连接数。 |
memorystore.googleapis.com/instance/node/server/uptime |
实例节点的正常运行时间。 |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Memorystore for Valkey 在实例节点上于过去一分钟内创建的客户端连接数。 |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
因实例节点达到 `maxclients` 上限而被 Memorystore for Valkey 拒绝的连接数。 |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
实例节点中每个命令消耗的时间。 |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
实例节点上相应命令在一分钟内的调用次数。 |
memorystore.googleapis.com/instance/node/cpu/utilization |
实例节点的 CPU 利用率(范围为 0.0 到 1.0)。 |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
实例节点中的过期事件数量。 |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
实例节点逐出的键的数量。 |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Memorystore for Valkey 存储在实例节点中的键数量。 |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
实例节点中键查找成功的次数。 |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
实例节点中键查找失败的次数。 |
memorystore.googleapis.com/instance/node/memory/utilization |
实例节点的内存利用率(范围为 0.0 到 1.0)。 |
memorystore.googleapis.com/instance/node/memory/usage |
实例节点的内存用量。 |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
实例节点接收的传入网络字节数。 |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
实例节点发送的传出网络字节数。 |
memorystore.googleapis.com/instance/node/replication/offset |
实例节点的复制偏移字节数。 |
memorystore.googleapis.com/instance/node/server/healthy |
确定实例节点是否可用且运行正常。 此指标目前为预览版。 |
跨区域复制指标
本部分列出了用于跨区域复制的指标。
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
此指标显示主实例与次要实例之间的分片链接数量。在跨区域复制组中,主实例会报告其与组中次要实例之间的跨区域复制链接数量。对于每个次要实例,此数字应等于分片数。如果该数量降至分片数量以下,则此指标会标识复制器与跟随者之间停止复制时的分片数量。在理想状态下,此指标的值与主实例的分片数相同。 |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
此指标显示主分片和次分片之间的最大复制偏移差。 |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
此指标显示主分片和次分片之间的平均复制偏移差。 |
备份指标
实例级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
上次备份操作的开始时间。 |
memorystore.googleapis.com/instance/backup/last_backup_status |
上次备份操作的状态。状态为 1 (成功)和 0 (失败)。 |
memorystore.googleapis.com/instance/backup/last_backup_duration |
上次备份操作的持续时长(以毫秒为单位)。 |
memorystore.googleapis.com/instance/backup/last_backup_size |
上次备份的大小(以字节为单位)。 |
memorystore.googleapis.com/instance/import/last_import_start_time |
上次导入操作的开始时间。 |
memorystore.googleapis.com/instance/import/last_import_duration |
上次导入操作的持续时长(以毫秒为单位)。 |
持久性指标
本部分列出了持久性指标,并提供了持久性指标的示例使用情形。
RDB 持久性指标
实例级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
从整个实例中加载 AOF 或 RDB 持久化数据的累计次数。 |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
实例拍摄 RDB 快照(也称为“保存”)的累计次数。此指标具有 status_code 字段。如需检查快照是否失败,您可以过滤 status_code 字段,查找以下错误:3 - INTERNAL ERROR 。 |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
实例中所有节点的分布快照年龄。您希望看到分布中的值具有比快照频率更短(或相同)的滞后时间。 |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
因无法持久保留而遭拒的写入命令在整个实例中的累计数量。 |
节点级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
实例节点上正在进行 RDB BGSAVE 。TRUE 表示正在保存。 |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
实例节点上上次 BGSAVE 的成功情况。TRUE 表示成功执行了 BGSAVE 。如果未出现 bgrewrite ,则值可能会默认为 TRUE 。 |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
此指标显示在实例节点上运行的 RDB 保存的累计次数。 |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
自上次成功截取快照以来经过的时间(以秒为单位)。 |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
距离下一次截取快照剩余的时间(以秒为单位)。 |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
在实例节点上运行的 RDB 保存中的键数量。 |
AOF 持久性指标
实例级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
此指标显示了实例中所有节点的延迟(从数据写入到持久存储同步)分布。仅针对 appendfsync=everysec 的实例发出。理想情况下,您希望看到分布中的值小于(或等于)AOF 同步频率。 |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
此指标显示的是实例中节点触发 AOF 重写的累计次数。此指标具有 status_code 字段。如需检查 AOF 重写是否失败,您可以过滤 status_code 字段,查找以下错误:3 - INTERNAL_ERROR |
节点级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
此指标显示实例节点上最近一次 AOF 写入操作的成功情况。TRUE 表示成功,如果未发生写入,该值可能默认为 TRUE。 |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
此指标表示实例节点中上次 AOF 后台重写操作是否成功。TRUE 表示成功,如果未发生任何后台重写,该值可能默认为 TRUE。 |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
此指标显示了实例节点中内存与持久性存储之间的 AOF 延迟。仅适用于启用了 AOF 且 appendfsync=EVERYSEC 的实例 |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
此指标显示实例节点中的 AOF 重写次数。如需检查 AOF 重写是否失败,您可以过滤 status_code 字段,查找以下错误:3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
此指标显示 AOF fsync() 调用错误的数量,仅适用于启用了 AOF 且 appendfsync=EVERYSEC|ALWAYS 的实例。 |
常见持久性指标
适用于 AOF 和 RDB 持久化机制的指标。
节点级指标
指标名称 | 说明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
此指标显示从转储文件(AOF 或 RDB)恢复的次数。如需检查恢复是否失败,您可以过滤 status_code 字段,查找以下错误:2 - INTERNAL_ERROR |
持久性指标的示例使用场景
检查 AOF 写入操作是否会导致延迟和内存压力
假设您检测到实例或实例中的节点延迟时间增加或内存用量增加。在这种情况下,您可能需要检查额外用量是否与 AOF 持久性相关。
由于您知道 AOF 重写操作可能会触发瞬时负载峰值,因此可以检查 aof_rewrites_count
指标,该指标可提供实例或实例内节点的整个生命周期内的 AOF 重写累计次数。假设此指标显示,重写次数的增加与延迟时间的增加相对应。在这种情况下,您可以通过降低写入速率或增加分片数量来减少重写频率,从而解决此问题。
检查 RDB 保存操作是否会导致延迟和内存压力
假设您检测到实例或实例中的节点延迟时间增加或内存用量增加。在这种情况下,您可能需要检查额外用量是否与 RDB 持久性相关。
由于您知道 RDB 保存操作可能会触发瞬时负载峰值,因此可以检查 rdb_saves_count
指标,该指标会给出实例或实例内节点的整个生命周期内 RDB 保存的累计次数。假设此指标显示,RDB 保存次数的增量与延迟时间的增加相对应。在这种情况下,您可以缩短 RDB 快照间隔,以降低重写频率。您还可以扩缩实例,以降低基准负载水平。
解读 Memorystore for Valkey 的指标
如上表所示,许多指标都具有三个共同的类别:平均值、最大值和总值。
对于 Memorystore for Valkey,我们提供同一指标的平均值和最大值变体,以便您同时使用这两个变体来识别相应指标系列的热点。
指标的总计值是独立的,可提供与平均值和最大值的热点分析用途无关的单独数据洞见。
了解平均指标和最大指标
假设您要比较实例的 average_keyspace_hits
和 maximum_keyspace_hits
值。这两个指标之间的差值越大,表示您的实例中命中次数的热点效应越明显。理想情况下,您应该有一个介于 average_keyspace_hits
和 maximum_keyspace_hits
之间的接近值,因为这表示命中次数在您的实例中分布得更均匀。
此原则适用于所有具有相同指标的平均值和最大值变体的指标。
热点示例
如果您比较实例中所有分片的 average_keyspace_hits
和 maximum_keyspace_hits
,则比较这些值可以指示热点发生的位置。例如,假设一个包含 6 个分片的实例中的分片具有以下命中次数:
- 分片 1 - 2 次命中
- 分片 2 - 2 次命中
- 分片 3 - 2 次命中
- 分片 4 - 2 次命中
- 分片 5 - 2 次命中
- 分片 6 - 8 命中次数
在此示例中,average_keyspace_hits
返回的值为 3,而 maximum_keyspace_hits
返回的值为 8,这表示分片 6 是热门分片。
我们提供节点级指标,这些指标有助于识别实例中的热点。