本頁面列出可用於 Memorystore for Valkey 的 Cloud Monitoring 指標,並說明各指標的評估項目。
Cloud Monitoring 指標
執行個體層級指標
這些指標可概略呈現執行個體的整體健康狀態和效能。這些指標有助您瞭解執行個體的整體容量和使用率,以及找出潛在瓶頸或可改善的部分。
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
執行個體所有節點的平均用戶端連線數。 |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
執行個體中單一節點目前的用戶端連線數量上限。 |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
執行個體中單一節點的用戶端連線時間上限。 |
memorystore.googleapis.com/instance/clients/total_connected_clients |
目前與執行個體建立的用戶端連線數量。 |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
過去一分鐘內建立的例項層級用戶端連線總數。 |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
因 maxclients 限制而遭拒絕的連線數量。 |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
每個指令耗用的總時間。 |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
一分鐘內對此指令的總呼叫次數。 |
memorystore.googleapis.com/instance/cpu/average_utilization |
執行個體所有節點的平均 CPU 使用率,範圍為 0.0 到 1.0。 |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
執行個體中單一節點的最大 CPU 使用率,範圍為 0.0 到 1.0。 |
memorystore.googleapis.com/instance/stats/average_expired_keys |
執行個體中所有節點主體的重要到期事件平均數。 |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
在主要執行個體中,單一節點的重要到期事件數量上限。 |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
在執行個體中,所有節點主要的總重要事件到期數。 |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
在執行個體中,主要節點的記憶體容量所導致的鍵淘汰數平均值。 |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
由於primary 的記憶體容量,執行個體中單一節點的剔除鍵數量上限。 |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
在執行個體中,由於記憶體容量不足而遭到淘汰的主要節點數量。 |
memorystore.googleapis.com/instance/keyspace/total_keys |
執行個體中儲存的索引鍵數量。 |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
在執行個體的所有節點中,成功查詢索引鍵的平均次數。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
執行個體中單一節點成功查詢金鑰的數量上限。 |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
成功查詢執行個體的索引鍵數量。 |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
在執行個體的所有節點中,索引鍵查詢失敗的平均次數。 |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
執行個體中單一節點的金鑰查詢失敗次數上限。 |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
執行個體的索引鍵查詢失敗總數。 |
memorystore.googleapis.com/instance/memory/average_utilization |
執行個體內所有節點的平均記憶體使用率。值介於 0.0 到 1.0。 |
memorystore.googleapis.com/instance/memory/maximum_utilization |
執行個體中單一節點的記憶體使用率上限,範圍為 0.0 到 1.0。 |
memorystore.googleapis.com/instance/memory/total_used_memory |
執行個體的記憶體總用量。 |
memorystore.googleapis.com/instance/memory/size |
執行個體的記憶體大小。 |
memorystore.googleapis.com/instance/replication/average_ack_lag |
在執行個體的所有節點中,備份副本的平均複製延遲時間 (以秒為單位)。 複製延遲時間 (以秒為單位) 表示備份副本落後主副本的程度。 |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
在例項中,單一備援機制執行個體的最大複製確認延遲時間 (以秒為單位)。 複製確認延遲時間 (以秒為單位) 表示複製確認訊息落後於主要執行個體的程度。 |
memorystore.googleapis.com/instance/replication/average_offset_diff |
在執行個體的所有節點中,平均複製確認偏移差異 (以位元組為單位)。 複製確認偏移差異是指在副本與其主要副本之間,未複製的位元組數。 |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
執行個體中單一節點的最大複製偏移差異 (以位元為單位)。 複製偏移差異是指備用資源與主要資源之間未複製的位元組數。 |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
執行個體端點接收的輸入網路位元組數。 |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
從執行個體端點傳送的連出網路位元組數。 |
節點層級指標
這些指標可提供詳細洞察資料,讓您瞭解執行個體內個別節點的健康狀態和效能。可協助您排解節點問題,並提升節點效能。
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
連線至執行個體節點的用戶端數。 |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
執行個體節點封鎖的用戶端連線數量。 |
memorystore.googleapis.com/instance/node/server/uptime |
執行個體節點的正常運作時間。 |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Memorystore for Valkey 在執行個體節點上,過去一分鐘內建立的用戶端連線數。 |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
由於執行個體節點達到 `maxclients` 限制,Memorystore for Valkey 拒絕的連線數量。 |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
執行個體節點中每個指令所耗費的時間。 |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
執行個體節點在一分鐘內對此指令的呼叫次數。 |
memorystore.googleapis.com/instance/node/cpu/utilization |
執行個體節點的 CPU 使用率 (從 0.0 到 1.0)。 |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
執行個體節點中的到期事件數。 |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
執行個體節點淘汰的鍵數。 |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Memorystore for Valkey 在執行個體節點中儲存的索引鍵數量。 |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
在執行個體節點中成功查詢索引鍵的次數。 |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
在執行個體節點中查詢索引鍵失敗的次數。 |
memorystore.googleapis.com/instance/node/memory/utilization |
執行個體節點的記憶體使用率 (從 0.0 到 1.0)。 |
memorystore.googleapis.com/instance/node/memory/usage |
執行個體節點的記憶體用量。 |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
執行個體節點收到的輸入網路位元組數。 |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
執行個體節點傳送的連出網路位元組數。 |
memorystore.googleapis.com/instance/node/replication/offset |
執行個體節點的複製偏移位元組。 |
跨區域複製指標
本節列出跨區複製功能所使用的指標。
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
這個指標會顯示主要和次要執行個體之間的分片連結數量。在跨區域複製群組中,主要執行個體會回報與群組中次要執行個體的跨區域複製連結數量。對於每個次要執行個體,這個數字應等於分片數量。如果這個數字低於分割區數量,則這個指標會指出複製器與追隨者之間停止複製時的分割區數量。在理想狀態下,這個指標的數值會與主要執行個體的分片數量相同。 |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
這項指標會顯示主分片和次要分片之間的最大複製偏移差異。 |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
這項指標會顯示主分片和次要分片之間的平均複製偏移差異。 |
備份指標
執行個體層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
上次備份作業的開始時間。 |
memorystore.googleapis.com/instance/backup/last_backup_status |
上次備份作業的狀態。狀態為 1 (成功) 和 0 (失敗)。 |
memorystore.googleapis.com/instance/backup/last_backup_duration |
上次備份作業的時間長度 (以毫秒為單位)。 |
memorystore.googleapis.com/instance/backup/last_backup_size |
上次備份的大小 (以位元組為單位)。 |
memorystore.googleapis.com/instance/import/last_import_start_time |
上次匯入作業的開始時間。 |
memorystore.googleapis.com/instance/import/last_import_duration |
上次匯入作業的時間長度(以毫秒為單位)。 |
持久性指標
本節列出持久性指標,並提供持久性指標的範例用途。
RDB 持久性指標
執行個體層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
針對 AOF 或 RDB 持久性,在執行個體中累積的載入次數。 |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
執行個體擷取 RDB 快照 (又稱為「儲存」) 的累計次數。這項指標有 status_code 欄位。如要檢查快照是否失敗,您可以篩選 status_code 欄位,查看是否有下列錯誤:3 - INTERNAL ERROR 。 |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
執行個體中所有節點的分發快照年齡。您希望分布圖的值比快照頻率的延遲時間短 (或相同)。 |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
因無法持久化而拒絕的寫入指令,在執行個體中累積的次數。 |
節點層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
執行個體節點上正在進行 RDB BGSAVE 。TRUE 表示儲存作業正在進行中。 |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
例項節點上上次 BGSAVE 的成功狀態。TRUE 表示 BGSAVE 已成功執行。如果沒有 bgrewrite ,則值可能會預設為 TRUE 。 |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
這項指標會顯示在執行個體節點上執行的 RDB 儲存作業累積次數。 |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
自上次成功建立快照以來經過的時間 (以秒為單位)。 |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
下次快照到來之前的剩餘時間 (以秒為單位)。 |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
在執行個體節點上執行的 RDB 儲存作業中,鍵的數量。 |
AOF 持久性指標
執行個體層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
這項指標會顯示執行個體中所有節點的延遲 (從資料寫入到持久性儲存空間同步) 分布情形。這項事件只會針對附加式同步處理為每秒的執行個體觸發。理想情況下,您應該會看到分布圖中的值,延遲時間 (或時間) 小於 AOF 同步頻率。 |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
這項指標會顯示節點觸發 AOF 重寫的累積次數。這項指標有 status_code 欄位。如要檢查 AOF 重寫作業是否失敗,您可以篩選 status_code 欄位,查看是否有以下錯誤:3 - INTERNAL_ERROR |
節點層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
這個指標會顯示在執行個體節點上,最近一次 AOF 寫入作業是否成功。TRUE 表示成功,如果未發生寫入作業,則值可能預設為 TRUE。 |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
此指標會顯示在執行個體節點上,上次 AOF bgrewrite 作業是否成功。TRUE 代表成功,如果未發生 bgrewrite,則值可能預設為 TRUE。 |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
這項指標會顯示例項節點中記憶體和永久儲存空間之間的 AOF 延遲時間。這項功能僅適用於啟用 AOF 的執行個體,且 appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
這項指標會顯示執行個體節點中的 AOF 重寫計數。如要檢查 AOF 重寫作業是否失敗,您可以篩選 status_code 欄位,查看是否有以下錯誤:3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
這項指標會顯示 AOF fsync() 呼叫錯誤的計數,且僅適用於已啟用 AOF 的執行個體,且 appendfsync=EVERYSEC|ALWAYS。 |
常見的持續性指標
適用於 AOF 和 RDB 持續性機制的指標。
節點層級指標
指標名稱 | 說明 |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
這項指標會顯示從備份檔案 (AOF 或 RDB) 還原的數量。如要檢查還原作業是否失敗,您可以篩選 status_code 欄位,查看是否出現以下錯誤:2 - INTERNAL_ERROR |
持久性指標的應用實例
檢查 AOF 寫入作業是否會導致延遲和記憶體壓力
假設您在執行個體或執行個體內的節點上,偵測到延遲時間或記憶體用量增加的情形。在這種情況下,您可能需要檢查額外用量是否與 AOF 持久性有關。
由於您知道 AOF 重寫作業可能會觸發暫時性負載尖峰,因此可以檢查 aof_rewrites_count
指標,瞭解在執行個體或執行個體內的節點的整個生命週期中,AOF 重寫作業的累積次數。假設這個指標顯示重寫次數增加會導致延遲時間增加。在這種情況下,您可以減少寫入率或增加分割區數量,藉此減少重寫頻率,解決問題。
檢查 RDB 儲存作業是否會導致延遲和記憶體壓力
假設您在執行個體或執行個體內的節點上,偵測到延遲時間或記憶體用量增加的情形。在這種情況下,您可能需要檢查額外用量是否與 RDB 持久性有關。
您知道 RDB 儲存作業可能會觸發暫時性負載尖峰,因此可以檢查 rdb_saves_count
指標,這項指標會顯示在執行個體或執行個體內的節點的整個生命週期內,RDB 儲存作業的累積次數。假設這項指標顯示 RDB 儲存次數增加會導致延遲時間增加。在這種情況下,您可以縮短 RDB 快照間隔,以降低重寫頻率。您也可以擴展執行個體,以降低基準負載層級。
解讀 Memorystore for Valkey 的指標
如上方清單所示,許多指標都包含三個類別:平均值、最大值和總數。
針對 Memorystore for Valkey,我們提供相同指標的平均和最大值變化,方便您使用這兩者找出該指標系列的熱點。
指標的總值是獨立的,可提供與平均值和最大值熱點目的無關的獨立洞察資料。
瞭解平均和最大指標
假設您要比較執行個體的 average_keyspace_hits
和 maximum_keyspace_hits
值。兩項指標的差異越大,表示在您的執行個體中熱點點擊的比例越高。理想情況下,average_keyspace_hits
和 maximum_keyspace_hits
之間的值應相近,因為這表示在您的執行個體中,命中記錄分布得更均勻。
這項原則適用於所有具有相同指標的平均和最大值變化版本。
互動區範例
如果您比較執行個體中所有分片的 average_keyspace_hits
和 maximum_keyspace_hits
,比較這些值可指出熱點所在位置。舉例來說,假設 6 個分片執行個體中的分片有以下命中次數:
- 資料分割 1 – 2 個命中
- 資料分割 2 – 2 個命中
- 資料分割 3 - 2 個命中
- 資料分割 4 - 2 個命中
- 資料分割 5 - 2 個命中
- 資料分割 6 到 8 個命中
在這個範例中,average_keyspace_hits
會傳回 3 的值,而 maximum_keyspace_hits
會傳回 8,表示分片 6 是熱門分片。
我們提供節點層級指標,可用於找出執行個體中的熱點。