Metriche di monitoraggio supportate

Questa pagina elenca le metriche di Cloud Monitoring disponibili per Memorystore for Valkey e descrive cosa misura ciascuna metrica.

Metriche di Cloud Monitoring

Metriche a livello di istanza

Queste metriche forniscono una panoramica generale dell'integrità e delle prestazioni complessive dell'istanza. Ti aiutano a comprendere la capacità e l'utilizzo complessivi dell'istanza, nonché a identificare potenziali colli di bottiglia o aree di miglioramento.

Nome metrica Descrizione
memorystore.googleapis.com/instance/clients/average_connected_clients Numero medio attuale di connessioni client in tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/clients/maximum_connected_clients Numero attuale massimo di connessioni client per un singolo nodo nell'istanza.
memorystore.googleapis.com/instance/clients/maximum_connection_duration La durata massima di una connessione client per un singolo nodo nell'istanza.
memorystore.googleapis.com/instance/clients/total_connected_clients Numero attuale di connessioni client all'istanza.
memorystore.googleapis.com/instance/stats/total_connections_received_count Conteggio delle connessioni client totali a livello di istanza create nell'ultimo minuto.
memorystore.googleapis.com/instance/stats/total_rejected_connections_count Numero di connessioni rifiutate a causa del limite maxclients.
memorystore.googleapis.com/instance/commandstats/total_usec_count Il tempo totale consumato per comando.
memorystore.googleapis.com/instance/commandstats/total_calls_count Numero totale di chiamate per questo comando in un minuto.
memorystore.googleapis.com/instance/cpu/average_utilization Utilizzo medio della CPU in tutti i nodi dell'istanza da 0,0 a 1,0.
memorystore.googleapis.com/instance/cpu/maximum_utilization Utilizzo massimo della CPU per un singolo nodo dell'istanza compreso tra 0,0 e 1,0.
memorystore.googleapis.com/instance/stats/average_expired_keys Numero medio di eventi di scadenza delle chiavi per le principali di tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/stats/maximum_expired_keys Numero massimo di eventi di scadenza della chiave per un singolo nodo nell'istanza per il principale.
memorystore.googleapis.com/instance/stats/total_expired_keys_count Numero totale di eventi di scadenza delle chiavi nei principali di tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/stats/average_evicted_keys Numero medio di chiavi espulse a causa della capacità di memoria nelle tabelle principali di tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/stats/maximum_evicted_keys Numero massimo di chiavi espulse per un singolo nodo dell'istanza a causa della capacità di memoria per la chiave principale.
memorystore.googleapis.com/instance/stats/total_evicted_keys_count Numero di chiavi espulse a causa della capacità di memoria nelle tabelle principali di tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/keyspace/total_keys Numero di chiavi archiviate nell'istanza.
memorystore.googleapis.com/instance/stats/average_keyspace_hits Numero medio di ricerche di chiavi riuscite in tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits Numero massimo di ricerche di chiavi riuscite per un singolo nodo nell'istanza.
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count Numero di ricerche di chiavi riuscite per l'istanza.
memorystore.googleapis.com/instance/stats/average_keyspace_misses Numero medio di ricerche delle chiavi non riuscite in tutti i nodi dell'istanza.
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses Numero massimo di ricerche di chiavi non riuscite per un singolo nodo nell'istanza.
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count Numero totale di ricerche di chiavi non riuscite per l'istanza.
memorystore.googleapis.com/instance/memory/average_utilization Utilizzo medio della memoria in tutti i nodi dell'istanza. Il valore va da 0,0 a 1,0.
memorystore.googleapis.com/instance/memory/maximum_utilization Utilizzo massimo della memoria per un singolo nodo dell'istanza da 0,0 a 1,0.
memorystore.googleapis.com/instance/memory/total_used_memory Utilizzo totale della memoria dell'istanza.
memorystore.googleapis.com/instance/memory/size Dimensioni della memoria dell'istanza.
memorystore.googleapis.com/instance/replication/average_ack_lag Ritardo medio della replica (in secondi) delle repliche in tutti i nodi dell'istanza.

Il ritardo della replica (in secondi) indica quanto le repliche sono in ritardo rispetto alle principali.
memorystore.googleapis.com/instance/replication/maximum_ack_lag Ritardo massimo di conferma della replica (in secondi) per una singola replica nell'istanza.

Il ritardo di conferma della replica (in secondi) indica quanto i riconoscimenti della replica sono in ritardo rispetto alle principali.
memorystore.googleapis.com/instance/replication/average_offset_diff Differenza media dell'offset di conferma della replica (in byte) tra tutti i nodi dell'istanza.

La differenza dell'offset di conferma della replica indica il numero di byte che non sono stati replicati tra le repliche e le relative principali.
memorystore.googleapis.com/instance/replication/maximum_offset_diff Differenza massima dell'offset di replica (in byte) per un singolo nodo dell'istanza.

La differenza dell'offset di replica indica il numero di byte che non sono stati replicati tra una replica e le relative principali.
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count Conteggio dei byte di rete in entrata ricevuti dagli endpoint dell'istanza.
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count Conteggio dei byte di rete in uscita inviati dagli endpoint dell'istanza.

Metriche a livello di nodo

Queste metriche offrono informazioni dettagliate sullo stato e sulle prestazioni dei singoli nodi all'interno dell'istanza. Ti aiutano a risolvere i problemi relativi ai nodi e a ottimizzarne le prestazioni.

Nome metrica Descrizione
memorystore.googleapis.com/instance/node/clients/connected_clients Il numero di client connessi al nodo dell'istanza.
memorystore.googleapis.com/instance/node/clients/blocked_clients Il numero di connessioni client bloccate dal nodo dell'istanza.
memorystore.googleapis.com/instance/node/server/uptime L'uptime del nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/connections_received_count Il numero di connessioni client create da Memorystore for Valkey nell'ultimo minuto sul nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/rejected_connections_count Il numero di connessioni rifiutate da Memorystore for Valkey perché il nodo dell'istanza raggiunge il limite "maxclients".
memorystore.googleapis.com/instance/node/commandstats/usec_count Il tempo impiegato per ogni comando nel nodo dell'istanza.
memorystore.googleapis.com/instance/node/commandstats/calls_count Il numero di chiamate per questo comando sul nodo dell'istanza in un minuto.
memorystore.googleapis.com/instance/node/cpu/utilization L'utilizzo della CPU per il nodo dell'istanza (da 0,0 a 1,0).
memorystore.googleapis.com/instance/node/stats/expired_keys_count Il numero di eventi di scadenza nel nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/evicted_keys_count Il numero di chiavi espulse dal nodo dell'istanza.
memorystore.googleapis.com/instance/node/keyspace/total_keys Il numero di chiavi memorizzate da Memorystore for Valkey nel nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count Il numero di ricerche di chiavi riuscite nel nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count Il numero di ricerche di chiavi non riuscite nel nodo dell'istanza.
memorystore.googleapis.com/instance/node/memory/utilization L'utilizzo della memoria per il nodo dell'istanza (da 0,0 a 1,0).
memorystore.googleapis.com/instance/node/memory/usage L'utilizzo della memoria del nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count Il numero di byte di rete in entrata ricevuti dal nodo dell'istanza.
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count Il numero di byte di rete in uscita inviati dal nodo dell'istanza.
memorystore.googleapis.com/instance/node/replication/offset I byte dell'offset di replica del nodo dell'istanza.

Metriche di replica tra regioni

Questa sezione elenca le metriche utilizzate per la replica tra regioni.

Nome metrica Descrizione
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links Questa metrica mostra il numero di link ai frammenti tra le istanze principale e secondaria. All'interno di un gruppo di replica tra regioni, un'istanza principale registra il numero di link di replica tra regioni che ha con le istanze secondarie del gruppo. Per ogni istanza secondaria, questo numero dovrebbe essere uguale al numero di shard. Se il numero scende al di sotto del numero di shard, questa metrica identifica il numero di shard quando la replica è stata interrotta tra il replicatore e il follower. In un stato ideale, questa metrica ha lo stesso numero del conteggio dei frammenti per l' istanza principale.
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff Questa metrica mostra la differenza massima dell'offset di replica tra gli shard principali e secondari.
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff Questa metrica mostra la differenza media dell'offset di replica tra gli shard principali e secondari.

Metriche di backup

Questa sezione elenca le metriche di backup e importazione.

Metriche a livello di istanza

Nome metrica Descrizione
memorystore.googleapis.com/instance/backup/last_backup_start_time L'ora di inizio dell'ultima operazione di backup.
memorystore.googleapis.com/instance/backup/last_backup_status Lo stato dell'ultima operazione di backup. Gli stati sono 1 (successo) e 0 (errore).
memorystore.googleapis.com/instance/backup/last_backup_duration La durata dell'ultima operazione di backup (in millisecondi).
memorystore.googleapis.com/instance/backup/last_backup_size Le dimensioni dell'ultimo backup (in byte).
memorystore.googleapis.com/instance/import/last_import_start_time L'ora di inizio dell'ultima operazione di importazione.
memorystore.googleapis.com/instance/import/last_import_duration La durata dell'ultima operazione di importazione(in millisecondi).

Metriche sulla persistenza

Questa sezione elenca le metriche sulla persistenza e fornisce casi d'uso di esempio per queste metriche.

Metriche sulla persistenza RDB

Metriche a livello di istanza

Nome metrica Descrizione
memorystore.googleapis.com/instance/persistence/load_count Il conteggio cumulativo dei caricamenti da tutta l'istanza per la persistenza AOF o RDB.
memorystore.googleapis.com/instance/persistence/rdb_saves_count Il numero cumulativo di volte in cui l'istanza acquisisce uno snapshot RDB (noto anche come salvataggio). Questa metrica ha un campo status_code. Per verificare se uno snapshot non va a buon fine, puoi filtrare il campo status_code in base al seguente errore: 3 - INTERNAL ERROR.
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages L'età di un'istantanea della distribuzione per tutti i nodi dell'istanza. Vuoi che la distribuzione abbia valori con un tempo di ritardo inferiore (o uguale) alla frequenza degli istantanei.
memorystore.googleapis.com/instance/persistence/rejected_writes_count Il conteggio cumulativo dei comandi di scrittura negati nell'istanza a causa di un errore di persistenza.

Metriche a livello di nodo

Nome metrica Descrizione
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress È in corso un RDB BGSAVE sul nodo dell'istanza. TRUE indica che il salvataggio è in corso.
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status Il successo dell'ultimo BGSAVE sul nodo dell'istanza. TRUE indica che si è verificato un BGSAVE riuscito. Se non viene visualizzato bgrewrite, il valore predefinito potrebbe essere TRUE.
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count La metrica mostra il numero cumulativo di salvataggi RDB eseguiti sul nodo dell'istanza.
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age Il tempo (in secondi) dall'ultimo snapshot riuscito.
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until Il tempo rimanente (in secondi) fino allo snapshot successivo.
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total Il numero di chiavi nel salvataggio RDB eseguito sul nodo dell'istanza.

Metriche sulla persistenza AOF

Metriche a livello di istanza

Nome metrica Descrizione
memorystore.googleapis.com/instance/persistence/aof_fsync_lags Questa metrica mostra una distribuzione del ritardo (dalla scrittura dei dati alla sincronizzazione dell'archiviazione permanente) per tutti i nodi dell'istanza. Viene emesso solo per le istanze con appendfsync=everysec. Idealmente, la distribuzione deve avere valori con un tempo di latenza inferiore (o uguale) alla frequenza di sincronizzazione AOF.
memorystore.googleapis.com/instance/persistence/aof_rewrite_count Questa metrica mostra il numero cumulativo di volte in cui un nodo ha attivato una riscrittura AOF per la tua istanza. Questa metrica ha un campo status_code. Per verificare se le riscritture AOF non vanno a buon fine, puoi filtrare il campo status_code in base al seguente errore: 3 - INTERNAL_ERROR

Metriche a livello di nodo

Nome metrica Descrizione
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status Questa metrica mostra l'esito della scrittura AOF più recente sul nodo dell'istanza. TRUE significa successo. Se non è avvenuta alcuna scrittura, il valore predefinito potrebbe essere TRUE.
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status Questa metrica mostra l'esito dell'ultima operazione bgrewrite AOF sul nodo dell'istanza. TRUE significa successo. Se non è stato eseguito alcun bgrewrite, il valore predefinito potrebbe essere TRUE.
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag Questa metrica mostra il ritardo AOF tra la memoria e lo spazio di archiviazione permanente nel nodo dell'istanza. È applicabile solo per le istanze con AOF abilitato in cui appendfsync=EVERYSEC
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count Questa metrica mostra il conteggio delle riscritture AOF nel nodo dell'istanza. Per verificare se le riscritture AOF non vanno a buon fine, puoi filtrare il campo status_code in base al seguente errore: 3 - INTERNAL_ERROR
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count Questa metrica mostra il conteggio degli errori di chiamata fsync() AOF ed è applicabile solo alle istanze AOF abilitate in cui appendfsync=EVERYSEC|ALWAYS.

Metriche sulla persistenza comuni

Metriche applicabili sia ai meccanismi di persistenza AOF che RDB.

Metriche a livello di nodo

Nome metrica Descrizione
memorystore.googleapis.com/instance/node/persistence/auto_restore_count Questa metrica mostra il conteggio dei ripristini dal file dump (AOF o RDB). Per verificare se i ripristini non vanno a buon fine, puoi filtrare il campo status_code in base al seguente errore: 2 - INTERNAL_ERROR

Casi d'uso di esempio per le metriche di persistenza

Verificare se le operazioni di scrittura AOF causano latenza e pressione sulla memoria

Supponiamo che tu rilevi un aumento della latenza o dell'utilizzo della memoria nell'istanza o nel nodo all'interno dell'istanza. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza AOF.

Poiché sai che le operazioni di riscrittura AOF possono attivare picchi di carico transitori, puoi esaminare la metrica aof_rewrites_count, che fornisce il conteggio cumulativo delle riscritture AOF durante il ciclo di vita dell'istanza o del nodo all'interno dell'istanza. Supponiamo che questa metrica mostri che gli incrementi del conteggio delle riscritture corrispondono ad aumenti della latenza. In questo caso, puoi risolvere il problema riducendo la frequenza di scrittura o aumentando il numero di shard per ridurre la frequenza delle riscritture.

Verificare se le operazioni di salvataggio RDB causano latenza e pressione sulla memoria

Supponiamo che tu rilevi un aumento della latenza o dell'utilizzo della memoria nell'istanza o nel nodo all'interno dell'istanza. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza RDB.

Poiché sai che le operazioni di salvataggio RDB possono attivare picchi di carico transitori, puoi esaminare la metrica rdb_saves_count che fornisce il conteggio cumulativo dei salvataggi RDB per tutta la durata dell'istanza o del nodo all'interno dell'istanza. Supponiamo che questa metrica mostri che gli incrementi del conteggio dei salvataggi RDB corrispondono ad aumenti della latenza. In questo caso, puoi ridurre l'intervallo degli snapshot RDB per diminuire la frequenza delle riscritture. Puoi anche eseguire lo scale out dell'istanza per ridurre i livelli di carico di base.

Interpretazione delle metriche per Memorystore for Valkey

Come indicato nell'elenco precedente, molte metriche condividono tre categorie: media, massima e totale.

Per Memorystore for Valkey, forniamo le variazioni medie e massime della stessa metrica, in modo da poterle utilizzare entrambe per identificare gli hotspot per quella famiglia di metriche.

Il valore totale della metrica è indipendente e fornisce informazioni separate non correlate allo scopo dell'hotspot di media e massima.

Informazioni sulle metriche medie e massime

Supponiamo di confrontare i valori average_keyspace_hits e maximum_keyspace_hits per la tua istanza. Man mano che la differenza tra le due metriche aumenta, una maggiore differenza indica un maggior numero di hit hot nella tua istanza. Idealmente, dovresti avere un valore compreso tra average_keyspace_hits e maximum_keyspace_hits, perché ciò significa che gli hit sono distribuiti in modo più uniforme nella tua istanza.

Questo principio si applica a tutte le metriche che hanno le varianti media e massima della stessa metrica.

Esempio di hotspot

Se confronti average_keyspace_hits e maximum_keyspace_hits per tutti gli shard della tua istanza, il confronto di questi valori indica dove si verificano gli hot spot. Ad esempio, supponiamo che gli shard in un'istanza con 6 shard abbiano il seguente numero di hit:

  • Shard 1 – 2 hit
  • Shard 2 – 2 hit
  • Shard 3 – 2 hit
  • Shard 4 – 2 hit
  • Shard 5 – 2 hit
  • Shard 6 – 8 hit

In questo esempio, average_keyspace_hits restituisce un valore pari a 3 e maximum_keyspace_hits restituisce 8, a indicare che lo shard 6 è attivo.

Forniamo metriche a livello di nodo che potrebbero essere utili per identificare gli hotspot all'interno dell'istanza.