Questa pagina elenca le metriche di Cloud Monitoring disponibili per Memorystore for Valkey e descrive cosa misura ciascuna metrica.
Metriche di Cloud Monitoring
Metriche a livello di istanza
Queste metriche forniscono una panoramica generale dell'integrità e delle prestazioni complessive dell'istanza. Ti aiutano a comprendere la capacità e l'utilizzo complessivi dell'istanza, nonché a identificare potenziali colli di bottiglia o aree di miglioramento.
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Numero medio attuale di connessioni client in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Numero massimo attuale di connessioni client per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Durata massima di una connessione client per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Numero attuale di connessioni client all'istanza. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Conteggio delle connessioni client totali a livello di istanza create nell'ultimo minuto. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Numero di connessioni rifiutate a causa del limite maxclients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Il tempo totale utilizzato per comando. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Numero totale di chiamate per questo comando in un minuto. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Utilizzo medio della CPU in tutti i nodi dell'istanza da 0,0 a 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Utilizzo massimo della CPU per un singolo nodo nell'istanza da 0,0 a 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Numero medio di eventi di scadenza delle chiavi per i primari di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Numero massimo di eventi di scadenza della chiave per un singolo nodo nell'istanza per la chiave primaria. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Il numero totale di eventi di scadenza delle chiavi in tutti i nodi principali dell'istanza. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Numero medio di chiavi rimosse a causa della capacità di memoria nelle primarie di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Numero massimo di chiavi rimosse per un singolo nodo nell'istanza a causa della capacità di memoria per il nodo primario. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Numero di chiavi rimosse a causa della capacità di memoria nelle primarie di tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Numero di chiavi archiviate nell'istanza. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Numero medio di ricerche riuscite di chiavi in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Numero massimo di ricerche riuscite di chiavi per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Numero di ricerche riuscite di chiavi per l'istanza. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Numero medio di ricerche non riuscite di chiavi in tutti i nodi dell'istanza. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Numero massimo di ricerche non riuscite di chiavi per un singolo nodo nell'istanza. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Numero totale di ricerche non riuscite delle chiavi per l'istanza. |
memorystore.googleapis.com/instance/memory/average_utilization |
Utilizzo medio della memoria in tutti i nodi dell'istanza. Il valore è compreso tra 0,0 e 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Utilizzo massimo della memoria per un singolo nodo nell'istanza da 0,0 a 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Utilizzo totale della memoria dell'istanza. |
memorystore.googleapis.com/instance/memory/size |
Dimensione della memoria dell'istanza. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Ritardo medio di riconoscimento (in secondi) delle repliche in tutti i nodi dell'istanza. Il ritardo di riconoscimento è un collo di bottiglia sul nodo principale di un'istanza. Questo collo di bottiglia è causato dalle repliche che non riescono a tenere il passo con le informazioni che il nodo primario invia loro. In questo caso, il nodo primario deve attendere la conferma che le repliche hanno ricevuto le informazioni. Ciò potrebbe rallentare i commit delle transazioni e causare un calo delle prestazioni sul nodo primario. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Ritardo massimo di riconoscimento (in secondi) per una singola replica nell'istanza. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Differenza media di offset di riconoscimento della replica (in byte) in tutti i nodi dell'istanza. La differenza di offset di riconoscimento della replica indica il numero di byte che non sono stati replicati tra le repliche e le relative istanze principali. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Differenza massima di offset di replica (in byte) per un singolo nodo nell'istanza. La differenza di offset di replica indica il numero di byte che non sono stati replicati tra una replica e le relative istanze principali. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Conteggio dei byte di rete in entrata ricevuti dagli endpoint dell'istanza. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Conteggio dei byte di rete in uscita inviati dagli endpoint dell'istanza. |
Metriche a livello di nodo
Queste metriche offrono informazioni dettagliate sullo stato e sul rendimento dei singoli nodi all'interno dell'istanza. Ti aiutano a risolvere i problemi relativi ai nodi e a ottimizzarne le prestazioni.
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
Numero di client connessi al nodo dell'istanza. |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
Il numero di connessioni client bloccate dal nodo dell'istanza. |
memorystore.googleapis.com/instance/node/server/uptime |
L'uptime del nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Il numero di connessioni client create da Memorystore for Valkey nell'ultimo minuto sul nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
Il numero di connessioni rifiutate da Memorystore for Valkey perché il nodo dell'istanza raggiunge il limite `maxclients`. |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
Il tempo impiegato per ogni comando nel nodo dell'istanza. |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
Il numero di chiamate per questo comando sul nodo dell'istanza in un minuto. |
memorystore.googleapis.com/instance/node/cpu/utilization |
L'utilizzo della CPU per il nodo dell'istanza (da 0,0 a 1,0). |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
Il numero di eventi di scadenza nel nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
Il numero di chiavi rimosse dal nodo dell'istanza. |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Il numero di chiavi che Memorystore for Valkey archivia nel nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
Il numero di ricerche riuscite di chiavi nel nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
Il numero di ricerche non riuscite di chiavi nel nodo dell'istanza. |
memorystore.googleapis.com/instance/node/memory/utilization |
L'utilizzo della memoria per il nodo dell'istanza (da 0,0 a 1,0). |
memorystore.googleapis.com/instance/node/memory/usage |
L'utilizzo della memoria del nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
Il numero di byte di rete in entrata ricevuti dal nodo dell'istanza. |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
Il numero di byte di rete in uscita inviati dal nodo dell'istanza. |
memorystore.googleapis.com/instance/node/replication/offset |
I byte di offset di replica del nodo dell'istanza. |
memorystore.googleapis.com/instance/node/server/healthy |
Determina se un nodo di istanza è disponibile e funziona correttamente. Questa metrica è in anteprima. |
Metriche di replica tra regioni
Questa sezione elenca le metriche utilizzate per la replica tra regioni.
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
Questa metrica mostra il numero di link di shard tra l'istanza principale e quella secondaria. All'interno di un gruppo di replica tra regioni, un'istanza principale segnala il numero di link di replica tra regioni che ha con le istanze secondarie del gruppo. Per ogni istanza secondaria, questo numero dovrebbe essere uguale al numero di shard. Se il numero scende al di sotto del numero di shard, questa metrica identifica il numero di shard quando la replica si è interrotta tra il replicatore e il follower. In uno stato ideale, questa metrica ha lo stesso numero del conteggio degli shard per l'istanza principale. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
Questa metrica mostra la differenza massima di offset di replica tra gli shard primari e secondari. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
Questa metrica mostra la differenza media di offset di replica tra gli shard primario e secondario. |
Metriche di backup
Questa sezione elenca le metriche di backup e di importazione.
Metriche a livello di istanza
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
L'ora di inizio dell'ultima operazione di backup. |
memorystore.googleapis.com/instance/backup/last_backup_status |
Lo stato dell'ultima operazione di backup. Gli stati sono 1 (operazione riuscita) e 0 (operazione non riuscita). |
memorystore.googleapis.com/instance/backup/last_backup_duration |
Durata dell'ultima operazione di backup (in millisecondi). |
memorystore.googleapis.com/instance/backup/last_backup_size |
Le dimensioni dell'ultimo backup (in byte). |
memorystore.googleapis.com/instance/import/last_import_start_time |
L'ora di inizio dell'ultima operazione di importazione. |
memorystore.googleapis.com/instance/import/last_import_duration |
Durata dell'ultima operazione di importazione(in millisecondi). |
Metriche di persistenza
Questa sezione elenca le metriche di persistenza e fornisce esempi di casi d'uso per le metriche di persistenza.
Metriche di persistenza RDB
Metriche a livello di istanza
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Il conteggio cumulativo dei caricamenti nell'istanza per la persistenza AOF o RDB. |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Il numero cumulativo di volte in cui l'istanza esegue uno snapshot RDB (noto anche come salvataggio). Questa metrica ha un campo status_code . Per verificare se uno snapshot non va a buon fine, puoi filtrare il campo status_code in base al seguente errore: 3 - INTERNAL ERROR . |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Un'età dello snapshot di distribuzione per tutti i nodi dell'istanza. Vuoi che la distribuzione abbia valori con un tempo di ritardo inferiore (o uguale) alla frequenza degli snapshot. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Il conteggio cumulativo dei comandi di scrittura negati nell'istanza a causa di un errore di persistenza. |
Metriche a livello di nodo
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
È in corso un RDB BGSAVE sul nodo dell'istanza. TRUE indica che il salvataggio è in corso. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
L'esito positivo dell'ultimo BGSAVE sul nodo dell'istanza. TRUE significa che si verifica un BGSAVE riuscito. Se non si verifica alcun bgrewrite , il valore potrebbe essere impostato come predefinito su TRUE . |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
La metrica mostra il numero cumulativo di salvataggi RDB eseguiti sul nodo dell'istanza. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
Il tempo (in secondi) trascorso dall'ultimo snapshot riuscito. |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
Il tempo rimanente (in secondi) fino allo snapshot successivo. |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
Il numero di chiavi nel salvataggio RDB eseguito sul nodo dell'istanza. |
Metriche di persistenza AOF
Metriche a livello di istanza
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Questa metrica mostra una distribuzione del ritardo (dalla scrittura dei dati alla sincronizzazione dell'archiviazione durevole) per tutti i nodi dell'istanza. Viene emesso solo per le istanze con appendfsync=everysec. Idealmente, la distribuzione dovrebbe avere valori con un tempo di ritardo inferiore (o uguale) alla frequenza di sincronizzazione AOF. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Questa metrica mostra il numero cumulativo di volte in cui un nodo ha attivato una riscrittura AOF per la tua istanza. Questa metrica ha un campo status_code . Per verificare se le riscritture AOF non vanno a buon fine, puoi filtrare il campo status_code per il seguente errore: 3 - INTERNAL_ERROR |
Metriche a livello di nodo
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
Questa metrica mostra l'esito positivo dell'ultima scrittura AOF sul nodo dell'istanza. TRUE indica che l'operazione è riuscita. Se non è stata eseguita alcuna scrittura, il valore potrebbe essere impostato su TRUE per impostazione predefinita. |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
Questa metrica mostra l'esito positivo dell'ultima operazione bgrewrite AOF sul nodo dell'istanza. TRUE indica la riuscita dell'operazione. Se non è stato eseguito alcun bgrewrite, il valore potrebbe essere impostato su TRUE per impostazione predefinita. |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
Questa metrica mostra il ritardo AOF tra la memoria e l'archivio permanente nel nodo dell'istanza. È applicabile solo alle istanze abilitate AOF in cui appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
Questa metrica mostra il conteggio delle riscritture AOF nel nodo dell'istanza. Per verificare se le riscritture AOF non vanno a buon fine, puoi filtrare il campo status_code per il seguente errore: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
Questa metrica mostra il conteggio degli errori di chiamata fsync() AOF ed è applicabile solo alle istanze AOF abilitate in cui appendfsync=EVERYSEC|ALWAYS. |
Metriche comuni sulla persistenza
Metriche applicabili ai meccanismi di persistenza AOF e RDB.
Metriche a livello di nodo
Nome metrica | Descrizione |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
Questa metrica mostra il conteggio dei ripristini dal file dump (AOF o RDB). Per verificare se i ripristini non vanno a buon fine, puoi filtrare il campo status_code per il seguente errore: 2 - INTERNAL_ERROR |
Esempi di casi d'uso per le metriche di permanenza
Controllare se le operazioni di scrittura AOF causano latenza e pressione della memoria
Supponiamo che tu rilevi un aumento della latenza o dell'utilizzo della memoria nell'istanza o nel nodo all'interno dell'istanza. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza AOF.
Poiché sai che le operazioni di riscrittura AOF possono attivare picchi di carico temporanei, puoi esaminare la metrica aof_rewrites_count
, che fornisce il conteggio cumulativo delle riscritture AOF durante il ciclo di vita dell'istanza o del nodo all'interno dell'istanza. Supponiamo che questa metrica mostri che gli incrementi nel conteggio delle riscritture corrispondono ad aumenti della latenza. In questo caso, puoi risolvere il problema riducendo la velocità di scrittura o aumentando il conteggio degli shard per ridurre la frequenza delle riscritture.
Verifica se le operazioni di salvataggio RDB causano latenza e pressione della memoria
Supponiamo che tu rilevi un aumento della latenza o dell'utilizzo della memoria nell'istanza o nel nodo all'interno dell'istanza. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza RDB.
Poiché sai che le operazioni di salvataggio RDB possono attivare picchi di carico temporanei, puoi esaminare la metrica rdb_saves_count
, che fornisce il conteggio cumulativo dei salvataggi RDB per tutta la durata dell'istanza o del nodo all'interno dell'istanza. Supponiamo che questa metrica mostri che gli incrementi nel conteggio dei salvataggi RDB corrispondono ad aumenti della latenza. In questo caso, puoi ridurre l'intervallo dello snapshot RDB per diminuire la frequenza delle riscritture. Puoi anche fare lo scale out l'istanza per ridurre i livelli di carico di base.
Interpretazione delle metriche per Memorystore for Valkey
Come mostrato nell'elenco precedente, molte metriche condividono tre categorie: media, massimo e totale.
Per Memorystore for Valkey, forniamo variazioni media e massima della stessa metrica, in modo che tu possa utilizzarle entrambe per identificare gli hotspot per quella famiglia di metriche.
Il valore totale della metrica è indipendente e fornisce informazioni separate non correlate allo scopo di identificazione degli hotspot di media e massimo.
Informazioni sulle metriche media e massima
Supponiamo di confrontare i valori average_keyspace_hits
e maximum_keyspace_hits
per la tua istanza. Man mano che la differenza tra le due metriche aumenta, una
differenza maggiore indica un maggiore hot spotting degli hit nella tua istanza. Idealmente,
il valore di chiusura dovrebbe essere compreso tra average_keyspace_hits
e
maximum_keyspace_hits
, perché ciò significa che gli hit sono distribuiti in modo più uniforme
nell'istanza.
Questo principio si applica a tutte le metriche che hanno le varianti media e massima della stessa metrica.
Esempio di hotspot
Se confronti average_keyspace_hits
e maximum_keyspace_hits
per tutti
gli shard della tua istanza, il confronto di questi valori indica dove si verifica
l'hotspotting. Ad esempio, supponiamo che gli shard in un'istanza a 6 shard abbiano il seguente
numero di hit:
- Shard 1 - 2 hit
- Shard 2 – 2 colpi
- Shard 3 – 2 colpi
- Shard 4 – 2 hit
- Shard 5 – 2 colpi
- Shard 6-8 hit
In questo esempio, average_keyspace_hits
restituisce un valore pari a 3 e
maximum_keyspace_hits
restituisce 8, il che indica che lo shard 6 è caldo.
Forniamo metriche a livello di nodo che potrebbero essere utili per identificare gli hotspot all'interno dell'istanza.