Cette page répertorie les métriques Cloud Monitoring disponibles pour Memorystore pour Valkey et décrit ce que chacune mesure.
Métriques Cloud Monitoring
Métriques au niveau de l'instance
Ces métriques fournissent un aperçu général de l'état et des performances globales de l'instance. Elles vous aident à comprendre la capacité et l'utilisation globales de l'instance, ainsi qu'à identifier les goulots d'étranglement ou les axes d'amélioration potentiels.
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Nombre moyen actuel de connexions client sur tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Nombre maximal actuel de connexions client pour un seul nœud de l'instance. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Durée maximale d'une connexion client pour un seul nœud de l'instance. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Nombre actuel de connexions client à l'instance. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Nombre total de connexions client créées au niveau de l'instance au cours de la dernière minute. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Nombre de connexions refusées en raison de la limite maximale de clients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Durée totale consommée par commande. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Nombre total d'appels de cette commande en une minute. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Utilisation moyenne du processeur sur tous les nœuds de l'instance, comprise entre 0,0 et 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Utilisation maximale du processeur pour un seul nœud de l'instance, comprise entre 0,0 et 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Nombre moyen d'événements d'expiration de clé pour les primaires de tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Nombre maximal d'événements d'expiration de clé pour un seul nœud de l'instance pour le principal. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Nombre total d'événements d'expiration de clé sur les principals de tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Nombre moyen de clés évincées en raison de la capacité de mémoire sur les principals de tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Nombre maximal de clés évincées pour un seul nœud de l'instance en raison de la capacité de mémoire de la principale. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Nombre de clés évincées en raison de la capacité de mémoire sur les principals de tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Nombre de clés stockées dans l'instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Nombre moyen de recherches de clés réussies sur tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Nombre maximal de recherches de clés réussies pour un seul nœud de l'instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Nombre de recherches de clés réussies pour l'instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Nombre moyen de recherches de clés ayant échoué sur tous les nœuds de l'instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Nombre maximal de recherches de clés ayant échoué pour un seul nœud de l'instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Nombre total de recherches de clés ayant échoué pour l'instance. |
memorystore.googleapis.com/instance/memory/average_utilization |
Utilisation moyenne de la mémoire sur tous les nœuds de l'instance. La valeur est comprise entre 0,0 et 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Utilisation maximale de la mémoire pour un seul nœud de l'instance, comprise entre 0,0 et 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Utilisation totale de la mémoire de l'instance. |
memorystore.googleapis.com/instance/memory/size |
Taille de la mémoire de l'instance. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Délai de réplication moyen (en secondes) des réplicas sur tous les nœuds de l'instance. Le délai de réplication (en secondes) indique le retard des réplicas par rapport aux instances principales. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Délai de confirmation de réplication maximal (en secondes) pour un seul réplica dans l'instance. Le délai de confirmation de réplication (en secondes) indique le retard des confirmations de réplication par rapport aux instances principales. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Différence moyenne de décalage de confirmation de réplication (en octets) pour tous les nœuds de l'instance. La différence de décalage de confirmation de réplication correspond au nombre d'octets qui n'ont pas été répliqués entre les réplicas et leurs instances principales. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Différence de décalage de réplication maximale (en octets) pour un seul nœud de l'instance. La différence de décalage de réplication correspond au nombre d'octets qui n'ont pas été répliqués entre une instance dupliquée et ses instances principales. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Nombre d'octets réseau entrants reçus par les points de terminaison de l'instance. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Nombre d'octets réseau sortants envoyés depuis les points de terminaison de l'instance. |
Métriques au niveau du nœud
Ces métriques fournissent des insights détaillés sur l'état et les performances de chaque nœud de l'instance. Ils vous aident à résoudre les problèmes liés aux nœuds et à optimiser leurs performances.
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
Nombre de clients connectés au nœud de l'instance. |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
Nombre de connexions client bloquées par le nœud d'instance. |
memorystore.googleapis.com/instance/node/server/uptime |
Disponibilité du nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Nombre de connexions client créées par Memorystore pour Valkey au cours de la dernière minute sur le nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
Nombre de connexions refusées par Memorystore pour Valkey, car le nœud de l'instance atteint la limite de "maxclients". |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
Temps consommé pour chaque commande dans le nœud d'instance. |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
Nombre d'appels de cette commande sur le nœud de l'instance en une minute. |
memorystore.googleapis.com/instance/node/cpu/utilization |
Utilisation du processeur du nœud de l'instance (entre 0,0 et 1,0). |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
Nombre d'événements d'expiration dans le nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
Nombre de clés évincées par le nœud de l'instance. |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Nombre de clés que Memorystore pour Valkey stocke dans le nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
Nombre de recherches de clés réussies dans le nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
Nombre de recherches de clés ayant échoué dans le nœud de l'instance. |
memorystore.googleapis.com/instance/node/memory/utilization |
Utilisation de la mémoire du nœud de l'instance (de 0,0 à 1,0). |
memorystore.googleapis.com/instance/node/memory/usage |
Utilisation de la mémoire du nœud de l'instance. |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
Nombre d'octets réseau entrants reçus par le nœud d'instance. |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
Nombre d'octets réseau sortants envoyés par le nœud d'instance. |
memorystore.googleapis.com/instance/node/replication/offset |
Octets de décalage de réplication du nœud d'instance. |
Métriques de réplication interrégionale
Cette section répertorie les métriques utilisées pour la réplication interrégionale.
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
Cette métrique indique le nombre de liens de partition entre les instances principales et secondaires. Dans un groupe de réplication interrégionale, une instance principale indique le nombre de liens de réplication interrégionale qu'elle entretient avec les instances secondaires du groupe. Pour chaque instance secondaire, ce nombre doit être égal au nombre de fragments. Si ce nombre passe en dessous du nombre de fragments, cette métrique identifie le nombre de fragments lorsque la réplication s'est arrêtée entre le réplicateur et le suiveur. Dans un état idéal, cette métrique est identique au nombre de fragments de l'instance principale. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
Cette métrique indique la différence maximale de décalage de réplication entre les segments principaux et secondaires. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
Cette métrique indique la différence moyenne de décalage de réplication entre les segments principaux et secondaires. |
Métriques de sauvegarde
Cette section répertorie les métriques de sauvegarde et d'importation.
Métriques au niveau de l'instance
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
Heure de début de la dernière opération de sauvegarde. |
memorystore.googleapis.com/instance/backup/last_backup_status |
État de la dernière opération de sauvegarde. Les états sont 1 (succès) et 0 (échec). |
memorystore.googleapis.com/instance/backup/last_backup_duration |
Durée de la dernière opération de sauvegarde (en millisecondes). |
memorystore.googleapis.com/instance/backup/last_backup_size |
Taille de la dernière sauvegarde (en octets). |
memorystore.googleapis.com/instance/import/last_import_start_time |
Heure de début de la dernière opération d'importation. |
memorystore.googleapis.com/instance/import/last_import_duration |
Durée de la dernière opération d'importation(en millisecondes). |
Métriques de persistance
Cette section liste les métriques de persistance et fournit des exemples de cas d'utilisation pour ces métriques.
Métriques de persistance RDB
Métriques au niveau de l'instance
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Nombre cumulé de chargements de l'ensemble de l'instance pour la persistance AOF ou RDB. |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Nombre cumulé de fois où votre instance prend un instantané RDB (également appelé enregistrement). Cette métrique comporte un champ status_code . Pour vérifier si un instantané échoue, vous pouvez filtrer le champ status_code pour afficher l'erreur suivante: 3 - INTERNAL ERROR . |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Âge de l'instantané de distribution pour tous les nœuds de l'instance. Vous souhaitez que la distribution présente des valeurs avec un temps de latence inférieur (ou égal) à la fréquence d'instantané. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Nombre cumulé de commandes d'écriture refusées dans l'instance en raison d'un échec de la persistance. |
Métriques au niveau du nœud
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
Une RDB BGSAVE est en cours sur le nœud de l'instance. TRUE signifie que l'enregistrement est en cours. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
Succès de la dernière BGSAVE sur le nœud d'instance. TRUE signifie qu'un BGSAVE réussi se produit. Si aucun bgrewrite ne se produit, la valeur par défaut peut être TRUE . |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
La métrique indique le nombre cumulé d'enregistrements RDB exécutés sur le nœud de l'instance. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
Temps écoulé (en secondes) depuis le dernier instantané réussi. |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
Temps restant (en secondes) avant le prochain instantané. |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
Nombre de clés dans l'enregistrement RDB exécuté sur le nœud de l'instance. |
Métriques de persistance AOF
Métriques au niveau de l'instance
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Cette métrique affiche la distribution du décalage (de l'écriture des données à la synchronisation du stockage durable) pour tous les nœuds de l'instance. Il n'est émis que pour les instances avec appendfsync=everysec. Idéalement, vous souhaitez que la distribution affiche des valeurs avec un temps de latence inférieur (ou égal) à la fréquence de synchronisation de l'AOF. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Cette métrique indique le nombre cumulé de fois où un nœud a déclenché une réécriture AOF pour votre instance. Cette métrique comporte un champ status_code . Pour vérifier si les réécritures AOF échouent, vous pouvez filtrer le champ status_code pour afficher l'erreur suivante: 3 - INTERNAL_ERROR |
Métriques au niveau du nœud
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
Cette métrique indique si l'écriture AOF la plus récente sur le nœud d'instance a réussi. TRUE signifie "Succès". Si aucune écriture n'a été effectuée, la valeur peut être définie par défaut sur TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
Cette métrique indique si la dernière opération de réécriture en arrière-plan AOF sur le nœud de l'instance a réussi. TRUE signifie "Succès". Si aucun bgrewrite n'a été effectué, la valeur peut être définie par défaut sur TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
Cette métrique indique le décalage AOF entre la mémoire et le stockage persistant dans le nœud d'instance. Elle ne s'applique qu'aux instances AOF activées pour lesquelles appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
Cette métrique indique le nombre de réécritures AOF dans le nœud de l'instance. Pour vérifier si les réécritures AOF échouent, vous pouvez filtrer le champ status_code pour afficher l'erreur suivante: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
Cette métrique indique le nombre d'erreurs d'appel fsync() AOF et ne s'applique qu'aux instances AOF activées pour lesquelles appendfsync=EVERYSEC|ALWAYS. |
Métriques de persistance courantes
Métriques applicables aux mécanismes de persistance AOF et RDB.
Métriques au niveau du nœud
Nom de la métrique | Description |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
Cette métrique indique le nombre de restaurations à partir du fichier de dump (AOF ou RDB). Pour vérifier si les restaurations échouent, vous pouvez filtrer le champ status_code pour afficher l'erreur suivante: 2 - INTERNAL_ERROR |
Exemples de cas d'utilisation des métriques de persistance
Vérifier si les opérations d'écriture AOF entraînent une latence et une pression sur la mémoire
Supposons que vous détectiez une augmentation de la latence ou de l'utilisation de la mémoire sur votre instance ou sur le nœud de l'instance. Dans ce cas, vous pouvez vérifier si l'utilisation supplémentaire est liée à la persistance AOF.
Comme vous savez que les opérations de réécriture AOF peuvent déclencher des pics de charge temporaires, vous pouvez inspecter la métrique aof_rewrites_count
, qui vous indique le nombre cumulé de réécritures AOF au cours de la durée de vie de l'instance ou du nœud dans l'instance. Supposons que cette métrique vous montre que les augmentations du nombre de réécritures correspondent à une augmentation de la latence. Dans ce cas, vous pouvez résoudre le problème en réduisant le débit d'écriture ou en augmentant le nombre de fragments pour réduire la fréquence des réécritures.
Vérifier si les opérations d'enregistrement RDB entraînent une latence et une pression sur la mémoire
Supposons que vous détectiez une augmentation de la latence ou de l'utilisation de la mémoire sur votre instance ou sur le nœud de l'instance. Dans ce cas, vous pouvez vérifier si l'utilisation supplémentaire est liée à la persistance RDB.
Comme vous savez que les opérations d'enregistrement RDB peuvent déclencher des pics de charge temporaires, vous pouvez inspecter la métrique rdb_saves_count
, qui indique le nombre cumulé d'enregistrements RDB au cours de la durée de vie de l'instance ou du nœud dans l'instance. Supposons que cette métrique vous montre que les incréments du nombre d'enregistrements RDB correspondent à une augmentation de la latence. Dans ce cas, vous pouvez réduire l'intervalle d'instantanés de la base de données relationnelle pour réduire la fréquence des réécritures. Vous pouvez également mettre à l'effectuer un scaling horizontal l'instance pour réduire les niveaux de charge de référence.
Interpréter les métriques pour Memorystore pour Valkey
Comme indiqué dans la liste ci-dessus, de nombreuses métriques partagent trois catégories: moyenne, maximale et totale.
Pour Memorystore for Redis, nous fournissons des variations moyennes et maximales de la même métrique afin que vous puissiez les utiliser toutes les deux pour identifier les points chauds de cette famille de métriques.
La valeur total de la métrique est indépendante et fournit des insights distincts, sans rapport avec l'objectif de hotspotting des valeurs moyenne et maximale.
Comprendre les métriques moyenne et maximale
Supposons que vous compariez les valeurs average_keyspace_hits
et maximum_keyspace_hits
de votre instance. À mesure que la différence entre les deux métriques augmente, une différence plus importante indique une concentration plus importante des requêtes dans votre instance. Idéalement, vous devriez obtenir une valeur proche de average_keyspace_hits
ou maximum_keyspace_hits
, car cela signifie que les requêtes sont réparties plus uniformément dans votre instance.
Ce principe s'applique à toutes les métriques qui ont les variations moyennes et maximales de la même métrique.
Exemple de zone cliquable
Si vous comparez average_keyspace_hits
et maximum_keyspace_hits
pour tous les fragments de votre instance, cette comparaison indique où se produit le point chaud. Par exemple, supposons que les shards d'une instance à 6 shards aient le nombre de requêtes suivant:
- Segment 1 : 2 appels
- Segment 2 : 2 appels
- Segment 3 : 2 appels
- Segment 4 : 2 hits
- Segment 5 : 2 appels
- Segment 6 : 8 appels
Dans cet exemple, average_keyspace_hits
renvoie une valeur de 3 et maximum_keyspace_hits
renvoie 8, ce qui indique que le segment 6 est chaud.
Nous fournissons des métriques au niveau du nœud qui peuvent être utiles pour identifier les points chauds au sein de l'instance.