En esta página, se enumeran las métricas de Cloud Monitoring disponibles para Memorystore para Valkey y se describe lo que mide cada métrica.
Métricas de Cloud Monitoring
Métricas a nivel de la instancia
Estas métricas proporcionan una descripción general de alto nivel del estado y el rendimiento general de la instancia. Te ayudan a comprender la capacidad y el uso generales de la instancia, así como a identificar posibles cuellos de botella o áreas de mejora.
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Es la cantidad actual promedio de conexiones de cliente en todos los nodos de la instancia. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Es la cantidad máxima actual de conexiones de cliente para un solo nodo en la instancia. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Es la duración máxima de una conexión de cliente para un solo nodo en la instancia. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Es la cantidad actual de conexiones de cliente a la instancia. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Es el recuento de las conexiones de cliente totales a nivel de la instancia creadas en el último minuto. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Cantidad de conexiones rechazadas debido al límite de maxclients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Es el tiempo total consumido por comando. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Cantidad total de llamadas para este comando en un minuto. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Es el uso medio de CPU en todos los nodos de la instancia, de 0.0 a 1.0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Es el uso máximo de CPU de un solo nodo en la instancia, de 0.0 a 1.0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Es la cantidad promedio de eventos de vencimiento de claves para los elementos principales de todos los nodos de la instancia. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Es la cantidad máxima de eventos de vencimiento de claves para un solo nodo en la instancia del principal. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Cantidad total de eventos de vencimiento de claves en los principales de todos los nodos de la instancia. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Es la cantidad promedio de claves expulsadas debido a la capacidad de memoria en los principales de todos los nodos de la instancia. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Es la cantidad máxima de claves expulsadas para un solo nodo en la instancia debido a la capacidad de memoria para el principal. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Cantidad de claves expulsadas debido a la capacidad de memoria en los principales de todos los nodos de la instancia. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Cantidad de claves almacenadas en la instancia. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Es la cantidad promedio de búsquedas de claves correctas en todos los nodos de la instancia. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Es la cantidad máxima de búsquedas de claves correctas para un solo nodo en la instancia. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Cantidad de búsquedas correctas de claves para la instancia. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Es la cantidad promedio de búsquedas de claves fallidas en todos los nodos de la instancia. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Es la cantidad máxima de búsquedas de claves con errores para un solo nodo en la instancia. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Cantidad total de búsquedas de claves fallidas para la instancia. |
memorystore.googleapis.com/instance/memory/average_utilization |
Es el uso medio de la memoria en todos los nodos de la instancia. El valor está entre 0.0 y 1.0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Es el uso máximo de memoria de un solo nodo en la instancia, de 0.0 a 1.0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Es el uso total de memoria de la instancia. |
memorystore.googleapis.com/instance/memory/size |
Es el tamaño de la memoria de la instancia. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Es el retraso de replicación promedio (en segundos) de las réplicas en todos los nodos de la instancia. El retraso de replicación (en segundos) indica qué tan lejos están las réplicas de las instancias principales. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Es el retraso máximo de confirmación de replicación (en segundos) para una sola réplica en la instancia. El retraso de confirmación de replicación (en segundos) indica qué tan lejos están los acuse de recibos de replicación de las instancias principales. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Es la diferencia promedio de la compensación de acuse de recibo de replicación (en bytes) en todos los nodos de la instancia. La diferencia de compensación de acuse de recibo de replicación indica la cantidad de bytes que no se replicaron entre las réplicas y sus principales. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Es la diferencia máxima de compensación de replicación (en bytes) para un solo nodo en la instancia. La diferencia de compensación de replicación indica la cantidad de bytes que no se replicaron entre una réplica y sus instancias principales. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Es el recuento de bytes de red entrantes que reciben los extremos de la instancia. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Es el recuento de bytes de red salientes que se envían desde los extremos de la instancia. |
Métricas a nivel del nodo
Estas métricas ofrecen estadísticas detalladas sobre el estado y el rendimiento de los nodos individuales dentro de la instancia. Te ayudan a solucionar problemas con los nodos y a optimizar su rendimiento.
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
Es la cantidad de clientes conectados al nodo de la instancia. |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
Es la cantidad de conexiones de clientes que bloquea el nodo de la instancia. |
memorystore.googleapis.com/instance/node/server/uptime |
Es el tiempo de actividad del nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Es la cantidad de conexiones de cliente que crea Memorystore en Valkey en el último minuto en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
Es la cantidad de conexiones que rechaza Memorystore en Valkey porque el nodo de la instancia alcanza el límite de "maxclients". |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
Es el tiempo consumido por cada comando en el nodo de instancia. |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
Es la cantidad de llamadas de este comando en el nodo de la instancia en un minuto. |
memorystore.googleapis.com/instance/node/cpu/utilization |
Es el uso de CPU del nodo de la instancia (de 0.0 a 1.0). |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
Es la cantidad de eventos de vencimiento en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
Es la cantidad de claves expulsadas por el nodo de instancia. |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Es la cantidad de claves que Memorystore para Valkey almacena en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
Es la cantidad de búsquedas de claves correctas en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
Es la cantidad de búsquedas de claves con errores en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/memory/utilization |
Es el uso de memoria del nodo de la instancia (de 0.0 a 1.0). |
memorystore.googleapis.com/instance/node/memory/usage |
Es el uso de memoria del nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
Es la cantidad de bytes de red entrantes que recibe el nodo de la instancia. |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
Es la cantidad de bytes de red salientes que envía el nodo de la instancia. |
memorystore.googleapis.com/instance/node/replication/offset |
Los bytes de compensación de replicación del nodo de instancia |
Métricas de replicación entre regiones
En esta sección, se enumeran las métricas que se usan para la replicación entre regiones.
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
Esta métrica muestra la cantidad de vínculos de fragmentos entre las instancias principales y secundarias. Dentro de un grupo de replicación entre regiones, una instancia principal informa la cantidad de vínculos de replicación entre regiones que tiene con las instancias secundarias del grupo. Para cada instancia secundaria, se espera que esta cantidad sea igual a la cantidad de fragmentos. Si la cantidad disminuye por debajo de la cantidad de fragmentos, esta métrica identifica la cantidad de fragmentos cuando se detuvo la replicación entre el replicador y el seguidor. En un estado ideal, esta métrica tiene el mismo número que el recuento de fragmentos de la instancia principal. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
Esta métrica muestra la diferencia máxima de compensación de replicación entre los fragmentos primarios y secundarios. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
Esta métrica muestra la diferencia promedio de compensación de replicación entre los fragmentos primarios y secundarios. |
Métricas de copia de seguridad
En esta sección, se enumeran las métricas de copia de seguridad y importación.
Métricas a nivel de la instancia
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
La hora de inicio de la última operación de copia de seguridad. |
memorystore.googleapis.com/instance/backup/last_backup_status |
Es el estado de la última operación de copia de seguridad. Los estados son 1 (correcto) y 0 (error). |
memorystore.googleapis.com/instance/backup/last_backup_duration |
Es la duración de la última operación de copia de seguridad (en milisegundos). |
memorystore.googleapis.com/instance/backup/last_backup_size |
Es el tamaño de la última copia de seguridad (en bytes). |
memorystore.googleapis.com/instance/import/last_import_start_time |
La hora de inicio de la última operación de importación. |
memorystore.googleapis.com/instance/import/last_import_duration |
Es la duración de la última operación de importación(en milisegundos). |
Métricas de persistencia
En esta sección, se enumeran las métricas de persistencia y se proporcionan casos de uso de muestra para las métricas de persistencia.
Métricas de persistencia de la RDB
Métricas a nivel de la instancia
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Es el recuento acumulativo de cargas de toda la instancia para la persistencia de AOF o RDB. |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Es la cantidad acumulativa de veces que tu instancia toma una instantánea de la RDB (también conocida como guardado). Esta métrica tiene un campo status_code . Para verificar si una instantánea falla, puedes filtrar el campo status_code en busca del siguiente error: 3 - INTERNAL ERROR . |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Es la edad de la instantánea de distribución para todos los nodos de la instancia. Debes ver que la distribución tenga valores con menos tiempo de retraso (o el mismo tiempo) que la frecuencia de instantáneas. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Es el recuento acumulativo de comandos de escritura denegados en la instancia debido a un error de persistencia. |
Métricas a nivel del nodo
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
Hay un RDB BGSAVE en curso en el nodo de la instancia. TRUE significa que el guardado está en curso. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
El éxito del último BGSAVE en el nodo de instancia TRUE significa que se produce un BGSAVE correcto. Si no se produce bgrewrite , el valor predeterminado puede ser TRUE . |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
La métrica muestra la cantidad acumulada de operaciones de guardado de RDB que se ejecutaron en el nodo de la instancia. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
Es el tiempo (en segundos) transcurrido desde la última instantánea correcta. |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
Es el tiempo restante (en segundos) hasta la siguiente instantánea. |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
Es la cantidad de claves en el guardado de RDB que se ejecuta en el nodo de la instancia. |
Métricas de persistencia de AOF
Métricas a nivel de la instancia
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Esta métrica muestra una distribución del retraso (desde la escritura de datos hasta la sincronización del almacenamiento duradero) para todos los nodos de la instancia. Solo se emite para instancias con appendfsync=everysec. Lo ideal es que la distribución tenga valores con menos tiempo de retraso (o el mismo tiempo) que la frecuencia de sincronización de AOF. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Esta métrica muestra la cantidad acumulada de veces que un nodo activó una reescritura de AOF en tu instancia. Esta métrica tiene un campo status_code . Para verificar si las reescrituras de AOF fallan, puedes filtrar el campo status_code en busca del siguiente error: 3 - INTERNAL_ERROR |
Métricas a nivel del nodo
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
Esta métrica muestra el éxito de la última operación de escritura de AOF en el nodo de la instancia. TRUE significa que se realizó correctamente. Si no se produjo ninguna operación de escritura, el valor puede establecerse de forma predeterminada en TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
Esta métrica muestra el éxito de la última operación de bgrewrite de AOF en el nodo de la instancia. TRUE significa que se realizó correctamente. Si no se produjo ningún bgrewrite, el valor puede establecerse de forma predeterminada en TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
Esta métrica muestra el retraso de AOF entre la memoria y el almacenamiento persistente en el nodo de la instancia. Solo se aplica a las instancias habilitadas para AOF en las que appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
Esta métrica muestra el recuento de reescrituras de AOF en el nodo de la instancia. Para verificar si las reescrituras de AOF fallan, puedes filtrar el campo status_code en busca del siguiente error: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
Esta métrica muestra el recuento de errores de llamada fsync() de AOF y solo se aplica a instancias habilitadas para AOF en las que appendfsync=EVERYSEC|ALWAYS. |
Métricas de persistencia comunes
Métricas que se aplican a los mecanismos de persistencia de AOF y RDB.
Métricas a nivel del nodo
Nombre de la métrica | Descripción |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
Esta métrica muestra el recuento de restablecimientos del archivo de volcado (AOF o RDB). Para verificar si los restablecimientos fallan, puedes filtrar el campo status_code en busca del siguiente error: 2 - INTERNAL_ERROR. |
Ejemplos de casos de uso para las métricas de persistencia
Cómo verificar si las operaciones de escritura de AOF causan latencia y presión en la memoria
Supongamos que detectas un aumento en la latencia o el uso de memoria en tu instancia o en el nodo dentro de ella. En este caso, te recomendamos que compruebes si el uso adicional está relacionado con la persistencia de AOF.
Como sabes que las operaciones de reescritura de AOF pueden activar aumentos transitorios de carga, puedes inspeccionar la métrica aof_rewrites_count
, que te brinda el recuento acumulativo de las reescrituras de AOF durante el ciclo de vida de la instancia o el nodo dentro de ella. Supongamos que esta métrica te muestra que los incrementos en el recuento de reescrituras corresponden a aumentos en la latencia. En esta circunstancia, puedes abordar el problema reduciendo la tasa de escritura o aumentando el recuento de fragmentos para reducir la frecuencia de las reescrituras.
Verifica si las operaciones de guardado de la RDB causan latencia y presión en la memoria
Supongamos que detectas un aumento en la latencia o el uso de memoria en tu instancia o en el nodo dentro de ella. En este caso, te recomendamos que verifiques si el uso adicional está relacionado con la persistencia de la RDB.
Como sabes que las operaciones de guardado de RDB pueden activar aumentos transitorios de carga, puedes inspeccionar la métrica rdb_saves_count
, que proporciona el recuento acumulativo de guardados de RDB durante el ciclo de vida de la instancia o el nodo dentro de ella. Supongamos que esta métrica te muestra que los incrementos en el recuento de ahorros de RDB corresponden a aumentos de latencia. En esta circunstancia, puedes reducir el intervalo de instantáneas de la RDB para disminuir la frecuencia de las reescrituras. También puedes escalar la instancia para reducir los niveles de carga del modelo de referencia.
Cómo interpretar las métricas de Memorystore para Valkey
Como se ve en la lista anterior, muchas de las métricas comparten tres categorías: promedio, máximo y total.
En el caso de Memorystore para Valkey, proporcionamos variaciones promedio y máximas de la misma métrica para que puedas usarlas para identificar los hotspots de esa familia de métricas.
El valor total de la métrica es independiente y proporciona estadísticas independientes que no están relacionadas con el propósito de los hotspots de promedio y máximo.
Información sobre las métricas promedio y máximas
Supongamos que comparas los valores average_keyspace_hits
y maximum_keyspace_hits
de tu instancia. A medida que aumenta la diferencia entre las dos métricas, una mayor diferencia indica que hay más puntos calientes de hits en tu instancia. Lo ideal es que tengas un valor cercano entre average_keyspace_hits
y maximum_keyspace_hits
, ya que esto significa que los hits se distribuyen de forma más uniforme en tu instancia.
Este principio se aplica a todas las métricas que tienen las variaciones promedio y máxima de la misma métrica.
Ejemplo de punto de acceso
Si comparas average_keyspace_hits
y maximum_keyspace_hits
para todos los fragmentos de tu instancia, la comparación de estos valores indica dónde se produce el hotspot. Por ejemplo, supongamos que los fragmentos de una instancia de 6 fragmentos tienen la siguiente
cantidad de hits:
- Fragmento 1: 2 hits
- Fragmento 2: 2 hits
- Fragmento 3: 2 hits
- Fragmento 4: 2 hits
- Fragmento 5: 2 hits
- Fragmento 6 a 8 hits
En este ejemplo, average_keyspace_hits
muestra un valor de 3 y maximum_keyspace_hits
muestra 8, lo que indica que el fragmento 6 está activo.
Proporcionamos métricas a nivel del nodo que podrían ser útiles para identificar hotspots dentro de la instancia.