Unterstützte Monitoring-Messwerte

Auf dieser Seite werden die für Memorystore for Redis Cluster verfügbaren Cloud Monitoring-Messwerte aufgelistet und es wird beschrieben, was die einzelnen Messwerte messen.

Cloud Monitoring-Messwerte

Messwerte auf Clusterebene

Diese Messwerte bieten einen allgemeinen Überblick über den Gesamtzustand und die Leistung des Clusters. Sie sind hilfreich, um die Gesamtkapazität und ‑auslastung des Clusters zu verstehen und potenzielle Engpässe oder Bereiche mit Verbesserungspotenzial zu identifizieren.

Messwertname Beschreibung
redis.googleapis.com/cluster/clients/average_connected_clients Durchschnittliche aktuelle Anzahl von Clientverbindungen im Cluster.
redis.googleapis.com/cluster/clients/maximum_connected_clients Maximale aktuelle Anzahl von Clientverbindungen im Cluster.
redis.googleapis.com/cluster/clients/total_connected_clients Aktuelle Anzahl der Clientverbindungen zum Cluster.
redis.googleapis.com/cluster/stats/total_connections_received_count Anzahl der auf Clusterebene erstellten Clientverbindungen in der letzten Minute.
redis.googleapis.com/cluster/stats/cluster/stats/total_rejected_connections_count Anzahl der abgelehnten Verbindungen aufgrund der Beschränkung „maxclients“.
redis.googleapis.com/cluster/commandstats/total_usec_count Die insgesamt pro Befehl verbrauchte Zeit.
redis.googleapis.com/cluster/commandstats/total_calls_count Gesamtzahl der Aufrufe für diesen Befehl in einer Minute.
redis.googleapis.com/cluster/cpu/average_utilization Durchschnittliche CPU-Auslastung für den Cluster zwischen 0,0 und 1,0.
redis.googleapis.com/cluster/cpu/maximum_utilization

Die maximale CPU-Auslastung für den Cluster zwischen 0,0 und 1,0.

Die CPU-Auslastung darf für den primären Knoten 0,8 Sekunden und für jedes als Lesereplikat festgelegte Replikat 0,5 Sekunden nicht überschreiten. Weitere Informationen finden Sie unter Best Practices für die CPU-Nutzung.

redis.googleapis.com/cluster/stats/average_expired_keys Durchschnittliche Anzahl von Schlüsselablaufereignissen für die Primärschlüssel.
redis.googleapis.com/cluster/stats/maximum_expired_keys Maximale Anzahl von Schlüsselablaufereignissen für die primaries.
redis.googleapis.com/cluster/stats/total_expired_keys_count Die Gesamtzahl der Schlüsselablaufereignisse für die primären Schlüssel.
redis.googleapis.com/cluster/stats/average_evicted_keys Durchschnittliche Anzahl der aufgrund der Speicherkapazität entfernten Schlüssel für die Primaries.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Maximale Anzahl der aufgrund der Speicherkapazität auf primären Instanzen entfernten Schlüssel
redis.googleapis.com/cluster/stats/total_evicted_keys_count Anzahl der Schlüssel, die aufgrund der Speicherkapazität auf primaries entfernt wurden.
redis.googleapis.com/cluster/keyspace/total_keys Anzahl der im Cluster gespeicherten Schlüssel.
redis.googleapis.com/cluster/stats/average_keyspace_hits Durchschnittliche Anzahl erfolgreicher Schlüssel-Lookups im Cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Maximale Anzahl erfolgreicher Schlüssel-Lookups im Cluster.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Anzahl der erfolgreichen Lookups von Schlüsseln im Cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Durchschnittliche Anzahl der fehlgeschlagenen Lookups von Schlüsseln im Cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Maximale Anzahl fehlgeschlagener Lookups von Schlüsseln im Cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Gesamtzahl der fehlgeschlagenen Lookups von Schlüsseln im gesamten Cluster.
redis.googleapis.com/cluster/memory/average_utilization Durchschnittliche Arbeitsspeicherauslastung im Cluster zwischen 0,0 und 1,0.
redis.googleapis.com/cluster/memory/maximum_utilization Maximale Arbeitsspeicherauslastung im Cluster zwischen 0,0 und 1,0.
redis.googleapis.com/cluster/memory/total_used_memory Gesamte Arbeitsspeichernutzung des Clusters.
redis.googleapis.com/cluster/memory/size Arbeitsspeichergröße des Clusters.
redis.googleapis.com/cluster/replication/average_ack_lag Mittlere Bestätigungsverzögerung (in Sekunden) von Replikaten im Cluster.

Die Bestätigungsverzögerung ist ein Engpass auf dem primären Knoten in einem Cluster. Dieser Engpass wird durch die Replikate verursacht, die mit den Informationen, die der primäre Knoten an sie sendet, nicht mithalten können. In diesem Fall muss der primäre Knoten auf die Bestätigung warten, dass die Replikate die Informationen erhalten haben. Dies kann die Commit-Vorgänge für Transaktionen verlangsamen und die Leistung des primären Knotens beeinträchtigen.
redis.googleapis.com/cluster/replication/maximum_ack_lag Maximale Bestätigungsverzögerung (in Sekunden) von Replikaten im gesamten Cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Durchschnittliche Differenz des Replikationsbestätigungs-Offsets (in Byte) im Cluster.

Die Differenz des Replikationsbestätigungs-Offsets gibt die Anzahl der Byte an, die nicht zwischen Replikaten und ihren primären Instanzen repliziert wurden.
redis.googleapis.com/cluster/replication/maximum_offset_diff Maximaler Replikations-Offset-Unterschied (in Byte) im Cluster.

Der Replikations-Offset-Unterschied gibt die Anzahl der Byte an, die zwischen einem Replikat und seinem primären Element nicht repliziert wurden.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Anzahl der eingehenden Netzwerkbytes, die von den Clusterendpunkten empfangen wurden.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Anzahl der ausgehenden Netzwerkbytes, die von den Clusterendpunkten gesendet wurden.

Messwerte auf Knotenebene

Diese Messwerte bieten detaillierte Einblicke in den Zustand und die Leistung einzelner Knoten im Cluster. Sie sind hilfreich, um Probleme mit bestimmten Knoten zu beheben und ihre Leistung zu optimieren.

Messwertname Beschreibung
redis.googleapis.com/cluster/node/clients/connected_clients Anzahl der Clients, die mit dem Clusterknoten verbunden sind.
redis.googleapis.com/cluster/node/clients/blocked_clients Anzahl der Clientverbindungen, die vom Clusterknoten blockiert wurden.
redis.googleapis.com/cluster/node/server/uptime Misst die Betriebszeit des Clusterknotens.
redis.googleapis.com/cluster/node/stats/connections_received_count Anzahl der Clientverbindungen, die in der letzten Minute auf dem Clusterknoten erstellt wurden.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Anzahl der Verbindungen, die aufgrund des Limits für „maxclients“ vom Clusterknoten abgelehnt wurden.
redis.googleapis.com/cluster/node/commandstats/usec_count Die Gesamtzeit, die pro Befehl auf dem Clusternknoten benötigt wird.
redis.googleapis.com/cluster/node/commandstats/calls_count Die Gesamtzahl der Aufrufe für diesen Befehl auf dem Clusterknoten in einer Minute.
redis.googleapis.com/cluster/node/cpu/utilization CPU-Auslastung für den Clusterknoten zwischen 0,0 und 1,0.
redis.googleapis.com/cluster/node/stats/expired_keys_count Gesamtzahl der Ablaufereignisse im Clusterknoten.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Gesamtzahl der vom Clusterknoten entfernten Schlüssel.
redis.googleapis.com/cluster/node/keyspace/total_keys Anzahl der im Clusterknoten gespeicherten Schlüssel.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Anzahl der erfolgreichen Lookups von Schlüsseln im Clusternknoten.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Anzahl der fehlgeschlagenen Lookups von Schlüsseln im Clusternode.
redis.googleapis.com/cluster/node/memory/utilization Speicherauslastung auf dem Clusterknoten zwischen 0,0 und 1,0.
redis.googleapis.com/cluster/node/memory/usage Gesamte Arbeitsspeichernutzung des Clusterknotens.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Anzahl der eingehenden Netzwerkbytes, die vom Clusterknoten empfangen wurden.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Anzahl der ausgehenden Netzwerk-Byte, die vom Clusterknoten gesendet wurden.
redis.googleapis.com/cluster/node/replication/offset Misst die Replikations-Offset-Bytes des Clusterknotens.
redis.googleapis.com/cluster/node/server/healthy Gibt an, ob ein Clusterknoten verfügbar ist und ordnungsgemäß funktioniert. Dieser Messwert befindet sich im Vorschaumodus.

Messwerte für die regionsübergreifende Replikation

In diesem Abschnitt sind Messwerte für die regionenübergreifende Replikation aufgeführt.

Messwertname Beschreibung
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Dieser Messwert gibt die Anzahl der Shard-Verknüpfungen zwischen den primären und sekundären Clustern an. In einer Gruppe für die regionenübergreifende Replikation (Cross-Region Replication, CRR) gibt ein primärer Cluster die Anzahl der CRR-Replikationslinks an, die er zu den sekundären Clustern in der Gruppe hat. Für jeden sekundären Cluster sollte diese Zahl der Anzahl der Shards entsprechen. Wenn die Anzahl unerwartet unter die Anzahl der Shards fällt, gibt dies die Anzahl der Shards an, bei denen die Replikation zwischen dem Replikator und dem Follower eingestellt wurde. Im Idealfall sollte dieser Messwert dieselbe Zahl wie die Anzahl der Shards im primären Cluster haben.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Maximaler Unterschied beim Replikations-Offset zwischen primären und sekundären Shards.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Durchschnittliche Differenz des Replikations-Offsets zwischen primären und sekundären Shards.

Messwerte für Sicherungen

In diesem Abschnitt werden Messwerte für Sicherungen und Importe aufgeführt.

Messwerte auf Clusterebene

Messwertname Beschreibung
redis.googleapis.com/cluster/backup/last_backup_start_time Startzeit des letzten Sicherungsvorgangs.
redis.googleapis.com/cluster/backup/last_backup_status Der Status des letzten Sicherungsvorgangs. Die Status sind 1 (Erfolg) und 0 (Fehler).
redis.googleapis.com/cluster/backup/last_backup_duration Die Dauer des letzten Sicherungsvorgangs in Millisekunden.
redis.googleapis.com/cluster/backup/last_backup_size Die Größe des letzten Back-ups in Byte.
redis.googleapis.com/cluster/import/last_import_start_time Die Startzeit des letzten Importvorgangs.
redis.googleapis.com/cluster/import/last_import_duration Die Dauer des letzten Importvorgangs in Millisekunden.

Messwerte zur Persistenz

In diesem Abschnitt werden Persistenz-Messwerte aufgeführt und es werden Beispielanwendungsfälle für Persistenzmesswerte beschrieben.

Messwerte für die RDB-Persistenz

Messwerte auf Clusterebene

Messwertname Beschreibung
redis.googleapis.com/cluster/persistence/rdb_saves_count Dieser Messwert gibt an, wie oft ein RDB-Snapshot (auch als save bezeichnet) für Ihren Cluster erstellt wurde. Dieser Messwert hat das Feld status_code. Wenn Sie prüfen möchten, ob ein Snapshot fehlgeschlagen ist, können Sie das Feld status_code nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR
redis.googleapis.com/cluster/persistence/rdb_save_ages Dieser Messwert gibt das Alter eines Verteilungssnapshots für alle Knoten im Cluster an. Im Idealfall sollten die Werte in der Verteilung eine geringere oder gleiche Verzögerungszeit wie Ihre Snapshot-Häufigkeit aufweisen.

Messwerte auf Knotenebene

Messwertname Beschreibung
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Dieser Messwert gibt an, ob auf dem Clusterknoten derzeit ein RDB-BGSAVE ausgeführt wird. TRUE bedeutet, dass die Aktion läuft.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Dieser Messwert gibt an, ob der letzte BGSAVE-Vorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein bgrewrite stattgefunden hat, kann der Wert standardmäßig auf TRUE gesetzt sein.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Dieser Messwert gibt die kumulative Anzahl der RDB-Speichervorgänge an, die auf dem Clusterknoten ausgeführt wurden.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Dieser Messwert gibt die Zeit in Sekunden seit dem letzten erfolgreichen Snapshot an.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Dieser Messwert gibt die verbleibende Zeit in Sekunden bis zum nächsten Snapshot an.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Dieser Messwert gibt die Anzahl der Schlüssel im aktuellen RDB-Speichervorgang an, der auf dem Clusterknoten ausgeführt wird.

Messwerte zur AOF-Persistenz

Messwerte auf Clusterebene

Messwertname Beschreibung
redis.googleapis.com/cluster/persistence/aof_fsync_lags Dieser Messwert zeigt eine Verteilung der Verzögerung (vom Schreiben von Daten bis zur Synchronisierung mit dem dauerhaften Speicher) für alle Knoten im Cluster. Sie wird nur für Cluster mit „appendfsync=everysec“ ausgegeben. Im Idealfall sollte die Verteilung Werte mit einer geringeren oder gleichen Verzögerungszeit als die AOF-Synchronisierungshäufigkeit aufweisen.
redis.googleapis.com/cluster/persistence/aof_rewrite_count Dieser Messwert gibt an, wie oft ein Knoten in Ihrem Cluster eine AOF-Neuschreibung ausgelöst hat. Dieser Messwert hat das Feld status_code. Wenn Sie prüfen möchten, ob AOF-Neuschreibvorgänge fehlschlagen, können Sie das Feld status_code nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR

Messwerte auf Knotenebene

Messwertname Beschreibung
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Dieser Messwert gibt an, ob der letzte AOF-Schreibvorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein Schreibvorgang erfolgt ist, kann der Wert standardmäßig auf TRUE gesetzt sein.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Dieser Messwert gibt an, ob der letzte AOF-bgrewrite-Vorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein bgrewrite stattgefunden hat, kann der Wert standardmäßig auf TRUE gesetzt sein.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag Dieser Messwert zeigt die AOF-Verzögerung zwischen dem Arbeitsspeicher und dem persistenten Speicher auf dem Clusterknoten. Dies gilt nur für AOF-aktivierte Cluster, in denen appendfsync=EVERYSEC festgelegt ist.
redis.googleapis.com/cluster/node/persistence/aof_rewrites_count Dieser Messwert gibt die Anzahl der AOF-Neuschreibvorgänge im Clusternknoten an. Wenn Sie prüfen möchten, ob AOF-Neuschreibvorgänge fehlschlagen, können Sie das Feld status_code nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR
redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Dieser Messwert gibt die Anzahl der AOF-fsync()-Aufruffehler an und gilt nur für AOF-aktivierte Cluster, in denen appendfsync=EVERYSEC|ALWAYS festgelegt ist.

Häufige Messwerte zur Persistenz

Messwerte, die sowohl für AOF- als auch für RDB-Persistenzmechanismen gelten.

Messwerte auf Knotenebene

Messwertname Beschreibung
redis.googleapis.com/cluster/node/persistence/auto_restore_count Dieser Messwert gibt die Anzahl der Wiederherstellungen aus der Dumpdatei (AOF oder RDB) an.

Beispiele für Anwendungsfälle für Persistenzmesswerte

Prüfen, ob AOF-Schreibvorgänge zu Latenz und Arbeitsspeicherauslastung führen

Angenommen, Sie stellen eine erhöhte Latenz oder Speichernutzung in Ihrem Cluster oder auf dem Knoten im Cluster fest. In diesem Fall sollten Sie prüfen, ob die zusätzliche Nutzung mit der AOF-Persistenz zusammenhängt.

Da Sie wissen, dass AOF-Überschreibungsvorgänge vorübergehende Lastspitzen auslösen können, können Sie den Messwert aof_rewrites_count untersuchen. Er gibt die kumulative Anzahl von AOF-Überschreibungen über die Lebensdauer des Clusters oder des Knotens im Cluster an. Angenommen, dieser Messwert zeigt, dass eine Erhöhung der Anzahl der Umformulierungen mit einer Erhöhung der Latenz einhergeht. In diesem Fall können Sie das Problem beheben, indem Sie die Schreibgeschwindigkeit reduzieren oder die Anzahl der Shards erhöhen, um die Häufigkeit von Überschreibungen zu verringern.

Prüfen, ob RDB-Speichervorgänge zu Latenz und Arbeitsspeicherauslastung führen

Angenommen, Sie stellen eine erhöhte Latenz oder Speichernutzung in Ihrem Cluster oder auf dem Knoten im Cluster fest. In diesem Fall sollten Sie prüfen, ob die zusätzliche Nutzung mit der RDB-Persistenz zusammenhängt.

Da Sie wissen, dass RDB-Speichervorgänge vorübergehende Lastspitzen auslösen können, können Sie den Messwert rdb_saves_count untersuchen, der die kumulative Anzahl von RDB-Speichervorgängen über die Lebensdauer des Clusters oder des Knotens im Cluster angibt. Angenommen, dieser Messwert zeigt, dass eine Erhöhung der Anzahl der RDB-Speichervorgänge mit einer Erhöhung der Latenz einhergeht. In diesem Fall können Sie das RDB-Snapshot-Intervall verkürzen, um die Häufigkeit von Überschreibvorgängen zu verringern. Sie können den Cluster auch horizontal skalieren, um die Baseline-Auslastung zu reduzieren.

Messwerte für Memorystore for Redis Cluster interpretieren

Wie in der Liste oben zu sehen ist, haben viele Messwerte drei Kategorien gemeinsam: Durchschnitt, Maximum und Summe.

Für Memorystore for Redis Cluster stellen wir durchschnittliche und maximale Varianten desselben Messwerts bereit, damit Sie beide verwenden können, um Hotspots für diese Messwertfamilie zu identifizieren.

Der Gesamtwert für den Messwert ist unabhängig und bietet separate Informationen, die nicht mit dem Hotspotting-Zweck von Durchschnitt und Maximum zusammenhängen.

Durchschnitts- und Maximalmesswerte

Angenommen, Sie vergleichen die average_keyspace_hits- und maximum_keyspace_hits-Werte für Ihren Cluster. Je größer der Unterschied zwischen den beiden Messwerten ist, desto mehr Hotspots für Treffer gibt es in Ihrer Instanz. Im Idealfall liegt der Wert zwischen average_keyspace_hits und maximum_keyspace_hits, da dies bedeutet, dass die Treffer gleichmäßiger auf Ihre Instanz verteilt sind.

Dieses Prinzip gilt für alle Messwerte, die die Varianten Durchschnitt und Maximum desselben Messwerts haben.

Beispiel für Hotspotting

Wenn Sie average_keyspace_hits und maximum_keyspace_hits für alle Shards in Ihrem Cluster vergleichen, können Sie feststellen, wo Hotspots auftreten. Angenommen, die Shards in einem Cluster mit sechs Shards haben die folgende Anzahl von Treffern:

  • Shard 1 – 2 Treffer
  • Shard 2 – 2 Treffer
  • Shard 3 – 2 Treffer
  • Shard 4 – 2 Treffer
  • Shard 5 – 2 Treffer
  • Shard 6–8 Hits

In diesem Beispiel gibt average_keyspace_hits den Wert 3 und maximum_keyspace_hits den Wert 8 zurück. Das bedeutet, dass Shard 6 aktiv ist.

Wir stellen Messwerte auf Knotenebene bereit, mit denen Sie Hotspots im Cluster identifizieren können.