Diese Seite wurde von der Cloud Translation API übersetzt.

Unterstützte Monitoring-Messwerte

Auf dieser Seite werden die für Memorystore for Redis Cluster verfügbaren Cloud Monitoring-Messwerte aufgelistet und es wird beschrieben, was die einzelnen Messwerte messen.

Cloud Monitoring-Messwerte

Messwerte auf Clusterebene

Diese Messwerte bieten einen allgemeinen Überblick über den Gesamtzustand und die Leistung des Clusters. Sie sind hilfreich, um die Gesamtkapazität und ‑auslastung des Clusters zu verstehen und potenzielle Engpässe oder Bereiche mit Verbesserungspotenzial zu identifizieren.

Messwertname	Beschreibung
`redis.googleapis.com/cluster/clients/average_connected_clients`	Durchschnittliche aktuelle Anzahl von Clientverbindungen im Cluster.
`redis.googleapis.com/cluster/clients/maximum_connected_clients`	Maximale aktuelle Anzahl von Clientverbindungen im Cluster.
`redis.googleapis.com/cluster/clients/total_connected_clients`	Aktuelle Anzahl der Clientverbindungen zum Cluster.
`redis.googleapis.com/cluster/stats/total_connections_received_count`	Anzahl der auf Clusterebene erstellten Clientverbindungen in der letzten Minute.
`redis.googleapis.com/cluster/stats/cluster/stats/total_rejected_connections_count`	Anzahl der abgelehnten Verbindungen aufgrund der Beschränkung „maxclients“.
`redis.googleapis.com/cluster/commandstats/total_usec_count`	Die insgesamt pro Befehl verbrauchte Zeit.
`redis.googleapis.com/cluster/commandstats/total_calls_count`	Gesamtzahl der Aufrufe für diesen Befehl in einer Minute.
`redis.googleapis.com/cluster/cpu/average_utilization`	Durchschnittliche CPU-Auslastung für den Cluster zwischen 0,0 und 1,0.
`redis.googleapis.com/cluster/cpu/maximum_utilization`	Die maximale CPU-Auslastung für den Cluster zwischen 0,0 und 1,0. Die CPU-Auslastung darf für den primären Knoten 0,8 Sekunden und für jedes als Lesereplikat festgelegte Replikat 0,5 Sekunden nicht überschreiten. Weitere Informationen finden Sie unter Best Practices für die CPU-Nutzung.
`redis.googleapis.com/cluster/stats/average_expired_keys`	Durchschnittliche Anzahl von Schlüsselablaufereignissen für die Primärschlüssel.
`redis.googleapis.com/cluster/stats/maximum_expired_keys`	Maximale Anzahl von Schlüsselablaufereignissen für die primaries.
`redis.googleapis.com/cluster/stats/total_expired_keys_count`	Die Gesamtzahl der Schlüsselablaufereignisse für die primären Schlüssel.
`redis.googleapis.com/cluster/stats/average_evicted_keys`	Durchschnittliche Anzahl der aufgrund der Speicherkapazität entfernten Schlüssel für die Primaries.
`redis.googleapis.com/cluster/stats/maximum_evicted_keys`	Maximale Anzahl der aufgrund der Speicherkapazität auf primären Instanzen entfernten Schlüssel
`redis.googleapis.com/cluster/stats/total_evicted_keys_count`	Anzahl der Schlüssel, die aufgrund der Speicherkapazität auf primaries entfernt wurden.
`redis.googleapis.com/cluster/keyspace/total_keys`	Anzahl der im Cluster gespeicherten Schlüssel.
`redis.googleapis.com/cluster/stats/average_keyspace_hits`	Durchschnittliche Anzahl erfolgreicher Schlüssel-Lookups im Cluster.
`redis.googleapis.com/cluster/stats/maximum_keyspace_hits`	Maximale Anzahl erfolgreicher Schlüssel-Lookups im Cluster.
`redis.googleapis.com/cluster/stats/total_keyspace_hits_count`	Anzahl der erfolgreichen Lookups von Schlüsseln im Cluster.
`redis.googleapis.com/cluster/stats/average_keyspace_misses`	Durchschnittliche Anzahl der fehlgeschlagenen Lookups von Schlüsseln im Cluster.
`redis.googleapis.com/cluster/stats/maximum_keyspace_misses`	Maximale Anzahl fehlgeschlagener Lookups von Schlüsseln im Cluster.
`redis.googleapis.com/cluster/stats/total_keyspace_misses_count`	Gesamtzahl der fehlgeschlagenen Lookups von Schlüsseln im gesamten Cluster.
`redis.googleapis.com/cluster/memory/average_utilization`	Durchschnittliche Arbeitsspeicherauslastung im Cluster zwischen 0,0 und 1,0.
`redis.googleapis.com/cluster/memory/maximum_utilization`	Maximale Arbeitsspeicherauslastung im Cluster zwischen 0,0 und 1,0.
`redis.googleapis.com/cluster/memory/total_used_memory`	Gesamte Arbeitsspeichernutzung des Clusters.
`redis.googleapis.com/cluster/memory/size`	Arbeitsspeichergröße des Clusters.
`redis.googleapis.com/cluster/replication/average_ack_lag`	Mittlere Bestätigungsverzögerung (in Sekunden) von Replikaten im Cluster. Die Bestätigungsverzögerung ist ein Engpass auf dem primären Knoten in einem Cluster. Dieser Engpass wird durch die Replikate verursacht, die mit den Informationen, die der primäre Knoten an sie sendet, nicht mithalten können. In diesem Fall muss der primäre Knoten auf die Bestätigung warten, dass die Replikate die Informationen erhalten haben. Dies kann die Commit-Vorgänge für Transaktionen verlangsamen und die Leistung des primären Knotens beeinträchtigen.
`redis.googleapis.com/cluster/replication/maximum_ack_lag`	Maximale Bestätigungsverzögerung (in Sekunden) von Replikaten im gesamten Cluster.
`redis.googleapis.com/cluster/replication/average_offset_diff`	Durchschnittliche Differenz des Replikationsbestätigungs-Offsets (in Byte) im Cluster. Die Differenz des Replikationsbestätigungs-Offsets gibt die Anzahl der Byte an, die nicht zwischen Replikaten und ihren primären Instanzen repliziert wurden.
`redis.googleapis.com/cluster/replication/maximum_offset_diff`	Maximaler Replikations-Offset-Unterschied (in Byte) im Cluster. Der Replikations-Offset-Unterschied gibt die Anzahl der Byte an, die zwischen einem Replikat und seinem primären Element nicht repliziert wurden.
`redis.googleapis.com/cluster/stats/total_net_input_bytes_count`	Anzahl der eingehenden Netzwerkbytes, die von den Clusterendpunkten empfangen wurden.
`redis.googleapis.com/cluster/stats/total_net_output_bytes_count`	Anzahl der ausgehenden Netzwerkbytes, die von den Clusterendpunkten gesendet wurden.

Messwerte auf Knotenebene

Diese Messwerte bieten detaillierte Einblicke in den Zustand und die Leistung einzelner Knoten im Cluster. Sie sind hilfreich, um Probleme mit bestimmten Knoten zu beheben und ihre Leistung zu optimieren.

Messwertname	Beschreibung
`redis.googleapis.com/cluster/node/clients/connected_clients`	Anzahl der Clients, die mit dem Clusterknoten verbunden sind.
`redis.googleapis.com/cluster/node/clients/blocked_clients`	Anzahl der Clientverbindungen, die vom Clusterknoten blockiert wurden.
`redis.googleapis.com/cluster/node/server/uptime`	Misst die Betriebszeit des Clusterknotens.
`redis.googleapis.com/cluster/node/stats/connections_received_count`	Anzahl der Clientverbindungen, die in der letzten Minute auf dem Clusterknoten erstellt wurden.
`redis.googleapis.com/cluster/node/stats/rejected_connections_count`	Anzahl der Verbindungen, die aufgrund des Limits für „maxclients“ vom Clusterknoten abgelehnt wurden.
`redis.googleapis.com/cluster/node/commandstats/usec_count`	Die Gesamtzeit, die pro Befehl auf dem Clusternknoten benötigt wird.
`redis.googleapis.com/cluster/node/commandstats/calls_count`	Die Gesamtzahl der Aufrufe für diesen Befehl auf dem Clusterknoten in einer Minute.
`redis.googleapis.com/cluster/node/cpu/utilization`	CPU-Auslastung für den Clusterknoten zwischen 0,0 und 1,0.
`redis.googleapis.com/cluster/node/stats/expired_keys_count`	Gesamtzahl der Ablaufereignisse im Clusterknoten.
`redis.googleapis.com/cluster/node/stats/evicted_keys_count`	Gesamtzahl der vom Clusterknoten entfernten Schlüssel.
`redis.googleapis.com/cluster/node/keyspace/total_keys`	Anzahl der im Clusterknoten gespeicherten Schlüssel.
`redis.googleapis.com/cluster/node/stats/keyspace_hits_count`	Anzahl der erfolgreichen Lookups von Schlüsseln im Clusternknoten.
`redis.googleapis.com/cluster/node/stats/keyspace_misses_count`	Anzahl der fehlgeschlagenen Lookups von Schlüsseln im Clusternode.
`redis.googleapis.com/cluster/node/memory/utilization`	Speicherauslastung auf dem Clusterknoten zwischen 0,0 und 1,0.
`redis.googleapis.com/cluster/node/memory/usage`	Gesamte Arbeitsspeichernutzung des Clusterknotens.
`redis.googleapis.com/cluster/node/stats/net_input_bytes_count`	Anzahl der eingehenden Netzwerkbytes, die vom Clusterknoten empfangen wurden.
`redis.googleapis.com/cluster/node/stats/net_output_bytes_count`	Anzahl der ausgehenden Netzwerk-Byte, die vom Clusterknoten gesendet wurden.
`redis.googleapis.com/cluster/node/replication/offset`	Misst die Replikations-Offset-Bytes des Clusterknotens.
`redis.googleapis.com/cluster/node/server/healthy`	Gibt an, ob ein Clusterknoten verfügbar ist und ordnungsgemäß funktioniert. Dieser Messwert befindet sich im Vorschaumodus.

Messwerte für die regionsübergreifende Replikation

In diesem Abschnitt sind Messwerte für die regionenübergreifende Replikation aufgeführt.

Messwertname	Beschreibung
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links`	Dieser Messwert gibt die Anzahl der Shard-Verknüpfungen zwischen den primären und sekundären Clustern an. In einer Gruppe für die regionenübergreifende Replikation (Cross-Region Replication, CRR) gibt ein primärer Cluster die Anzahl der CRR-Replikationslinks an, die er zu den sekundären Clustern in der Gruppe hat. Für jeden sekundären Cluster sollte diese Zahl der Anzahl der Shards entsprechen. Wenn die Anzahl unerwartet unter die Anzahl der Shards fällt, gibt dies die Anzahl der Shards an, bei denen die Replikation zwischen dem Replikator und dem Follower eingestellt wurde. Im Idealfall sollte dieser Messwert dieselbe Zahl wie die Anzahl der Shards im primären Cluster haben.
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff`	Maximaler Unterschied beim Replikations-Offset zwischen primären und sekundären Shards.
`redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff`	Durchschnittliche Differenz des Replikations-Offsets zwischen primären und sekundären Shards.

Messwerte für Sicherungen

In diesem Abschnitt werden Messwerte für Sicherungen und Importe aufgeführt.

Messwerte auf Clusterebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/backup/last_backup_start_time`	Startzeit des letzten Sicherungsvorgangs.
`redis.googleapis.com/cluster/backup/last_backup_status`	Der Status des letzten Sicherungsvorgangs. Die Status sind `1` (Erfolg) und `0` (Fehler).
`redis.googleapis.com/cluster/backup/last_backup_duration`	Die Dauer des letzten Sicherungsvorgangs in Millisekunden.
`redis.googleapis.com/cluster/backup/last_backup_size`	Die Größe des letzten Back-ups in Byte.
`redis.googleapis.com/cluster/import/last_import_start_time`	Die Startzeit des letzten Importvorgangs.
`redis.googleapis.com/cluster/import/last_import_duration`	Die Dauer des letzten Importvorgangs in Millisekunden.

Messwerte zur Persistenz

In diesem Abschnitt werden Persistenz-Messwerte aufgeführt und es werden Beispielanwendungsfälle für Persistenzmesswerte beschrieben.

Messwerte für die RDB-Persistenz

Messwerte auf Clusterebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/persistence/rdb_saves_count`	Dieser Messwert gibt an, wie oft ein RDB-Snapshot (auch als save bezeichnet) für Ihren Cluster erstellt wurde. Dieser Messwert hat das Feld `status_code`. Wenn Sie prüfen möchten, ob ein Snapshot fehlgeschlagen ist, können Sie das Feld `status_code` nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR
`redis.googleapis.com/cluster/persistence/rdb_save_ages`	Dieser Messwert gibt das Alter eines Verteilungssnapshots für alle Knoten im Cluster an. Im Idealfall sollten die Werte in der Verteilung eine geringere oder gleiche Verzögerungszeit wie Ihre Snapshot-Häufigkeit aufweisen.

Messwerte auf Knotenebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress`	Dieser Messwert gibt an, ob auf dem Clusterknoten derzeit ein RDB-BGSAVE ausgeführt wird. TRUE bedeutet, dass die Aktion läuft.
`redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status`	Dieser Messwert gibt an, ob der letzte BGSAVE-Vorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein bgrewrite stattgefunden hat, kann der Wert standardmäßig auf TRUE gesetzt sein.
`redis.googleapis.com/cluster/node/persistence/rdb_saves_count`	Dieser Messwert gibt die kumulative Anzahl der RDB-Speichervorgänge an, die auf dem Clusterknoten ausgeführt wurden.
`redis.googleapis.com/cluster/node/persistence/rdb_last_save_age`	Dieser Messwert gibt die Zeit in Sekunden seit dem letzten erfolgreichen Snapshot an.
`redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until`	Dieser Messwert gibt die verbleibende Zeit in Sekunden bis zum nächsten Snapshot an.
`redis.googleapis.com/cluster/node/persistence/current_save_keys_total`	Dieser Messwert gibt die Anzahl der Schlüssel im aktuellen RDB-Speichervorgang an, der auf dem Clusterknoten ausgeführt wird.

Messwerte zur AOF-Persistenz

Messwerte auf Clusterebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/persistence/aof_fsync_lags`	Dieser Messwert zeigt eine Verteilung der Verzögerung (vom Schreiben von Daten bis zur Synchronisierung mit dem dauerhaften Speicher) für alle Knoten im Cluster. Sie wird nur für Cluster mit „appendfsync=everysec“ ausgegeben. Im Idealfall sollte die Verteilung Werte mit einer geringeren oder gleichen Verzögerungszeit als die AOF-Synchronisierungshäufigkeit aufweisen.
`redis.googleapis.com/cluster/persistence/aof_rewrite_count`	Dieser Messwert gibt an, wie oft ein Knoten in Ihrem Cluster eine AOF-Neuschreibung ausgelöst hat. Dieser Messwert hat das Feld `status_code`. Wenn Sie prüfen möchten, ob AOF-Neuschreibvorgänge fehlschlagen, können Sie das Feld `status_code` nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR

Messwerte auf Knotenebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/node/persistence/aof_last_write_status`	Dieser Messwert gibt an, ob der letzte AOF-Schreibvorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein Schreibvorgang erfolgt ist, kann der Wert standardmäßig auf TRUE gesetzt sein.
`redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status`	Dieser Messwert gibt an, ob der letzte AOF-bgrewrite-Vorgang auf dem Clusterknoten erfolgreich war. TRUE bedeutet Erfolg. Wenn kein bgrewrite stattgefunden hat, kann der Wert standardmäßig auf TRUE gesetzt sein.
`redis.googleapis.com/cluster/node/persistence/aof_fsync_lag`	Dieser Messwert zeigt die AOF-Verzögerung zwischen dem Arbeitsspeicher und dem persistenten Speicher auf dem Clusterknoten. Dies gilt nur für AOF-aktivierte Cluster, in denen appendfsync=EVERYSEC festgelegt ist.
`redis.googleapis.com/cluster/node/persistence/aof_rewrites_count`	Dieser Messwert gibt die Anzahl der AOF-Neuschreibvorgänge im Clusternknoten an. Wenn Sie prüfen möchten, ob AOF-Neuschreibvorgänge fehlschlagen, können Sie das Feld `status_code` nach dem folgenden Fehler filtern: 3 – INTERNAL_ERROR
`redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count`	Dieser Messwert gibt die Anzahl der AOF-fsync()-Aufruffehler an und gilt nur für AOF-aktivierte Cluster, in denen appendfsync=EVERYSEC\|ALWAYS festgelegt ist.

Häufige Messwerte zur Persistenz

Messwerte, die sowohl für AOF- als auch für RDB-Persistenzmechanismen gelten.

Messwerte auf Knotenebene

Messwertname	Beschreibung
`redis.googleapis.com/cluster/node/persistence/auto_restore_count`	Dieser Messwert gibt die Anzahl der Wiederherstellungen aus der Dumpdatei (AOF oder RDB) an.

Beispiele für Anwendungsfälle für Persistenzmesswerte

Prüfen, ob AOF-Schreibvorgänge zu Latenz und Arbeitsspeicherauslastung führen

Angenommen, Sie stellen eine erhöhte Latenz oder Speichernutzung in Ihrem Cluster oder auf dem Knoten im Cluster fest. In diesem Fall sollten Sie prüfen, ob die zusätzliche Nutzung mit der AOF-Persistenz zusammenhängt.

Da Sie wissen, dass AOF-Überschreibungsvorgänge vorübergehende Lastspitzen auslösen können, können Sie den Messwert aof_rewrites_count untersuchen. Er gibt die kumulative Anzahl von AOF-Überschreibungen über die Lebensdauer des Clusters oder des Knotens im Cluster an. Angenommen, dieser Messwert zeigt, dass eine Erhöhung der Anzahl der Umformulierungen mit einer Erhöhung der Latenz einhergeht. In diesem Fall können Sie das Problem beheben, indem Sie die Schreibgeschwindigkeit reduzieren oder die Anzahl der Shards erhöhen, um die Häufigkeit von Überschreibungen zu verringern.

Prüfen, ob RDB-Speichervorgänge zu Latenz und Arbeitsspeicherauslastung führen

Da Sie wissen, dass RDB-Speichervorgänge vorübergehende Lastspitzen auslösen können, können Sie den Messwert rdb_saves_count untersuchen, der die kumulative Anzahl von RDB-Speichervorgängen über die Lebensdauer des Clusters oder des Knotens im Cluster angibt. Angenommen, dieser Messwert zeigt, dass eine Erhöhung der Anzahl der RDB-Speichervorgänge mit einer Erhöhung der Latenz einhergeht. In diesem Fall können Sie das RDB-Snapshot-Intervall verkürzen, um die Häufigkeit von Überschreibvorgängen zu verringern. Sie können den Cluster auch horizontal skalieren, um die Baseline-Auslastung zu reduzieren.

Messwerte für Memorystore for Redis Cluster interpretieren

Wie in der Liste oben zu sehen ist, haben viele Messwerte drei Kategorien gemeinsam: Durchschnitt, Maximum und Summe.

Für Memorystore for Redis Cluster stellen wir durchschnittliche und maximale Varianten desselben Messwerts bereit, damit Sie beide verwenden können, um Hotspots für diese Messwertfamilie zu identifizieren.

Der Gesamtwert für den Messwert ist unabhängig und bietet separate Informationen, die nicht mit dem Hotspotting-Zweck von Durchschnitt und Maximum zusammenhängen.

Durchschnitts- und Maximalmesswerte

Angenommen, Sie vergleichen die average_keyspace_hits- und maximum_keyspace_hits-Werte für Ihren Cluster. Je größer der Unterschied zwischen den beiden Messwerten ist, desto mehr Hotspots für Treffer gibt es in Ihrer Instanz. Im Idealfall liegt der Wert zwischen average_keyspace_hits und maximum_keyspace_hits, da dies bedeutet, dass die Treffer gleichmäßiger auf Ihre Instanz verteilt sind.

Dieses Prinzip gilt für alle Messwerte, die die Varianten Durchschnitt und Maximum desselben Messwerts haben.

Beispiel für Hotspotting

Wenn Sie average_keyspace_hits und maximum_keyspace_hits für alle Shards in Ihrem Cluster vergleichen, können Sie feststellen, wo Hotspots auftreten. Angenommen, die Shards in einem Cluster mit sechs Shards haben die folgende Anzahl von Treffern:

Shard 1 – 2 Treffer
Shard 2 – 2 Treffer
Shard 3 – 2 Treffer
Shard 4 – 2 Treffer
Shard 5 – 2 Treffer
Shard 6–8 Hits

In diesem Beispiel gibt average_keyspace_hits den Wert 3 und maximum_keyspace_hits den Wert 8 zurück. Das bedeutet, dass Shard 6 aktiv ist.

Wir stellen Messwerte auf Knotenebene bereit, mit denen Sie Hotspots im Cluster identifizieren können.