Metrik pemantauan yang didukung

Halaman ini mencantumkan metrik Cloud Monitoring yang tersedia untuk Memorystore for Valkey, dan menjelaskan apa yang diukur oleh setiap metrik.

Metrik Cloud Monitoring

Nama metrik Deskripsi
memorystore.googleapis.com/instance/clients/average_connected_clients Rata-rata jumlah koneksi klien saat ini di semua node dalam instance.
memorystore.googleapis.com/instance/clients/maximum_connected_clients Jumlah maksimum koneksi klien saat ini untuk satu node dalam instance.
memorystore.googleapis.com/instance/clients/maximum_connection_duration Durasi maksimum koneksi klien untuk satu node dalam instance.
memorystore.googleapis.com/instance/clients/total_connected_clients Jumlah koneksi klien saat ini ke instance.
memorystore.googleapis.com/instance/stats/total_connections_received_count Jumlah total koneksi klien tingkat instance yang dibuat dalam satu menit terakhir.
memorystore.googleapis.com/instance/stats/total_rejected_connections_count Jumlah koneksi yang ditolak karena batas maxclients.
memorystore.googleapis.com/instance/commandstats/total_usec_count Total waktu yang digunakan per perintah.
memorystore.googleapis.com/instance/commandstats/total_calls_count Total jumlah panggilan untuk perintah ini dalam satu menit.
memorystore.googleapis.com/instance/cpu/average_utilization Pemakaian CPU rata-rata di semua node dalam instance dari 0,0 hingga 1,0.
memorystore.googleapis.com/instance/cpu/maximum_utilization Penggunaan CPU maksimum untuk satu node dalam instance dari 0,0 hingga 1,0.
memorystore.googleapis.com/instance/stats/average_expired_keys Jumlah rata-rata peristiwa habis masa berlaku kunci untuk utama dari semua node dalam instance.
memorystore.googleapis.com/instance/stats/maximum_expired_keys Jumlah maksimum peristiwa masa berlaku kunci untuk satu node dalam instance untuk utama.
memorystore.googleapis.com/instance/stats/total_expired_keys_count Total jumlah peristiwa habis masa berlaku kunci di seluruh utama dari semua node dalam instance.
memorystore.googleapis.com/instance/stats/average_evicted_keys Rata-rata jumlah kunci yang dihapus karena kapasitas memori di seluruh primer dari semua node dalam instance.
memorystore.googleapis.com/instance/stats/maximum_evicted_keys Jumlah maksimum kunci yang dihapus untuk satu node dalam instance karena kapasitas memori untuk utama.
memorystore.googleapis.com/instance/stats/total_evicted_keys_count Jumlah kunci yang dihapus karena kapasitas memori di seluruh utama dari semua node dalam instance.
memorystore.googleapis.com/instance/keyspace/total_keys Jumlah kunci yang disimpan dalam instance.
memorystore.googleapis.com/instance/stats/average_keyspace_hits Rata-rata jumlah pencarian kunci yang berhasil di semua node dalam instance.
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits Jumlah maksimum pencarian kunci yang berhasil untuk satu node dalam instance.
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count Jumlah pencarian kunci yang berhasil untuk instance.
memorystore.googleapis.com/instance/stats/average_keyspace_misses Rata-rata jumlah pencarian kunci yang gagal di semua node dalam instance.
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses Jumlah maksimum pencarian kunci yang gagal untuk satu node dalam instance.
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count Jumlah total pencarian kunci yang gagal untuk instance.
memorystore.googleapis.com/instance/memory/average_utilization Rata-rata penggunaan memori di semua node dalam instance. Nilainya dari 0,0 hingga 1,0.
memorystore.googleapis.com/instance/memory/maximum_utilization Pemakaian memori maksimum untuk satu node dalam instance dari 0,0 hingga 1,0.
memorystore.googleapis.com/instance/memory/total_used_memory Total penggunaan memori instance.
memorystore.googleapis.com/instance/memory/size Ukuran memori instance.
memorystore.googleapis.com/instance/replication/average_ack_lag Rata-rata jeda replikasi (dalam detik) replika di semua node dalam instance.

Jeda replikasi (dalam detik) menunjukkan seberapa jauh replika tertinggal dari replika utama.
memorystore.googleapis.com/instance/replication/maximum_ack_lag Jeda konfirmasi replikasi maksimum (dalam detik) untuk satu replika dalam instance.

Jeda konfirmasi replikasi (dalam detik) menunjukkan seberapa jauh konfirmasi replikasi tertinggal dari replika utama.
memorystore.googleapis.com/instance/replication/average_offset_diff Perbedaan offset konfirmasi replikasi rata-rata (dalam byte) di semua node dalam instance.

Perbedaan offset konfirmasi replikasi berarti jumlah byte yang belum direplikasi antara replika dan replika utamanya.
memorystore.googleapis.com/instance/replication/maximum_offset_diff Perbedaan offset replikasi maksimum (dalam byte) untuk satu node dalam instance.

Perbedaan offset replikasi berarti jumlah byte yang belum direplikasi antara replika dan primernya.
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count Jumlah byte jaringan masuk yang diterima oleh endpoint instance.
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count Jumlah byte jaringan keluar yang dikirim dari endpoint instance.

Metrik persistensi

Bagian ini mencantumkan metrik persistensi dan memberikan contoh kasus penggunaan untuk metrik persistensi.

Metrik persistensi RDB

Nama metrik Deskripsi
memorystore.googleapis.com/instance/persistence/load_count Jumlah kumulatif pemuatan dari file dump di seluruh instance (AOF atau RDB).
memorystore.googleapis.com/instance/persistence/rdb_saves_count Metrik ini menunjukkan jumlah kumulatif frekuensi instance Anda mengambil snapshot RDB (juga dikenal sebagai simpan). Metrik ini memiliki kolom status_code. Untuk memeriksa apakah snapshot telah gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages Metrik ini menunjukkan usia snapshot distribusi untuk semua node di seluruh instance. Idealnya, Anda ingin melihat distribusi memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi snapshot.
memorystore.googleapis.com/instance/persistence/rejected_writes_count Jumlah kumulatif perintah tulis yang ditolak di seluruh instance karena kegagalan untuk dipertahankan.

Metrik persistensi AOF

Nama metrik Deskripsi
memorystore.googleapis.com/instance/persistence/aof_fsync_lags Metrik ini menunjukkan distribusi jeda (dari penulisan data ke sinkronisasi penyimpanan yang andal) untuk semua node dalam instance. Ini hanya ditampilkan untuk instance dengan appendfsync=everysec. Idealnya, Anda ingin melihat distribusi memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi sinkronisasi AOF Anda.
memorystore.googleapis.com/instance/persistence/aof_rewrite_count Metrik ini menunjukkan jumlah kumulatif frekuensi node memicu penulisan ulang AOF untuk instance Anda. Metrik ini memiliki kolom status_code. Untuk memeriksa apakah penulisan ulang AOF gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR

Contoh kasus penggunaan untuk metrik persistensi

Memeriksa apakah operasi tulis AOF menyebabkan latensi dan tekanan memori

Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance. Dalam hal ini, Anda dapat memeriksa apakah penggunaan tambahan terkait dengan persistensi AOF.

Karena Anda tahu bahwa operasi penulisan ulang AOF dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik aof_rewrites_count yang memberi Anda jumlah kumulatif penulisan ulang AOF selama masa aktif instance. Misalkan metrik ini menunjukkan bahwa penambahan jumlah penulisan ulang sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengatasi masalah tersebut dengan mengurangi kecepatan tulis atau meningkatkan jumlah shard untuk mengurangi frekuensi penulisan ulang.

Memeriksa apakah operasi penyimpanan RDB menyebabkan latensi dan tekanan memori

Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance. Dalam hal ini, Anda dapat memeriksa apakah penggunaan tambahan terkait dengan persistensi RDB.

Karena Anda tahu bahwa operasi penyimpanan RDB dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik rdb_saves_count yang memberikan jumlah kumulatif penyimpanan RDB selama masa aktif instance. Misalkan metrik ini menunjukkan bahwa penambahan jumlah penyimpanan RDB sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengurangi interval snapshot RDB untuk menurunkan frekuensi penulisan ulang. Anda juga dapat menskalakan instance untuk mengurangi tingkat beban dasar pengukuran.

Menafsirkan metrik untuk Memorystore for Valkey

Seperti yang terlihat dalam daftar di atas, banyak metrik memiliki tiga kategori: rata-rata, maksimum, dan total.

Untuk Memorystore for Valkey, kami menyediakan variasi rata-rata dan maksimum dari metrik yang sama sehingga Anda dapat menggunakannya untuk mengidentifikasi hotspot untuk keluarga metrik tersebut.

Nilai total untuk metrik ini bersifat independen, dan memberikan insight terpisah yang tidak terkait dengan tujuan hotspotting rata-rata dan maksimum.

Memahami metrik rata-rata dan maksimum

Misalnya, Anda membandingkan nilai average_keyspace_hits dan maximum_keyspace_hits untuk instance Anda. Seiring perbedaan antara kedua metrik meningkat, perbedaan yang lebih besar menunjukkan lebih banyak hot spot hit di instance Anda. Idealnya, Anda akan memiliki nilai yang mendekati antara average_keyspace_hits dan maximum_keyspace_hits, karena ini berarti hit didistribusikan secara lebih merata di seluruh instance Anda.

Prinsip ini berlaku untuk semua metrik yang memiliki variasi rata-rata dan maksimum dari metrik yang sama.

Contoh hot spot

Jika Anda membandingkan average_keyspace_hits dan maximum_keyspace_hits untuk semua shard di instance, membandingkan nilai ini akan menunjukkan tempat terjadinya hot spot. Misalnya, shard dalam instance 6 shard memiliki jumlah hit berikut:

  • Shard 1 – 2 hit
  • Shard 2 – 2 hit
  • Shard 3 – 2 hit
  • Shard 4 – 2 hit
  • Shard 5 – 2 hit
  • Hit Shard 6 – 8

Dalam contoh ini, average_keyspace_hits menampilkan nilai 3, dan maximum_keyspace_hits menampilkan 8, yang menunjukkan bahwa shard 6 adalah hot.