Halaman ini mencantumkan metrik Cloud Monitoring yang tersedia untuk Memorystore for Valkey, dan menjelaskan apa yang diukur oleh setiap metrik.
Metrik Cloud Monitoring
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Rata-rata jumlah koneksi klien saat ini di semua node dalam instance. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Jumlah maksimum koneksi klien saat ini untuk satu node dalam instance. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Durasi maksimum koneksi klien untuk satu node dalam instance. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Jumlah koneksi klien saat ini ke instance. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Jumlah total koneksi klien tingkat instance yang dibuat dalam satu menit terakhir. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Jumlah koneksi yang ditolak karena batas maxclients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Total waktu yang digunakan per perintah. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Total jumlah panggilan untuk perintah ini dalam satu menit. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Pemakaian CPU rata-rata di semua node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Penggunaan CPU maksimum untuk satu node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Jumlah rata-rata peristiwa habis masa berlaku kunci untuk utama dari semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Jumlah maksimum peristiwa masa berlaku kunci untuk satu node dalam instance untuk utama. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Total jumlah peristiwa habis masa berlaku kunci di seluruh utama dari semua node dalam instance. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Rata-rata jumlah kunci yang dihapus karena kapasitas memori di seluruh primer dari semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Jumlah maksimum kunci yang dihapus untuk satu node dalam instance karena kapasitas memori untuk utama. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Jumlah kunci yang dihapus karena kapasitas memori di seluruh utama dari semua node dalam instance. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Jumlah kunci yang disimpan dalam instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Rata-rata jumlah pencarian kunci yang berhasil di semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Jumlah maksimum pencarian kunci yang berhasil untuk satu node dalam instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Jumlah pencarian kunci yang berhasil untuk instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Rata-rata jumlah pencarian kunci yang gagal di semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Jumlah maksimum pencarian kunci yang gagal untuk satu node dalam instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Jumlah total pencarian kunci yang gagal untuk instance. |
memorystore.googleapis.com/instance/memory/average_utilization |
Rata-rata penggunaan memori di semua node dalam instance. Nilainya dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Pemakaian memori maksimum untuk satu node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Total penggunaan memori instance. |
memorystore.googleapis.com/instance/memory/size |
Ukuran memori instance. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Rata-rata jeda replikasi (dalam detik) replika di semua node dalam instance. Jeda replikasi (dalam detik) menunjukkan seberapa jauh replika tertinggal dari replika utama. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Jeda konfirmasi replikasi maksimum (dalam detik) untuk satu replika dalam instance. Jeda konfirmasi replikasi (dalam detik) menunjukkan seberapa jauh konfirmasi replikasi tertinggal dari replika utama. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Perbedaan offset konfirmasi replikasi rata-rata (dalam byte) di semua node dalam instance. Perbedaan offset konfirmasi replikasi berarti jumlah byte yang belum direplikasi antara replika dan replika utamanya. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Perbedaan offset replikasi maksimum (dalam byte) untuk satu node dalam instance. Perbedaan offset replikasi berarti jumlah byte yang belum direplikasi antara replika dan primernya. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Jumlah byte jaringan masuk yang diterima oleh endpoint instance. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Jumlah byte jaringan keluar yang dikirim dari endpoint instance. |
Metrik persistensi
Bagian ini mencantumkan metrik persistensi dan memberikan contoh kasus penggunaan untuk metrik persistensi.
Metrik persistensi RDB
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Jumlah kumulatif pemuatan dari file dump di seluruh instance (AOF atau RDB). |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Metrik ini menunjukkan jumlah kumulatif frekuensi instance Anda mengambil snapshot RDB (juga dikenal sebagai simpan). Metrik ini memiliki kolom status_code . Untuk memeriksa apakah snapshot telah gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Metrik ini menunjukkan usia snapshot distribusi untuk semua node di seluruh instance. Idealnya, Anda ingin melihat distribusi memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi snapshot. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Jumlah kumulatif perintah tulis yang ditolak di seluruh instance karena kegagalan untuk dipertahankan. |
Metrik persistensi AOF
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Metrik ini menunjukkan distribusi jeda (dari penulisan data ke sinkronisasi penyimpanan yang andal) untuk semua node dalam instance. Ini hanya ditampilkan untuk instance dengan appendfsync=everysec. Idealnya, Anda ingin melihat distribusi memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi sinkronisasi AOF Anda. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Metrik ini menunjukkan jumlah kumulatif frekuensi node memicu penulisan ulang AOF untuk instance Anda. Metrik ini memiliki kolom status_code . Untuk memeriksa apakah penulisan ulang AOF gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR |
Contoh kasus penggunaan untuk metrik persistensi
Memeriksa apakah operasi tulis AOF menyebabkan latensi dan tekanan memori
Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance. Dalam hal ini, Anda dapat memeriksa apakah penggunaan tambahan terkait dengan persistensi AOF.
Karena Anda tahu bahwa operasi penulisan ulang AOF dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik aof_rewrites_count
yang memberi Anda jumlah kumulatif penulisan ulang AOF selama masa aktif instance. Misalkan metrik ini menunjukkan bahwa penambahan jumlah penulisan ulang sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengatasi masalah tersebut dengan mengurangi kecepatan tulis atau meningkatkan jumlah shard untuk mengurangi frekuensi penulisan ulang.
Memeriksa apakah operasi penyimpanan RDB menyebabkan latensi dan tekanan memori
Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance. Dalam hal ini, Anda dapat memeriksa apakah penggunaan tambahan terkait dengan persistensi RDB.
Karena Anda tahu bahwa operasi penyimpanan RDB dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik rdb_saves_count
yang memberikan jumlah kumulatif penyimpanan RDB selama masa aktif instance. Misalkan metrik ini menunjukkan bahwa penambahan jumlah penyimpanan RDB sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengurangi interval snapshot RDB untuk menurunkan frekuensi penulisan ulang. Anda juga dapat menskalakan instance untuk mengurangi tingkat beban dasar pengukuran.
Menafsirkan metrik untuk Memorystore for Valkey
Seperti yang terlihat dalam daftar di atas, banyak metrik memiliki tiga kategori: rata-rata, maksimum, dan total.
Untuk Memorystore for Valkey, kami menyediakan variasi rata-rata dan maksimum dari metrik yang sama sehingga Anda dapat menggunakannya untuk mengidentifikasi hotspot untuk keluarga metrik tersebut.
Nilai total untuk metrik ini bersifat independen, dan memberikan insight terpisah yang tidak terkait dengan tujuan hotspotting rata-rata dan maksimum.
Memahami metrik rata-rata dan maksimum
Misalnya, Anda membandingkan nilai average_keyspace_hits
dan maximum_keyspace_hits
untuk instance Anda. Seiring perbedaan antara kedua metrik meningkat, perbedaan yang lebih besar menunjukkan lebih banyak hot spot hit di instance Anda. Idealnya,
Anda akan memiliki nilai yang mendekati antara average_keyspace_hits
dan
maximum_keyspace_hits
, karena ini berarti hit didistribusikan secara lebih merata
di seluruh instance Anda.
Prinsip ini berlaku untuk semua metrik yang memiliki variasi rata-rata dan maksimum dari metrik yang sama.
Contoh hot spot
Jika Anda membandingkan average_keyspace_hits
dan maximum_keyspace_hits
untuk semua
shard di instance, membandingkan nilai ini akan menunjukkan tempat terjadinya hot spot. Misalnya, shard dalam instance 6 shard memiliki jumlah hit
berikut:
- Shard 1 – 2 hit
- Shard 2 – 2 hit
- Shard 3 – 2 hit
- Shard 4 – 2 hit
- Shard 5 – 2 hit
- Hit Shard 6 – 8
Dalam contoh ini, average_keyspace_hits
menampilkan nilai 3, dan
maximum_keyspace_hits
menampilkan 8, yang menunjukkan bahwa shard 6 adalah hot.