Halaman ini mencantumkan metrik Cloud Monitoring yang tersedia untuk Memorystore for Valkey, dan menjelaskan apa yang diukur oleh setiap metrik.
Metrik Cloud Monitoring
Metrik tingkat instance
Metrik ini memberikan ringkasan umum tentang kondisi dan performa instance secara keseluruhan. Metrik ini membantu Anda memahami kapasitas dan pemanfaatan keseluruhan instance, serta mengidentifikasi potensi hambatan atau area yang perlu ditingkatkan.
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/clients/average_connected_clients |
Jumlah koneksi klien saat ini rata-rata di semua node dalam instance. |
memorystore.googleapis.com/instance/clients/maximum_connected_clients |
Jumlah maksimum koneksi klien saat ini untuk satu node dalam instance. |
memorystore.googleapis.com/instance/clients/maximum_connection_duration |
Durasi maksimum koneksi klien untuk satu node dalam instance. |
memorystore.googleapis.com/instance/clients/total_connected_clients |
Jumlah koneksi klien saat ini ke instance. |
memorystore.googleapis.com/instance/stats/total_connections_received_count |
Jumlah total koneksi klien tingkat instance yang dibuat dalam satu menit terakhir. |
memorystore.googleapis.com/instance/stats/total_rejected_connections_count |
Jumlah koneksi ditolak karena batas maxclients. |
memorystore.googleapis.com/instance/commandstats/total_usec_count |
Total waktu yang digunakan per perintah. |
memorystore.googleapis.com/instance/commandstats/total_calls_count |
Jumlah total panggilan untuk perintah ini dalam satu menit. |
memorystore.googleapis.com/instance/cpu/average_utilization |
Penggunaan CPU rata-rata di semua node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/cpu/maximum_utilization |
Penggunaan CPU maksimum untuk satu node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/stats/average_expired_keys |
Jumlah rata-rata peristiwa habis masa berlaku kunci untuk primer semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_expired_keys |
Jumlah maksimum peristiwa habis masa berlaku kunci untuk satu node dalam instance untuk primer. |
memorystore.googleapis.com/instance/stats/total_expired_keys_count |
Jumlah total peristiwa habis masa berlaku kunci di primer semua node dalam instance. |
memorystore.googleapis.com/instance/stats/average_evicted_keys |
Jumlah rata-rata kunci yang dikeluarkan karena kapasitas memori di seluruh primer semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_evicted_keys |
Jumlah maksimum kunci yang dikeluarkan untuk satu node dalam instance karena kapasitas memori untuk primer. |
memorystore.googleapis.com/instance/stats/total_evicted_keys_count |
Jumlah kunci yang dikeluarkan karena kapasitas memori di seluruh primer semua node dalam instance. |
memorystore.googleapis.com/instance/keyspace/total_keys |
Jumlah kunci yang disimpan dalam instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_hits |
Jumlah rata-rata pencarian kunci yang berhasil di semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_hits |
Jumlah maksimum pencarian kunci yang berhasil untuk satu node dalam instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_hits_count |
Jumlah pencarian kunci yang berhasil untuk instance. |
memorystore.googleapis.com/instance/stats/average_keyspace_misses |
Jumlah rata-rata kegagalan pencarian kunci di semua node dalam instance. |
memorystore.googleapis.com/instance/stats/maximum_keyspace_misses |
Jumlah maksimum kegagalan pencarian kunci untuk satu node dalam instance. |
memorystore.googleapis.com/instance/stats/total_keyspace_misses_count |
Jumlah total kegagalan pencarian kunci untuk instance. |
memorystore.googleapis.com/instance/memory/average_utilization |
Penggunaan memori rata-rata di semua node dalam instance. Nilai dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/memory/maximum_utilization |
Penggunaan memori maksimum untuk satu node dalam instance dari 0,0 hingga 1,0. |
memorystore.googleapis.com/instance/memory/total_used_memory |
Total penggunaan memori instance. |
memorystore.googleapis.com/instance/memory/size |
Ukuran memori instance. |
memorystore.googleapis.com/instance/replication/average_ack_lag |
Jeda konfirmasi rata-rata (dalam detik) replika di semua node dalam instance. Jeda konfirmasi adalah hambatan pada node utama dalam instance. Bottleneck ini disebabkan oleh replikanya yang tidak dapat mengimbangi informasi yang dikirimkan oleh node primer. Jika hal ini terjadi, node utama harus menunggu konfirmasi bahwa replika telah menerima informasi. Hal ini dapat memperlambat penerapan transaksi dan menyebabkan penurunan performa pada node utama. |
memorystore.googleapis.com/instance/replication/maximum_ack_lag |
Penundaan pengakuan maksimum (dalam detik) untuk satu replika dalam instance. |
memorystore.googleapis.com/instance/replication/average_offset_diff |
Perbedaan offset pengakuan replikasi rata-rata (dalam byte) di semua node dalam instance. Perbedaan offset pengakuan replikasi berarti jumlah byte yang belum direplikasi antara replika dan primernya. |
memorystore.googleapis.com/instance/replication/maximum_offset_diff |
Perbedaan offset replikasi maksimum (dalam byte) untuk satu node dalam instance. Perbedaan offset replikasi berarti jumlah byte yang belum direplikasi antara replika dan primernya. |
memorystore.googleapis.com/instance/stats/total_net_input_bytes_count |
Jumlah byte jaringan masuk yang diterima oleh endpoint instance. |
memorystore.googleapis.com/instance/stats/total_net_output_bytes_count |
Jumlah byte jaringan keluar yang dikirim dari endpoint instance. |
Metrik tingkat node
Metrik ini menawarkan insight mendetail tentang kondisi dan performa setiap node dalam instance. Alat ini membantu Anda memecahkan masalah pada node dan mengoptimalkan performa node.
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/node/clients/connected_clients |
Jumlah klien yang terhubung ke node instance. |
memorystore.googleapis.com/instance/node/clients/blocked_clients |
Jumlah koneksi klien yang diblokir oleh node instance. |
memorystore.googleapis.com/instance/node/server/uptime |
Waktu beroperasi node instance. |
memorystore.googleapis.com/instance/node/stats/connections_received_count |
Jumlah koneksi klien yang dibuat Memorystore untuk Valkey dalam satu menit terakhir di node instance. |
memorystore.googleapis.com/instance/node/stats/rejected_connections_count |
Jumlah koneksi yang ditolak oleh Memorystore untuk Valkey karena node instance mencapai batas `maxclients`. |
memorystore.googleapis.com/instance/node/commandstats/usec_count |
Waktu yang digunakan untuk setiap perintah di node instance. |
memorystore.googleapis.com/instance/node/commandstats/calls_count |
Jumlah panggilan untuk perintah ini di node instance dalam satu menit. |
memorystore.googleapis.com/instance/node/cpu/utilization |
Penggunaan CPU untuk node instance (dari 0,0 hingga 1,0). |
memorystore.googleapis.com/instance/node/stats/expired_keys_count |
Jumlah peristiwa habis masa berlaku di node instance. |
memorystore.googleapis.com/instance/node/stats/evicted_keys_count |
Jumlah kunci yang dikeluarkan oleh node instance. |
memorystore.googleapis.com/instance/node/keyspace/total_keys |
Jumlah kunci yang disimpan Memorystore for Valkey di node instance. |
memorystore.googleapis.com/instance/node/stats/keyspace_hits_count |
Jumlah pencarian kunci yang berhasil di node instance. |
memorystore.googleapis.com/instance/node/stats/keyspace_misses_count |
Jumlah pencarian kunci yang gagal di node instance. |
memorystore.googleapis.com/instance/node/memory/utilization |
Penggunaan memori untuk node instance (dari 0,0 hingga 1,0). |
memorystore.googleapis.com/instance/node/memory/usage |
Penggunaan memori node instance. |
memorystore.googleapis.com/instance/node/stats/net_input_bytes_count |
Jumlah byte jaringan masuk yang diterima oleh node instance. |
memorystore.googleapis.com/instance/node/stats/net_output_bytes_count |
Jumlah byte jaringan keluar yang dikirim oleh node instance. |
memorystore.googleapis.com/instance/node/replication/offset |
Byte offset replikasi node instance. |
memorystore.googleapis.com/instance/node/server/healthy |
Menentukan apakah node instance tersedia dan berfungsi dengan benar. Metrik ini berada dalam Pratinjau. |
Metrik replikasi lintas region
Bagian ini mencantumkan metrik yang digunakan untuk replikasi lintas-region.
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/cross_instance_replication/secondary_replication_links |
Metrik ini menunjukkan jumlah link shard antara instance primer dan sekunder. Dalam grup replikasi lintas region, instance utama melaporkan jumlah link replikasi lintas region yang dimilikinya dengan instance sekunder dalam grup. Untuk setiap instance sekunder, jumlah ini diharapkan sama dengan jumlah shard. Jika jumlahnya turun di bawah jumlah shard, metrik ini akan mengidentifikasi jumlah shard saat replikasi berhenti antara replikator dan follower. Dalam kondisi ideal, metrik ini memiliki jumlah yang sama dengan jumlah shard untuk instance utama. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_maximum_replication_offset_diff |
Metrik ini menunjukkan perbedaan offset replikasi maksimum antara shard utama dan sekunder. |
memorystore.googleapis.com/instance/cross_instance_replication/secondary_average_replication_offset_diff |
Metrik ini menunjukkan perbedaan offset replikasi rata-rata antara shard primer dan sekunder. |
Metrik pencadangan
Bagian ini mencantumkan metrik pencadangan dan impor.
Metrik tingkat instance
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/backup/last_backup_start_time |
Waktu mulai operasi pencadangan terakhir. |
memorystore.googleapis.com/instance/backup/last_backup_status |
Status operasi pencadangan terakhir. Statusnya adalah 1 (berhasil) dan 0 (gagal). |
memorystore.googleapis.com/instance/backup/last_backup_duration |
Durasi operasi pencadangan terakhir (dalam milidetik). |
memorystore.googleapis.com/instance/backup/last_backup_size |
Ukuran pencadangan terakhir (dalam byte). |
memorystore.googleapis.com/instance/import/last_import_start_time |
Waktu mulai operasi impor terakhir. |
memorystore.googleapis.com/instance/import/last_import_duration |
Durasi operasi impor terakhir(dalam milidetik). |
Metrik persistensi
Bagian ini mencantumkan metrik persistensi dan memberikan contoh kasus penggunaan untuk metrik persistensi.
Metrik persistensi RDB
Metrik tingkat instance
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/persistence/load_count |
Jumlah kumulatif pemuatan dari seluruh instance untuk persistensi AOF atau RDB. |
memorystore.googleapis.com/instance/persistence/rdb_saves_count |
Jumlah kumulatif berapa kali instance Anda mengambil snapshot RDB (juga dikenal sebagai penyimpanan). Metrik ini memiliki kolom status_code . Untuk memeriksa apakah snapshot gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL ERROR . |
memorystore.googleapis.com/instance/persistence/rdb_last_success_ages |
Usia snapshot distribusi untuk semua node di seluruh instance. Anda ingin melihat distribusi yang memiliki nilai dengan waktu jeda yang lebih sedikit (atau waktu yang sama) daripada frekuensi snapshot Anda. |
memorystore.googleapis.com/instance/persistence/rejected_writes_count |
Jumlah kumulatif perintah tulis yang ditolak di seluruh instance karena kegagalan untuk tetap ada. |
Metrik tingkat node
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/node/persistence/rdb_bgsave_in_progress |
RDB BGSAVE sedang berlangsung di node instance. TRUE berarti penyimpanan sedang berlangsung. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_bgsave_status |
Keberhasilan BGSAVE terakhir di node instance. TRUE berarti BGSAVE berhasil terjadi. Jika tidak ada bgrewrite yang terjadi, nilai mungkin ditetapkan secara default ke TRUE . |
memorystore.googleapis.com/instance/node/persistence/rdb_saves_count |
Metrik ini menunjukkan jumlah kumulatif penyimpanan RDB yang dijalankan di node instance. |
memorystore.googleapis.com/instance/node/persistence/rdb_last_save_age |
Waktu (dalam detik) sejak snapshot terakhir yang berhasil. |
memorystore.googleapis.com/instance/node/persistence/rdb_next_save_time_until |
Sisa waktu (dalam detik) hingga snapshot berikutnya. |
memorystore.googleapis.com/instance/node/persistence/current_save_keys_total |
Jumlah kunci dalam penyimpanan RDB yang berjalan di node instance. |
Metrik persistensi AOF
Metrik tingkat instance
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/persistence/aof_fsync_lags |
Metrik ini menunjukkan distribusi jeda (dari penulisan data hingga sinkronisasi penyimpanan yang tahan lama) untuk semua node dalam instance. Peristiwa ini hanya dipancarkan untuk instance dengan appendfsync=everysec. Idealnya, Anda ingin melihat distribusi memiliki nilai yang memiliki waktu jeda lebih sedikit (atau waktu yang sama) daripada frekuensi sinkronisasi AOF Anda. |
memorystore.googleapis.com/instance/persistence/aof_rewrite_count |
Metrik ini menampilkan jumlah kumulatif berapa kali node telah memicu penulisan ulang AOF untuk instance Anda. Metrik ini memiliki kolom status_code . Untuk memeriksa apakah penulisan ulang AOF gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR |
Metrik tingkat node
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/node/persistence/aof_last_write_status |
Metrik ini menunjukkan keberhasilan penulisan AOF terbaru pada node instance. TRUE berarti berhasil, jika tidak ada penulisan yang terjadi, nilai dapat ditetapkan secara default ke TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_last_bgrewrite_status |
Metrik ini menunjukkan keberhasilan operasi bgrewrite AOF terakhir pada node instance. TRUE berarti berhasil, jika tidak ada bgrewrite yang terjadi, nilai dapat ditetapkan secara default ke TRUE. |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_lag |
Metrik ini menunjukkan jeda AOF antara memori dan penyimpanan persisten di node instance. Hal ini hanya berlaku untuk instance yang mengaktifkan AOF dengan appendfsync=EVERYSEC |
memorystore.googleapis.com/instance/node/persistence/aof_rewrites_count |
Metrik ini menampilkan jumlah penulisan ulang AOF di node instance. Untuk memeriksa apakah penulisan ulang AOF gagal, Anda dapat memfilter kolom status_code untuk error berikut: 3 - INTERNAL_ERROR |
memorystore.googleapis.com/instance/node/persistence/aof_fsync_errors_count |
Metrik ini menampilkan jumlah error panggilan fsync() AOF dan hanya berlaku untuk instance yang mengaktifkan AOF dengan appendfsync=EVERYSEC|ALWAYS. |
Metrik Persistensi Umum
Metrik yang berlaku untuk mekanisme persistensi AOF dan RDB.
Metrik tingkat node
Nama metrik | Deskripsi |
---|---|
memorystore.googleapis.com/instance/node/persistence/auto_restore_count |
Metrik ini menunjukkan jumlah pemulihan dari dumpfile (AOF atau RDB). Untuk memeriksa apakah pemulihan gagal, Anda dapat memfilter kolom status_code untuk error berikut: 2 - INTERNAL_ERROR |
Contoh kasus penggunaan untuk metrik persistensi
Memeriksa apakah operasi tulis AOF menyebabkan latensi dan tekanan memori
Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance atau node dalam instance. Dalam hal ini, Anda mungkin ingin memeriksa apakah penggunaan tambahan terkait dengan persistensi AOF.
Karena Anda tahu bahwa operasi penulisan ulang AOF dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik aof_rewrites_count
yang memberikan jumlah kumulatif penulisan ulang AOF selama masa aktif instance atau node dalam instance. Misalkan metrik ini menunjukkan bahwa peningkatan jumlah penulisan ulang sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengatasi masalah dengan mengurangi kecepatan penulisan atau meningkatkan jumlah shard untuk mengurangi frekuensi penulisan ulang.
Memeriksa apakah operasi penyimpanan RDB menyebabkan latensi dan tekanan memori
Misalkan Anda mendeteksi peningkatan latensi atau penggunaan memori pada instance atau node dalam instance. Dalam hal ini, Anda mungkin ingin memeriksa apakah penggunaan ekstra terkait dengan persistensi RDB.
Karena Anda tahu bahwa operasi penyimpanan RDB dapat memicu lonjakan beban sementara, Anda dapat memeriksa metrik rdb_saves_count
yang memberikan jumlah kumulatif penyimpanan RDB selama masa aktif instance atau node dalam instance. Misalkan metrik ini menunjukkan bahwa peningkatan jumlah penyimpanan RDB sesuai dengan peningkatan latensi. Dalam situasi ini, Anda dapat mengurangi interval snapshot RDB untuk menurunkan frekuensi penulisan ulang. Anda juga dapat menskalakan instance untuk mengurangi tingkat beban dasar pengukuran.
Menafsirkan metrik untuk Memorystore for Valkey
Seperti yang terlihat dalam daftar di atas, banyak metrik yang memiliki tiga kategori: rata-rata, maksimum, dan total.
Untuk Memorystore for Valkey, kami menyediakan variasi rata-rata dan maksimum dari metrik yang sama sehingga Anda dapat menggunakan keduanya untuk mengidentifikasi hotspotting untuk kelompok metrik tersebut.
Nilai total untuk metrik bersifat independen, dan memberikan insight terpisah yang tidak terkait dengan tujuan hotspotting rata-rata dan maksimum.
Memahami metrik rata-rata dan maksimum
Misalkan Anda membandingkan nilai average_keyspace_hits
dan maximum_keyspace_hits
untuk instance Anda. Seiring dengan bertambahnya perbedaan antara kedua metrik, perbedaan yang lebih besar menunjukkan lebih banyak hot spot hit di instance Anda. Idealnya, Anda akan memiliki nilai penutupan antara average_keyspace_hits
dan
maximum_keyspace_hits
, karena ini berarti bahwa hit didistribusikan secara lebih merata di seluruh instance Anda.
Prinsip ini berlaku untuk semua metrik yang memiliki variasi rata-rata dan maksimum dari metrik yang sama.
Contoh penandaan hotspot
Jika Anda membandingkan average_keyspace_hits
dan maximum_keyspace_hits
untuk semua
shard di instance Anda, perbandingan nilai ini menunjukkan lokasi terjadinya
hot spotting. Misalnya, anggap saja shard dalam instance 6-shard memiliki jumlah hit berikut:
- Shard 1 – 2 hit
- Shard 2 – 2 hit
- Shard 3 – 2 hit
- Shard 4 – 2 hit
- Shard 5 – 2 hit
- Hit 6–8 shard
Dalam contoh ini, average_keyspace_hits
menampilkan nilai 3, dan
maximum_keyspace_hits
menampilkan 8, yang menunjukkan bahwa shard 6 sedang aktif.
Kami menyediakan metrik tingkat node yang dapat berguna untuk mengidentifikasi hotspot dalam instance.