Insiden adalah catatan saat kondisi atau beberapa kondisi kebijakan pemberitahuan terpenuhi. Jika kebijakan pemberitahuan berisi beberapa kondisi, kebijakan pemberitahuan akan menentukan apakah pemenuhan satu kondisi sudah cukup untuk menyebabkan insiden dibuat. Biasanya, saat kondisi terpenuhi, Cloud Monitoring akan membuka insiden dan mengirim notifikasi. Namun, insiden tidak dibuat dalam situasi berikut:
- Kebijakan ditunda atau dinonaktifkan.
- Jumlah kebijakan atau insiden pemberitahuan melebihi batas untuk pemberitahuan yang ada.
Untuk setiap insiden, Monitoring membuat halaman Detail insiden yang memungkinkan Anda mengelola insiden, dan yang melaporkan informasi insiden yang dapat membantu Anda memecahkan masalah kegagalan. Misalnya, halaman Detail insiden menampilkan linimasa insiden dan diagram yang menampilkan data metrik yang dipantau. Anda juga dapat menemukan link ke insiden dan entri log terkait.
Dokumen ini menjelaskan cara Anda dapat menemukan insiden. Panduan ini juga menjelaskan cara menggunakan halaman Detail insiden untuk mengelola insiden untuk kebijakan pemberitahuan berbasis metrik, yang mengevaluasi data deret waktu yang disimpan oleh Cloud Monitoring.
Fitur ini hanya didukung untuk Google Cloud project. Untuk konfigurasi App Hub, pilih project host App Hub atau project pengelolaan folder yang mendukung aplikasi.
Sebelum memulai
Untuk mendapatkan izin yang diperlukan untuk melihat dan mengelola insiden menggunakan konsol Google Cloud , minta administrator untuk memberi Anda peran IAM berikut di project Anda:
-
Melihat insiden menggunakan konsol Google Cloud :
-
Monitoring Cloud Console Incident Viewer (
roles/monitoring.cloudConsoleIncidentViewer
) -
Stackdriver Accounts Viewer (
roles/stackdriver.accounts.viewer
)
-
Monitoring Cloud Console Incident Viewer (
-
Mengelola insiden menggunakan konsol Google Cloud :
-
Editor Insiden Konsol Cloud Monitoring (
roles/monitoring.cloudConsoleIncidentEditor
) -
Stackdriver Accounts Viewer (
roles/stackdriver.accounts.viewer
)
-
Editor Insiden Konsol Cloud Monitoring (
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Untuk mengetahui informasi selengkapnya tentang peran Cloud Monitoring, lihat Mengontrol akses dengan Identity and Access Management.
Menemukan insiden
Untuk melihat daftar insiden dalam Google Cloud project Anda, lakukan langkah berikut:
-
Di konsol Google Cloud , buka halaman notifications Pemberitahuan:
Jika Anda menggunakan kotak penelusuran untuk menemukan halaman ini, pilih hasil yang subjudulnya adalah Monitoring.
Di toolbar konsol Google Cloud , pilih Google Cloud project Anda. Untuk konfigurasi App Hub, pilih project host App Hub atau project pengelolaan folder yang mendukung aplikasi.
Halaman Alerting menampilkan informasi tentang kebijakan pemberitahuan, penundaan, dan insiden Anda:
- Panel Ringkasan mencantumkan jumlah insiden terbuka.
- Panel Insiden menampilkan insiden terbuka terbaru. Untuk mencantumkan insiden terbaru dalam tabel, termasuk yang sudah ditutup, klik Tampilkan insiden tertutup.
Untuk melihat detail insiden tertentu, pilih insiden dalam daftar.
Halaman Detail insiden akan terbuka. Untuk mengetahui informasi selengkapnya tentang halaman Detail insiden, lihat bagian Menyelidiki insiden di halaman ini.
Menemukan insiden lama
Panel Insiden di halaman Alerting menampilkan insiden terbuka terbaru. Untuk menemukan insiden lama, lakukan salah satu hal berikut:
Untuk melihat entri di tabel Insiden, klik arrow_back_ios Lebih Baru atau arrow_forward_ios Lebih Lama.
Untuk membuka halaman Insiden, klik Lihat semua insiden. Dari halaman Insiden, Anda dapat melakukan semua hal berikut:
- Tampilkan insiden tertutup: Untuk mencantumkan semua insiden dalam tabel, klik Tampilkan insiden tertutup.
- Memfilter insiden: Untuk mengetahui informasi tentang cara menambahkan filter, lihat Memfilter insiden.
- Mengonfirmasi atau menutup insiden, atau menunda kebijakan pemberitahuannya. Untuk mengakses opsi ini, klik more_vert Opsi lainnya di baris insiden, lalu pilih dari menu. Untuk mengetahui informasi selengkapnya, lihat Mengelola insiden.
Filter insiden
Saat Anda memasukkan nilai di panel filter, hanya insiden yang cocok dengan filter yang tercantum dalam tabel Insiden. Jika Anda menambahkan beberapa filter, insiden hanya akan ditampilkan jika memenuhi semua filter.
Untuk menambahkan filter ke tabel insiden, lakukan hal berikut:
Di halaman Insiden, klik filter_list Filter tabel, lalu pilih properti filter. Properti filter mencakup semua hal berikut:
- Status insiden
- Nama kebijakan pemberitahuan
- Saat insiden dibuka atau ditutup
- Jenis metrik
- Jenis resource
Pilih nilai dari menu sekunder atau masukkan nilai di kolom filter.
Misalnya, jika Anda memilih Metric type dan memasukkan
usage_time
, maka Anda mungkin hanya melihat opsi berikut di menu sekunder:agent.googleapis.com/cpu/usage_time compute.googleapis.com/guest/container/cpu/usage_time container.googleapis.com/container/cpu/usage_time
Menyelidiki insiden
Halaman Detail insiden berisi informasi yang dapat membantu Anda mengidentifikasi penyebab insiden.
Menjelajahi data metrik
Untuk menganalisis status metrik Anda sebelum dan setelah insiden terjadi, gunakan diagram Metrik Pemberitahuan. Diagram ini menampilkan linimasa dan deret waktu yang menyebabkan kondisi kebijakan pemberitahuan Anda terpenuhi.
Anda dapat menyesuaikan rentang linimasa untuk mencari tren dan pola dalam data metrik Anda yang terkait dengan insiden:
Untuk beralih antara hanya menampilkan deret waktu yang menyebabkan kondisi terpenuhi dan menampilkan semua deret waktu yang dievaluasi kondisinya, klik toggle_off Tampilkan semua deret waktu.
Untuk mengubah rentang waktu yang ditampilkan oleh diagram, Anda dapat menggunakan pemilih rentang waktu di toolbar, atau menandai rentang waktu pada diagram dengan pointer.
Anda juga dapat menganalisis data metrik secara lebih mendetail dengan melihatnya di Metrics Explorer. Untuk melakukannya, buka diagram Metrik Pemberitahuan, lalu klik query_stats Jelajahi Data. Secara default, Metrics Explorer menggabungkan dan memfilter data metrik sehingga diagram metrik selaras dengan deret waktu yang ditampilkan di linimasa Metrik Pemberitahuan.
Menjelajahi entri log
Panel Log di halaman Detail insiden menampilkan entri log yang cocok dengan jenis resource dan label resource yang dipantau untuk metrik Anda. Anda dapat menganalisis entri log ini untuk menemukan informasi tambahan yang dapat membantu Anda memecahkan masalah insiden.
- Untuk melihat entri log di Logs Explorer, klik Lihat di Logs Explorer, lalu pilih project cakupan. Logs Explorer menyediakan alat tambahan untuk menganalisis data entri log, seperti linimasa saat entri log terkait dibuat.
- Untuk melihat dan mengedit kueri yang digunakan untuk memfilter entri log di Metrics Explorer, klik query_stats Jelajahi Data.
Melihat informasi aplikasi
Untuk kebijakan pemberitahuan yang terkait dengan aplikasi App Hub, buka bagian Terkait dengan aplikasi. Satu entri di bagian ini mencantumkan ID aplikasi dan link ke dasbor yang menampilkan informasi tentang aplikasi. Entri kedua mencantumkan workload atau layanan, dan menautkan ke dasbor.
Melihat informasi tambahan
Bagian Label menampilkan label dan nilai untuk resource dan metrik yang dipantau dari deret waktu yang menyebabkan insiden, serta label pengguna yang ditentukan dalam kebijakan pemberitahuan. Informasi ini dapat membantu Anda mengidentifikasi resource yang dipantau tertentu yang menyebabkan insiden. Untuk informasi selengkapnya, lihat Memberi anotasi pada insiden dengan label.
Bagian Dokumentasi menampilkan template dokumentasi untuk notifikasi yang Anda berikan saat membuat kebijakan pemberitahuan. Informasi ini dapat mencakup deskripsi tentang apa yang dipantau oleh kebijakan pemberitahuan dan menyertakan tips untuk mitigasi. Untuk mengetahui informasi selengkapnya, lihat Memberikan anotasi pada notifikasi menggunakan dokumentasi yang ditentukan pengguna.
Jika Anda tidak mengonfigurasi dokumentasi untuk kebijakan pemberitahuan, panel Dokumentasi akan menampilkan "Tidak ada dokumentasi yang dikonfigurasi".
Menjelajahi insiden terkait
Untuk membantu Anda menemukan masalah mendasar di seluruh aplikasi, Anda dapat menjelajahi insiden yang terkait dengan kondisi kebijakan pemberitahuan lainnya.
Bagian Insiden terkait menampilkan daftar insiden yang cocok dengan salah satu hal berikut:- Insiden dibuat saat kondisi kebijakan pemberitahuan yang sama terpenuhi.
- Insiden memiliki label yang sama dengan insiden yang ditampilkan di halaman Detail insiden.
Mengelola Insiden
Insiden berada dalam salah satu status berikut:
error Terbuka: Kumpulan kondisi kebijakan pemberitahuan terpenuhi atau tidak ada data untuk menunjukkan bahwa kondisi tidak lagi terpenuhi. Jika kebijakan pemberitahuan berisi beberapa kondisi, insiden akan dibuka bergantung pada cara penggabungan kondisi tersebut. Untuk mengetahui informasi selengkapnya, lihat Kebijakan dengan beberapa kondisi.
warning Dikonfirmasi: Insiden terbuka dan telah ditandai secara manual sebagai dikonfirmasi. Biasanya, status ini menunjukkan bahwa insiden sedang diselidiki.
check_circle Ditutup: Sistem mengamati bahwa kondisi tidak lagi terpenuhi, Anda menutup insiden, atau 7 hari berlalu tanpa pengamatan bahwa kondisi terus terpenuhi.
Misalnya, jika Anda membuat kebijakan pemberitahuan yang memberi tahu Anda saat jumlah error lebih dari 0, pastikan kebijakan tersebut menghasilkan jumlah 0 error saat tidak ada error. Jika kebijakan pemberitahuan menampilkan null atau kosong dalam status bebas error, maka tidak ada sinyal untuk menunjukkan kapan error telah berhenti. Dalam beberapa situasi, Monitoring Query Language (MQL) mendukung kemampuan Anda untuk menentukan nilai default yang digunakan saat tidak ada nilai terukur yang tersedia. Untuk contoh, lihat Rasio penggunaan.
Mengonfirmasi insiden
Sebaiknya tandai insiden sebagai sudah dikonfirmasi saat Anda mulai menyelidiki penyebab insiden.
Untuk menandai insiden sebagai sudah dibaca, lakukan hal berikut:
- Di panel Insiden pada halaman Pemberitahuan, klik Lihat semua insiden.
Di halaman Insiden, temukan insiden yang ingin Anda konfirmasi, lalu lakukan salah satu tindakan berikut:
- Klik more_vert Opsi lainnya, lalu pilih Setuju.
- Buka halaman detail insiden, lalu klik Konfirmasi insiden.
Jika kebijakan pemberitahuan Anda dikonfigurasi untuk mengirim notifikasi berulang, maka mengonfirmasi insiden tidak akan menghentikan notifikasi. Untuk menghentikannya, lakukan salah satu hal berikut:
- Buat penundaan untuk kebijakan pemberitahuan.
- Nonaktifkan kebijakan pemberitahuan.
Menunda kebijakan pemberitahuan
Untuk mencegah Monitoring membuat insiden dan mengirimkan notifikasi selama jangka waktu tertentu, tunda kebijakan pemberitahuan terkait. Saat Anda menunda kebijakan pemberitahuan, Monitoring juga akan menutup semua insiden yang terkait dengan kebijakan pemberitahuan tersebut.
Untuk membuat penundaan insiden yang sedang Anda lihat, lakukan hal berikut:
Di halaman Detail insiden, klik Tunda Kebijakan.
Pilih durasi penundaan. Setelah Anda memilih durasi penundaan, penundaan akan segera dimulai.
Anda juga dapat menunda kebijakan pemberitahuan dari halaman Insiden dengan menemukan insiden yang ingin Anda tunda, mengklik more_vert Opsi lainnya, lalu memilih Tunda. Anda dapat menunda kebijakan pemberitahuan selama gangguan untuk mencegah notifikasi lebih lanjut selama proses pemecahan masalah.
Menutup insiden
Anda dapat mengizinkan Monitoring menutup insiden untuk Anda, atau Anda dapat menutup insiden setelah pengamatan berhenti tiba. Jika Anda menutup insiden, lalu data yang masuk menunjukkan bahwa kondisi terpenuhi, maka insiden baru akan dibuat. Saat Anda menutup insiden, tindakan tersebut tidak akan menutup insiden lain yang terbuka untuk kondisi yang sama. Jika Anda menunda kebijakan pemberitahuan, insiden yang terbuka akan ditutup saat penundaan dimulai.
Monitoring otomatis menutup insiden jika salah satu hal berikut terjadi:
Kondisi batas metrik:
- Pengamatan tiba yang menunjukkan bahwa batas tidak dilanggar.
Tidak ada pengamatan yang masuk, kondisi dikonfigurasi untuk menutup insiden saat pengamatan berhenti masuk, dan status resource pokok tidak diketahui atau tidak dinonaktifkan.
Tidak ada pengamatan yang tiba selama durasi penutupan otomatis kebijakan pemberitahuan dan kondisi tidak dikonfigurasi untuk menutup insiden secara otomatis saat pengamatan berhenti tiba. Untuk mengonfigurasi durasi penutupan otomatis, Anda dapat menggunakan konsol Google Cloud atau Cloud Monitoring API. Secara default, durasi tutup otomatis adalah tujuh hari. Durasi tutup otomatis minimum adalah 30 menit.
Kondisi tidak adanya metrik:
- Pengamatan terjadi.
- Tidak ada pengamatan yang tiba selama 24 jam setelah durasi penutupan otomatis kebijakan pemberitahuan berakhir. Untuk mengonfigurasi durasi penutupan otomatis, Anda dapat menggunakan konsol Google Cloud atau Cloud Monitoring API. Secara default, durasi tutup otomatis adalah tujuh hari.
Kondisi perkiraan:
- Perkiraan dibuat dan memprediksi bahwa deret waktu tidak akan melanggar nilai minimum dalam jendela perkiraan.
Tidak ada pengamatan yang tiba selama 10 menit, kondisi dikonfigurasi untuk menutup insiden saat pengamatan berhenti tiba, dan status resource pokok tidak diketahui atau tidak dinonaktifkan.
Tidak ada pengamatan yang tiba selama durasi penutupan otomatis kebijakan pemberitahuan dan kondisi tidak dikonfigurasi untuk menutup insiden secara otomatis saat pengamatan berhenti tiba.
Misalnya, kebijakan pemberitahuan menghasilkan insiden karena latensi respons HTTP lebih dari 2 detik selama 10 menit berturut-turut. Jika pengukuran latensi respons HTTP berikutnya kurang dari atau sama dengan dua detik, maka insiden akan ditutup. Demikian pula, jika tidak ada data yang diterima sama sekali selama tujuh hari, insiden akan ditutup.
Untuk menutup insiden, lakukan hal berikut:
- Di panel Insiden pada halaman Pemberitahuan, klik Lihat semua insiden.
Di halaman Insiden, temukan insiden yang ingin Anda tutup, lalu lakukan salah satu hal berikut:
- Klik more_vert Lihat lainnya, lalu pilih Tutup insiden
- Buka halaman Detail insiden untuk insiden tersebut, lalu klik Tutup insiden.
Jika Anda melihat pesan Unable to close incident with active conditions
,
maka insiden tidak dapat ditutup karena data telah diterima dalam
periode pemberitahuan terbaru.
Jika Anda melihat pesan
Unable to close incident. Please try again in a few minutes.
,
maka insiden tidak dapat ditutup karena error internal.
Retensi dan batas data
Untuk mengetahui informasi tentang batas dan periode retensi insiden, lihat Batas untuk pemberitahuan.
Langkah berikutnya
- Untuk membuat dan mengelola kebijakan pemberitahuan dengan Cloud Monitoring API atau dari command line, lihat Mengelola kebijakan pemberitahuan dengan API.
- Untuk mengetahui pembahasan konseptual mendetail tentang kebijakan pemberitahuan, lihat Perilaku kebijakan pemberitahuan berbasis metrik.