Ringkasan tujuan tingkat layanan
Tujuan Tingkat Layanan (SLO) adalah alat inti dalam toolkit pemantauan layanan Google. SLO dapat memberi Anda sinyal ringkas dan minim derau mengenai kesehatan layanan Anda secara keseluruhan. Dengan Cloud Service Mesh, Anda dapat menetapkan SLO untuk layanan Anda, serta memantau dan memberikan pemberitahuan terkait layanan Anda terkait SLO tersebut.
Untuk memantau kondisi layanan, Anda perlu memahami perilaku mana yang penting untuk layanan tersebut serta cara mengukur dan mengevaluasi perilaku tersebut. Indikator tingkat layanan (SLI) adalah ukuran kuantitatif aspek layanan tertentu. SLI standar adalah:
- Latensi: Waktu yang diperlukan untuk menampilkan respons terhadap permintaan, biasanya diukur dalam milidetik (md). Latensi biasanya ditampilkan sebagai gabungan. Artinya, data mentah dikumpulkan selama jangka waktu tertentu dan dihitung sebagai persentil. Cloud Service Mesh menampilkan grafik Latensi di halaman Metrics untuk setiap layanan Anda. Grafik Latensi menampilkan latensi dari waktu ke waktu, sehingga dapat membantu Anda menentukan nilai minimum latensi atau batas atas untuk suatu layanan.
- Ketersediaan: Bagian waktu saat layanan berhasil merespons. Rasio ini biasanya ditampilkan sebagai rasio jumlah respons yang berhasil terhadap jumlah total respons. Grafik tingkat error di halaman Metrics dapat membantu Anda menentukan ketersediaan setiap layanan.
SLO adalah nilai target untuk tingkat layanan yang diukur dengan SLI. SLO dapat direpresentasikan sebagai: SLI ≤ upper_bound
atau SLI ≥ lower_bound
. SLO adalah sasaran terukur untuk performa selama jangka waktu tertentu. Misalnya, Anda mungkin memiliki persyaratan seperti berikut untuk beberapa layanan Anda:
- Latensi dapat melebihi 300 md hanya dalam 5 persen dari permintaan selama periode yang berkelanjutan.
- Ketersediaan sistem harus mencapai 99% yang diukur selama satu minggu kalender.
Anda dapat menetapkan dan melihat SLO untuk layanan berdasarkan data telemetri di halaman Kesehatan. Selanjutnya, Anda dapat membuat pemberitahuan di Cloud Monitoring untuk memperingatkan Anda jika layanan tidak berperforma sesuai harapan.
Langkah selanjutnya
Pelajari lebih lanjut SLO dari Site Reliability Engineering di Google: