服務等級目標總覽

服務水準目標 (SLO) 是 Google 服務監控工具包中的核心工具。服務水準協議可提供簡潔且不易造成干擾的信號,讓您瞭解服務的整體健康狀況。Cloud Service Mesh 可讓您為服務設定服務等級目標 (SLO),並根據這些服務等級目標監控及發出服務快訊。

如要監控服務的健康情況,您必須瞭解哪些行為對該服務而言至關重要,以及如何評估這些行為。服務水準指標 (SLI) 是量化指標,用於評估服務的某些面向。常見的 SLI 包括:

  • 延遲時間:傳回要求回應所需的時間,通常以毫秒 (ms) 為單位。延遲時間通常會以匯總方式呈現。也就是說,系統會在一段時間內收集原始資料,並計算出百分位數。Cloud Service Mesh 會在「Metrics」頁面上,為每項服務顯示「Latency」圖表。「延遲時間」圖表會顯示一段時間內的延遲時間,協助您判斷服務的延遲時間門檻或上限。
  • 可用性:服務成功回應的時間比例。這項指標通常會以成功回應數除以回應總數的比率呈現。您可以參考「指標」頁面上的「錯誤率」圖表,判斷各項服務的可用性。

服務水準目標是服務水準指標 (SLI) 的目標值,SLO 可表示為 SLI ≤ upper_boundSLI ≥ lower_bound。服務水準目標是一段時間內可測量的效能目標。舉例來說,您可能會為部分服務設定下列規定:

  • 在 30 天滾動期間,只有 5% 的要求延遲時間會超過 300 毫秒。
  • 系統必須在每個星期內達到 99% 的可用性。

您可以在「健康」頁面中,根據服務的遙測資料設定及查看服務等級目標。接著,您可以在 Cloud Monitoring 中建立快訊,在服務效能不如預期時發出警告。

後續步驟