針對服務等級目標建立快訊政策
本頁說明如何在 Cloud Service Mesh 中,針對所建立的服務水準目標 (SLO) 在 Cloud Monitoring 中建立警示政策。
如需服務等級目標的簡介,請參閱服務等級目標總覽。
當服務即將違反 SLO 時,Cloud Monitoring 會觸發快訊。您可以根據錯誤預算的消耗率建立快訊政策。所有錯誤預算快訊都具有相同的基本條件:在回溯期內 (例如前 60 分鐘),違規期間的錯誤預算會消耗特定百分比。建立快訊政策時,Cloud Service Mesh 會根據服務等級目標中的設定,自動設定大部分的快訊條件。您可以指定回溯期和消耗百分比。
您可能需要嘗試幾次,才能決定應為回溯期和消耗百分比設定哪些值。您可以使用預設的 60 分鐘回溯期做為起點。如要判斷消耗百分比,請監控服務行為,瞭解在過去 60 分鐘內,總錯誤預算 (在評估時間範圍內) 消耗了多少百分比。您想設定消耗百分比,以免在回溯期間消耗的錯誤預算超過可負擔的金額,但又不想不必要地觸發快訊。
舉例來說,假設您建立了以下名稱的 SLO:95% < 300ms Latency in Calendar Week
根據這個服務等級目標,每週只有 5% 的要求總數會有延遲時間大於 300 毫秒。達到或超過 5% 時,系統就會消耗總錯誤預算。如果將回溯期設為一小時,每個回溯期就是遵循期 (一週有 168 小時) 的 1/168
。如要計算每小時的消耗百分比,以免超過本週的總錯誤預算:5%
÷ 168
≈ 0.03%
由於服務的延遲時間可能會因負載或其他情況而波動,因此將耗用百分比設為 0.03% 可能會觸發不必要的快訊。您可以先從這個值的兩倍,也就是 0.06% 開始,然後監控服務並視需要調整值。
事前準備
為其中一項服務建立服務等級目標。
針對服務等級目標建立快訊政策
前往服務的「Health」分頁:
在 Google Cloud 控制台中,前往「Cloud Service Mesh」。
在選單列的下拉式清單中選取 Google Cloud 專案。
按一下要建立警告政策的服務。
在左側導覽列中,按一下「健康」。
按一下要建立快訊政策的服務等級目標。
在右側的「服務等級目標目前狀態」部分,按一下「建立快訊政策」連結。
系統會隨即顯示「Add condition」對話方塊。Cloud Service Mesh 會根據 SLO 中的設定,自動填入 SLO 消耗率條件。您可以設定 SLO 消耗率條件,在 SLO 的錯誤預算下降得太快時收到快訊。您希望在 SLO 超出錯誤預算之前,確保收到警示。
設定條件:
- 如要為條件命名,請點選「建議標題」連結,使用根據 SLO 命名的名稱,或輸入條件名稱。
- 在「Target」部分,輸入「Lookback Duration」欄位的回溯期,或使用預設值。
- 在「Configuration」部分,在「Threshold」欄位中輸入消耗百分比。
- 按一下「儲存」。 系統會顯示「Create new alerting policy」視窗。
設定快訊政策:
- 輸入政策名稱。
- 系統會自動填入條件,但您可以視需要新增其他條件。
- 如果警示政策只有一個條件,請將「政策觸發條件」欄位保留為預設值「符合任何條件」。
- 您可以視需要設定「Notifications」(通知) 和「Documentation」(說明文件) 部分。詳情請參閱「管理快訊政策」。
- 按一下 [儲存]。系統隨即會顯示「政策詳細資料」頁面。
- 如要返回 Cloud Service Mesh 資訊主頁,請按一下「導覽選單」dehaze,然後依序前往「Anthos」 >「服務」。
後續步驟
進一步瞭解 Google 網站可靠性工程團隊的警示功能: