針對服務等級目標建立快訊政策

本頁說明如何在 Cloud Service Mesh 中,針對所建立的服務水準目標 (SLO) 在 Cloud Monitoring 中建立警示政策。

如需服務等級目標的簡介,請參閱服務等級目標總覽

當服務即將違反 SLO 時,Cloud Monitoring 會觸發快訊。您可以根據錯誤預算的消耗率建立快訊政策。所有錯誤預算快訊都具有相同的基本條件:在回溯期內 (例如前 60 分鐘),違規期間的錯誤預算會消耗特定百分比。建立快訊政策時,Cloud Service Mesh 會根據服務等級目標中的設定,自動設定大部分的快訊條件。您可以指定回溯期和消耗百分比。

您可能需要嘗試幾次,才能決定應為回溯期和消耗百分比設定哪些值。您可以使用預設的 60 分鐘回溯期做為起點。如要判斷消耗百分比,請監控服務行為,瞭解在過去 60 分鐘內,總錯誤預算 (在評估時間範圍內) 消耗了多少百分比。您想設定消耗百分比,以免在回溯期間消耗的錯誤預算超過可負擔的金額,但又不想不必要地觸發快訊。

舉例來說,假設您建立了以下名稱的 SLO:95% < 300ms Latency in Calendar Week

根據這個服務等級目標,每週只有 5% 的要求總數會有延遲時間大於 300 毫秒。達到或超過 5% 時,系統就會消耗總錯誤預算。如果將回溯期設為一小時,每個回溯期就是遵循期 (一週有 168 小時) 的 1/168。如要計算每小時的消耗百分比,以免超過本週的總錯誤預算:5% ÷ 1680.03%

由於服務的延遲時間可能會因負載或其他情況而波動,因此將耗用百分比設為 0.03% 可能會觸發不必要的快訊。您可以先從這個值的兩倍,也就是 0.06% 開始,然後監控服務並視需要調整值。

事前準備

為其中一項服務建立服務等級目標

針對服務等級目標建立快訊政策

  1. 前往服務的「Health」分頁:

    1. 在 Google Cloud 控制台中,前往「Cloud Service Mesh」

      前往 Cloud Service Mesh

    2. 在選單列的下拉式清單中選取 Google Cloud 專案。

    3. 按一下要建立警告政策的服務。

    4. 在左側導覽列中,按一下「健康」

  2. 按一下要建立快訊政策的服務等級目標。

  3. 在右側的「服務等級目標目前狀態」部分,按一下「建立快訊政策」連結。

    系統會隨即顯示「Add condition」對話方塊。Cloud Service Mesh 會根據 SLO 中的設定,自動填入 SLO 消耗率條件。您可以設定 SLO 消耗率條件,在 SLO 的錯誤預算下降得太快時收到快訊。您希望在 SLO 超出錯誤預算之前,確保收到警示。

    「Cloud Monitoring」新增條件對話方塊的螢幕截圖。

  4. 設定條件:

    1. 如要為條件命名,請點選「建議標題」連結,使用根據 SLO 命名的名稱,或輸入條件名稱。
    2. 在「Target」部分,輸入「Lookback Duration」欄位的回溯期,或使用預設值。
    3. 在「Configuration」部分,在「Threshold」欄位中輸入消耗百分比。
    4. 按一下「儲存」。 系統會顯示「Create new alerting policy」視窗。
  5. 設定快訊政策:

    1. 輸入政策名稱。
    2. 系統會自動填入條件,但您可以視需要新增其他條件。
    3. 如果警示政策只有一個條件,請將「政策觸發條件」欄位保留為預設值「符合任何條件」
    4. 您可以視需要設定「Notifications」(通知) 和「Documentation」(說明文件) 部分。詳情請參閱「管理快訊政策」。
    5. 按一下 [儲存]。系統隨即會顯示「政策詳細資料」頁面。
    6. 如要返回 Cloud Service Mesh 資訊主頁,請按一下「導覽選單」,然後依序前往「Anthos」 >「服務」

後續步驟