本文說明如何使用暫緩功能,在特定時間範圍內禁止 Cloud Monitoring 建立事件及發出通知。您可以使用 Google Cloud 控制台、Google Cloud CLI 和 Cloud Monitoring API 建立及管理暫停通知。
延後快訊政策的時機
如要暫時停止建立事件和傳送通知,或避免系統針對未結事件重複傳送通知,請建立延後。舉例來說,您可能會在下列情況下建立暫緩通知:
- 你已安排維護作業。
- 您有不斷擴大的服務中斷問題,並想避免進一步的事件和通知。
暫緩通知的運作方式
快訊政策的暫緩通知功能啟用後,Monitoring 不會傳送通知,也不會為暫緩通知的快訊政策建立事件。對指標型或 SQL 型警告政策套用暫緩處理時,Monitoring 也會關閉與該警告政策相關的所有事件。
你可以透過下列任一方式建立暫緩通知:
如要對多項快訊政策套用暫緩通知,請從「Alerting」(快訊) 頁面、gcloud CLI 或 Cloud Monitoring API 建立暫緩通知。你也可以選擇貪睡時間的開始時間,並定義貪睡時間長度。
如果您已排定維護作業,並需要延後設定在特定時間開始,且持續一段預先決定的時間,對多項快訊政策套用延後設定可能會有幫助。
如要對特定事件套用暫緩處理,請在開啟事件的「事件詳細資料」頁面中建立暫緩處理。在這種情況下,除了暫緩時間長度,所有暫緩欄位都會預先設定。
如果發生停機事件,且需要立即暫緩快訊政策,直到相關問題解決為止,從特定事件套用暫緩功能可能會有所幫助。
延後通知的組成要素
暫緩通知包含下列元件:
名稱。建議您使用這個欄位說明暫緩處理的原因。
延後設定的有效期間。這項設定會指定開始時間和時間長度。如果延後時間尚未結束,當快訊政策符合延後條件時,監控功能就不會建立事件及發出通知。在有效期間外,延後設定會處於非啟用狀態。 非作用中的暫緩通知不會影響事件建立時間和通知傳送時間。
延後條件,包括:
要延後通知的快訊政策清單。
如果暫緩通知適用於單一警報政策,則可使用這個選用的標籤篩選器。您可以定義篩選器的標籤,延後處理具有相符標籤的事件。舉例來說,假設篩選器包含特定虛擬機器 (VM) 執行個體 ID 的標籤,且暫緩通知功能已啟用。快訊政策仍可為篩選器中列出的 VM 以外的所有 VM 建立事件。
以標籤為準的篩選器可以包含資源和指標標籤。如果警報政策不是以 PromQL 為基礎,篩選器也可以包含中繼資料標籤。
延後功能對快訊政策條件的影響
下表說明單一條件快訊政策中條件的狀態,以及事件建立和通知傳送的時機:
狀態 | 動作 |
---|---|
不符合條件 | 現有行為 事件開啟時,請關閉事件並傳送事件關閉通知。 |
符合條件 且 政策未與有效暫緩項目建立關聯 |
現有行為 如果沒有事件,請建立事件並傳送通知。 |
符合條件 且 政策與有效的延後設定相關聯 |
|
如果含有多個條件的快訊政策套用暫緩處理設定,系統會先強制執行合併條件的規則,接著,系統會套用與暫緩通知相關的規則。
暫緩執行政策與停用政策的差異
如要避免在短時間內收到一系列警告政策的通知,可以手動停用每項警告政策,也可以建立延後通知:
如果您選擇手動停用快訊政策,請務必記得在間隔結束時手動啟用每項已停用的快訊政策。此外,您只能在使用 Cloud Monitoring API 時排定這些動作,並設定在特定時間發出 API 呼叫。
建立暫緩通知後,您可以排定有效期限,且暫緩通知可套用至多項快訊政策。當延後設定處於非啟用狀態或結束時,與延後設定相關聯的警告政策會正常運作。也就是說,這些快訊政策可以建立事件並傳送通知。
如果您有定期維護期,可以手動停用及啟用不應傳送通知的快訊政策。不過,如果為某個維護時段建立暫緩通知,可以複製該暫緩通知,然後更新副本的開始時間和持續時間。也就是說,只要建立並複製一個暫緩通知,即可為同一組快訊政策排定一系列即將到來的暫緩通知。
如要查看警告政策的啟用或停用記錄,您必須查詢 Google Cloud 專案的稽核記錄。不過,建立暫緩通知後,該通知會新增至 Google Cloud 專案的暫緩通知記錄。您可以使用 Google Cloud 控制台查看歷史記錄,瞭解過去、目前和即將暫緩的通知。
限制
暫緩通知的時間長度必須是分鐘的倍數。
暫緩通知功能只能套用至 16 項警報政策。
延後條件無法修改。
如果警告政策的條件是以 PromQL 為準,則無法在篩選器中使用中繼資料標籤。