事件是指符合警告政策條件的記錄。通常,Cloud Monitoring 會在收到符合警示政策條件的記錄時,開啟事件並傳送通知。不過,系統不會在下列情況下建立事件:
- 政策已暫停或停用。
- 快訊政策或違規事件數量超過現有的快訊限制。
- 另一個記錄項目會導致未結事件符合相同條件。在這種情況下,監控功能只會針對相同事件傳送另一則通知。
監控會為每個事件建立「事件詳細資料」頁面,方便您管理事件,並回報事件資訊,協助您排除失敗問題。舉例來說,「事件詳細資料」頁面會顯示與記錄為基礎的快訊政策查詢相符的記錄項目清單。您也可以找到相關事件的連結。
本文將說明如何查看事件。並說明如何使用「事件詳細資料」頁面,管理以記錄為基礎的快訊政策事件。這類政策會評估 Cloud Logging 中個別記錄檔中儲存的記錄項目資料。
這項功能僅支援 Google Cloud 專案。如要設定 App Hub,請選取 App Hub 主機專案或已啟用應用程式的資料夾管理專案。
事前準備
如要取得使用 Google Cloud 控制台查看及管理事件所需的權限,請要求管理員為您授予專案的下列 IAM 角色:
-
使用 Google Cloud 控制台查看事件:
-
監控 Cloud Console 事件檢視器 (
roles/monitoring.cloudConsoleIncidentViewer
) -
Stackdriver 帳戶檢視器 (
roles/stackdriver.accounts.viewer
)
-
監控 Cloud Console 事件檢視器 (
-
使用 Google Cloud 控制台管理事件:
-
Monitoring Cloud 控制台事件編輯器 (
roles/monitoring.cloudConsoleIncidentEditor
) -
Stackdriver 帳戶檢視器 (
roles/stackdriver.accounts.viewer
)
-
Monitoring Cloud 控制台事件編輯器 (
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
如要進一步瞭解 Cloud Monitoring 角色,請參閱「使用 Identity and Access Management 控管存取權」。
尋找事件
如要查看 Google Cloud 專案中的事件清單,請按照下列步驟操作:
-
前往 Google Cloud 控制台的 notifications「Alerting」(警告) 頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
在 Google Cloud 控制台的工具列中,選取您的 Google Cloud 專案。如要設定 App Hub,請選取 App Hub 主機專案或已啟用應用程式的資料夾管理專案。
「警報」頁面會顯示警報政策、延遲提醒和事件的相關資訊:
- 「摘要」窗格會列出未解決事件的數量。
- 「Incidents」窗格會顯示最近未解決的事件。如要在表格中列出最近的事件 (包括已結案的事件),請按一下「顯示已結案的事件」。
如要查看特定事件的詳細資料,請在清單中選取該事件。
「Incident details」(事件詳細資料) 頁面隨即開啟。如要進一步瞭解「事件詳細資料」頁面,請參閱本頁的「調查事件」一節。
尋找較舊的事件
「Alerting」頁面上的「Incidents」窗格會顯示最近的未解決事件。如要查看較早的事件,請執行下列任一操作:
如要瀏覽「Incidents」表格中的項目,請按一下 arrow_back_ios「Newer」或 arrow_forward_ios「Older」。
如要前往「事件」頁面,請按一下「查看所有事件」。您可以在「事件」頁面執行下列所有操作:
篩選事件
當您在篩選列上輸入值時,「事件」表格中只會列出符合篩選條件的事件。如果您新增多個篩選器,系統只會在事件符合所有篩選條件時才顯示。
如要為事件表格新增篩選器,請按照下列步驟操作:
在「事件」頁面中,按一下 filter_list「篩選表格」,然後選取篩選器屬性。篩選器屬性包含下列所有屬性:
- 事件狀態
- 警告政策名稱
- 事件開啟或關閉的時間
從次要選單中選取值,或在篩選列中輸入值。
調查事件
「Incident details」頁面包含可協助您找出事件原因的資訊。
探索記錄項目
探索記錄項目,找出與調查相關的模式和重複發生的問題。「Logs」窗格會顯示與記錄式快訊政策查詢相符的記錄項目。
- 如要在記錄檔探索工具中查看記錄項目,請按一下「在記錄檔探索工具中查看」,然後選取範圍專案。
- 如要在 Metrics Explorer 中查看「記錄檔」面板,請按一下 query_stats「探索資料」。
查看補充資訊
「標籤」部分會顯示受控資源的標籤和值,這些標籤和值會列入導致事件發生的記錄項目。這項資訊可協助您找出造成事件的特定監控資源。詳情請參閱「使用標籤標註事件」。
「說明文件」部分會顯示您在建立快訊政策時提供的通知說明文件範本。這項資訊可能會說明警示政策監控的內容,並提供因應提示的訣竅。詳情請參閱「使用使用者定義的文件標註通知」。
如果您未為快訊政策設定說明文件,則「說明文件」窗格會顯示「未設定任何說明文件」。
探索相關事件
如要找出應用程式中的潛在問題,您可以探索與其他警報政策條件相關的事件。
「相關事件」部分會列出符合下列任一條件的事件:- 事件是在符合相同警報政策條件時建立。
- 事件與事件詳細資料頁面上顯示的事件共用標籤。
管理事件
事件會處於下列其中一種狀態:
error Open:已符合記錄檔快訊政策的條件,且事件仍處於未解決狀態。如果再次符合相同條件,且已開啟事件,則不會再開啟新的事件。
warning 已確認:事件處於開啟狀態,且已手動標示為已確認。通常,這個狀態表示事件正在調查中。
check_circle 已關閉:您已手動關閉事件,或事件在自動關閉期限過後自動關閉。
確認事件
建議您在開始調查事件原因時,將事件標示為已知悉。
如要將事件標示為已確認,請按照下列步驟操作:
- 在「警示」頁面的「事件」窗格中,按一下「查看所有事件」。
在「事件」頁面中找出要確認的事件,然後執行下列任一操作:
- 按一下 more_vert「更多選項」,然後選取「確認」。
- 開啟事件詳細資料頁面,然後按一下「確認事件」。
延後警告政策
如要避免 Monitoring 在特定時間範圍內建立事件並傳送通知,請延後相關的快訊政策。延後快訊政策後,與快訊政策相關的事件會維持未解決狀態,但不會再觸發通知。事件會根據警報政策的自動關閉期限關閉。
如要為目前查看的事件建立延後提醒,請按照下列步驟操作:
在「事件詳細資料」頁面中,按一下「暫緩政策」。
選取延後時間長度。選取延後時間後,系統會立即開始延後。
您也可以在「事件」頁面中找到要延後的事件,然後依序按一下 more_vert「更多選項」和「延後」,延後警示政策。您可以在服務中斷期間暫停快訊政策,以免在疑難排解過程中收到更多通知。
關閉事件
您可以讓 Monitoring 為您關閉事件,也可以自行關閉事件。
當警示政策的自動關閉時間到期時,監控功能就會自動關閉事件。根據預設,自動關閉時間長度為 7 天。自動關閉的時間最短為 30 分鐘。
自動關閉期限會指定事件必須在多久後關閉,且在該時間內,事件原因不得重複發生。因此,當事件處於開啟狀態,且事件發生原因再度發生時,事件可能會持續開啟,時間會超過自動關閉時間。
如要關閉事件,請按照下列步驟操作:
- 在「警示」頁面的「事件」窗格中,按一下「查看所有事件」。
在「事件」頁面中找出要關閉的事件,然後執行下列任一操作:
- 按一下 more_vert「查看更多」,然後選取「關閉事件」。
- 開啟該事件的「Incident details」頁面,然後點選「Close incident」。
如果您看到 Unable to close incident
訊息,請過幾分鐘後再試一次。系統會將導致事件發生的條件視為仍在運作,因此您無法立即關閉新事件。
資料保留和限制
如要瞭解限制和事件保留期限,請參閱「警示限制」。
後續步驟
- 如要使用 Cloud Logging API 或指令列來建立及管理快訊政策,請參閱「由 API 管理快訊政策」。