本頁面由 Cloud Translation API 翻譯而成。

作業異常總覽

本頁內容適用於 Apigee 和 Apigee Hybrid。

查看 Apigee Edge 說明文件。

作業異常狀況總覽

「作業異常」會根據近期資料模式，找出 API 中異常或出乎意料的 API 資料模式。舉例來說，在 API 錯誤率的這張圖表中，錯誤率在早上 7 點左右突然大幅上升。與該時間之前的資料相比，這項增幅異常，因此可歸類為異常。

API 資料中的變異不一定代表異常狀況，大多數都是隨機波動。舉例來說，您可能會發現錯誤率在異常狀況發生前有些微變化，但這些變化不夠顯著，因此不會歸類為異常狀況。

作業異常情況會持續監控 API 資料並執行統計分析，從資料中的隨機波動中區分出真正的異常情況。

作業異常狀況會自動偵測下列異常類型：

偵測到的異常狀況會包含下列資訊：

如何使用作業異常狀況：

「作業異常狀況」偵測到異常狀況時，會在「作業異常狀況」資訊主頁中顯示異常狀況詳細資料。您可以在 API 監控資訊主頁中調查異常狀況，並視需要採取適當行動。您也可以建立快訊，在日後發生類似事件時收到通知。

Apigee 使用者介面中的「Operations Anomalies」資訊主頁，是您瞭解偵測到的作業異常狀況的主要資訊來源。資訊主頁會顯示最近的異常狀況清單。

如要開啟「營運異常」資訊主頁，請按照下列步驟操作：

在 Google Cloud 控制台中，前往「Analytics」>「Operations Anomalies」(作業異常) 頁面。

前往「Operations Anomalies」(作業異常狀況)
切換至要監控的機構。

系統會顯示「營運異常狀況」資訊主頁。

根據預設，資訊主頁會顯示前一小時發生的異常狀況。如果該時間範圍內未偵測到任何異常狀況，資訊主頁就不會顯示任何資料列。您可以從資訊主頁右上角的時間範圍選單中，選取較大的時間範圍。

表格中的每一列都對應一項偵測到的異常狀況，並顯示下列資訊：

您也可以在 API 監控資訊主頁中調查異常狀況，該資訊主頁會顯示近期 API 流量資料的各種圖表。

異常偵測包含下列階段：

作業異常偵測功能會根據歷來時間序列資料，訓練 API Proxy 行為模型。您無須採取任何行動來訓練模型。Apigee 會自動根據過去六小時的 API 資料建立及訓練模型。因此，Apigee 需要至少六小時的 API Proxy 資料來訓練模型，才能記錄異常狀況。

訓練的目的是提高模型準確度，然後以歷來資料測試模型。如要測試模型的準確率，最簡單的方法是計算錯誤率，也就是將正向誤判和負向誤判的總和，除以預測事件總數。

在執行階段，Operations Anomalies 會比較 API Proxy 的目前行為與模型預測的行為。然後，作業異常狀況就能以特定信賴度，判斷作業指標何時會超出預測值。舉例來說，當 5xx 錯誤率超過模型預測的錯誤率時。

Apigee 偵測到異常狀況時，會自動將事件記錄在「Operations Anomalies」資訊主頁中。資訊主頁顯示的事件清單包含所有偵測到的異常狀況，以及觸發的快訊。