本頁適用於 Apigee 和 Apigee Hybrid。
查看
Apigee Edge 說明文件。
作業異常總覽
作業異常狀況會根據近期資料模式,找出 API 中異常或意外的 API 資料模式。舉例來說,在這個 API 錯誤率圖表中,錯誤率在早上 7 點左右突然飆升。與之前的資料相比,這次的升幅異常,足以歸類為異常值。

API 資料中的變化不一定代表異常:大部分都是隨機波動。舉例來說,您可能會發現錯誤率出現一些微小變化,導致異常情況發生,但這些變化不夠顯著,無法歸類為異常情況。

異常作業會持續監控 API 資料並執行統計分析,以便區分真正的異常情況和資料中的隨機波動。
作業異常狀況會自動偵測下列異常類型:
- 機構、環境和區域層級的 HTTP 503 錯誤數量增加
- 機構、環境和區域層級的 HTTP 504 錯誤數量增加
- 機構、環境和區域層級的所有 HTTP 4xx 或 5xx 錯誤數量增加
- 組織、環境和區域層級的第 90 百分位數 (p90) 的總回應延遲時間增加
系統偵測到的異常狀況會包含以下資訊:
- 導致異常的評估指標,例如 Proxy 延遲或 HTTP 錯誤代碼。
- 異常狀況的嚴重程度。嚴重程度可分為輕微、中度或嚴重,取決於模型中的可信度等級。信心程度低表示嚴重程度輕微,信心程度高則表示嚴重程度高。
使用「作業異常」功能的先決條件
如何使用「作業異常」功能:
- 貴機構必須啟用 AAPI Ops 外掛程式。請參閱在機構中啟用 AAPI Ops。
- 使用者必須具備AAPI 營運異常的必要角色,才能使用「營運異常」功能。
- 在資訊主頁中調查異常狀況的使用者也需要
roles/logging.viewer
角色。
查看偵測到的作業異常狀況
作業異常偵測功能偵測到異常狀況時,會在「作業異常」資訊主頁中顯示異常狀況詳細資料。您可以在 API 監控資訊主頁中調查異常狀況,並在必要時採取適當行動。你也可以建立快訊,在日後發生類似事件時收到通知。
Apigee UI 中的「Operations Anomalies」資訊主頁是偵測到異常作業時的主要資訊來源。資訊主頁會顯示最近的異常狀況清單。
如要開啟「營運異常」資訊主頁,請按照下列步驟操作:
- 登入 Cloud 控制台中的 Apigee UI。
- 切換至您要監控的機構。
- 在左選單中依序選取「數據分析」>「運作異常」。
系統隨即顯示「異常狀況」資訊主頁。

根據預設,資訊主頁會顯示過去一小時內發生的異常狀況。 如果在該時間範圍內未偵測到異常狀況,資訊主頁就不會顯示任何資料列。您可以從資訊主頁右上方的時間範圍選單中,選取更長的時間範圍。

表格中的每一列都對應至偵測到的異常現象,並顯示下列資訊:
- 異常現象的日期和時間。
- 異常狀況的簡短摘要,包括發生異常的 Proxy 和觸發異常的錯誤代碼。
- 異常狀況發生的環境。
- 發生異常狀況的區域。
- 異常事件的嚴重程度:輕微、中度或嚴重。嚴重性是根據統計評估 (p 值) 而定,評估事件發生的機率有多低 (事件發生的機率越低,嚴重性就越高)。
您也可以在 API 監控資訊主頁調查異常狀況,該資訊主頁會顯示近期 API 流量資料的各種圖表。
異常偵測的運作方式
異常偵測包含下列階段:
訓練模型
異常作業的運作方式是根據歷來時序資料,訓練 API Proxy 行為的模型。您無須採取任何行動即可訓練模型。Apigee 會自動使用過去六小時的 API 資料,為您建立及訓練模型。因此,Apigee 需要至少六小時的 API Proxy 資料來訓練模型,才能記錄異常現象。
訓練的目標是提高模型的準確度,之後再以歷來資料進行測試。測試模型準確度的最簡單方法,就是計算錯誤率:將偽陽性和偽陰性總和除以預測事件總數。
記錄異常事件
在執行階段,異常作業會將 API Proxy 的目前行為與模型預測的行為進行比較。接著,Operations Anomalies 會以特定的信心水準,判斷何時會出現超出預測值的作業指標。例如,當 5xx 錯誤率超過模型預測的率時。
Apigee 偵測到異常時,會自動將事件記錄在「異常作業」資訊主頁中。資訊主頁顯示的事件清單包含所有偵測到的異常狀況,以及觸發的快訊。