本文件可協助您選擇最適合的方法,以便繪製或監控指標資料的比率。這份文件也包含範例連結、可計算比率的時間點,以及兩個不同指標的比率圖表可能出現的異常狀況。這些異常現象是因為取樣率或對齊參數不同。
比率可讓您將指標資料轉換為其他可能更實用的格式。舉例來說,假設您要使用指標類型,根據回應代碼計算 HTTP 回應數量,指標資料會回報錯誤數量,但不會顯示失敗要求的比例。不過,效能要求通常會以百分比表示,例如「錯誤率必須低於 0.1%」。如要使用指標資料判斷錯誤率,請計算失敗要求與要求總數的比率。
最佳做法
如要監控或繪製指標資料的比例,建議您使用 PromQL。您可以將 PromQL 與 Cloud Monitoring API 和 Google Cloud 控制台搭配使用。 Google Cloud 控制台包含程式碼編輯器,可提供建議、錯誤偵測和其他支援功能,協助您建立有效的 PromQL 查詢。
如要建立快訊政策,在您不熟悉 PromQL 的情況下監控指標比率,請使用 Cloud Monitoring API,並加入時序篩選器。如需範例,請參閱指標比率。
如要繪製指標資料的比例圖表,但您不熟悉 PromQL,建議您使用 Google Cloud 控制台,並使用選單型介面。如需詳細操作說明,請參閱「繪製指標比率圖表」和「在自訂資訊主頁中新增圖表和表格」。
比率限制
設定比率時,請遵守下列限制:
匯總後,分母時間序列中的標籤必須與分子時間序列中的標籤相同,或為其子集。
建議您選取匯總選項,以便在匯總後,分母和分子的時間序列具有相同的標籤。
請考慮以下設定:分母時間序列含有
method
、quota_metric
和project_id
標籤。分母時間序列包含limit_name
、quota_metric
和project_id
標籤。分母分組的有效選項取決於分子選項:- 以
method
標籤分組的分子:將分母時間序列合併為單一時間序列。分母時間序列的標籤不會是分子時間序列標籤的子集,這類分組結果不具備。 - 分子依
quota_metric
標籤分組:依據該標籤將分母分組,或將分母中的所有時間序列合併為單一時間序列。 - 分子依
quota_metric
和project_id
標籤分組:將分母依兩個標籤分組、一個標籤分組,或將分母時間序列合併為單一時間序列。
有效的分母匯總選項一律會從分組時間序列中移除
limit_name
標籤,因為分母時間序列中沒有該標籤。- 以
使用 Google Cloud 控制台設定圖表時,分子和分母的對齊期間必須相同;但使用 Cloud Monitoring API 時,這些欄位可以不同。
無論您使用哪種工具建立圖表,都建議在分母和分子中使用相同的對齊期間。
分子和分母必須具有相同的值類型。舉例來說,如果分子是
DOUBLE
類型,分母也必須是DOUBLE
類型。比率的分子和分母指標必須具有
DOUBLE
或INT64
的值類型。分子和分母的對齊時間序列必須具有相同的指標類型。如果兩個指標的類型不同,您必須使用對齊器將兩者轉換為相同類型。
請考慮以下設定:分母選取
DELTA
指標,分子選取GAUGE
指標。在這種情況下,請使用速率對齊器ALIGN_RATE
,將DELTA
指標轉換為GAUGE
指標。如需範例,請參閱關於某個限制的頻率配額用量比率快訊政策。如果比率並非使用 PromQL 定義,則分子和分母的受控資源類型必須相同。
舉例來說,如果分母指標的資源是 Compute Engine 執行個體,則分母指標的資源也必須是 Compute Engine 執行個體。
取樣和對齊不符導致的異常
一般來說,建議您使用標籤值,根據單一指標類型收集的時間序列來計算比率。由於兩種不同的取樣期間和對齊時間窗格,因此以兩種不同指標類型計算的比率可能會出現異常。
舉例來說,假設您有兩種不同的指標類型 (RPC 總計數量和 RPC 錯誤數量),且想要計算錯誤計數 RPC 與總 RPC 的比率。系統會在兩種指標類型的時間序列中計算失敗的 RPC。因此,當您對齊時間序列時,可能會出現以下情況:RPC 失敗並未出現在兩個時間序列的相同對齊間隔中。造成這種差異的原因有很多,包括:
- 由於有兩個不同的時序記錄相同事件,因此有兩個實作收集的基礎計數器值,且不會以原子方式更新。
- 取樣率可能不同。當時間序列對齊至共同期間時,單一事件的計數可能會出現在不同指標時間序列的鄰近對齊間隔中。
對應對齊間隔的值數量差異,可能會導致 error/total
比率值不合理,例如 1/0 或 2/1。
較大的數字比率不太可能產生不合理的值。您可以透過匯總取得更大的數字,方法是使用比取樣期間更長的對齊時間窗格,或是將特定標籤的資料分組。這些技巧可將特定區間內點數差異造成的影響降至最低。也就是說,如果區間內的預期點數為 3,兩點差異就比預期點數為 300 時來得重要。
如果您使用內建的指標類型,可能就只能計算各指標類型的比率,才能取得所需的值。
如果您設計的自訂指標可能會在兩個不同的指標中計數相同項目 (例如傳回錯誤狀態的 RPC),建議改用單一指標,只計數一次。舉例來說,假設您要計算 RPC,並且想要追蹤失敗的 RPC 與所有 RPC 的比率。如要解決這個問題,請建立單一指標類型來計算 RPC,並使用標籤記錄呼叫狀態,包括「OK」狀態。接著,系統會更新該情況的單一計數器,記錄每個狀態值 (錯誤或「OK」)。
後續步驟
如要瞭解如何使用 PromQL 設定快訊政策,請參閱「PromQL 快訊總覽」。
如要瞭解如何建立圖表,請參閱下列文件:
- 如要建立臨時圖表,請參閱「Metrics Explorer」一文。
- 如要使用 Google Cloud 控制台將圖表新增至資訊主頁,請參閱「將圖表和表格新增至自訂資訊主頁」。
- 如要使用 Cloud Monitoring API 管理圖表,請參閱「使用 API 建立及管理資訊主頁」。