本文將說明 Cloud Monitoring 的「指標管理」頁面,協助您充分運用計費指標。 Google Cloud 專案可存取指標範圍可見的所有指標。您可以使用「指標管理」頁面執行下列操作:
一覽指標使用情形:瞭解指標在查詢、自訂資訊主頁或警告政策中的使用情形。
- 未使用的可計費指標是指在過去 30 天內未收到查詢,且未用於自訂資訊主頁或警告政策的有效指標。
- 如要查看指標範圍內,但在其他專案中定義的指標的警告政策或自訂資訊主頁,請使用專案挑選器選取儲存指標的 Google Cloud 專案。
找出費用高、價值低的指標:篩選及排序指標,瞭解哪些未使用的可計費指標對帳單影響最大。查看哪些專案和命名空間會產生耗用資源的指標。
- 查看一段時間內的趨勢,瞭解可計費指標的相對成本。
- 設定快訊,在整體使用模式發生變化時通知您。
- 如要瞭解計費指標的計費方式,請參閱「計費指標的定價模式」。
控管成本:建立規則,排除不必要的指標,避免這些指標擷取至 Cloud Monitoring。排除的指標不會產生費用。無論指標來源為何,排除規則都會套用。
- 使用指標名稱排除單一指標。
- 使用規則運算式排除指標群組。
排解指標攝入問題
- 排解寫入指標資料時發生的錯誤。
- 找出可計費指標的基數可能發生的問題。
- 查看與收集可計費指標相關的稽核記錄。如需稽核記錄的一般資訊,請參閱 Cloud 稽核記錄總覽。
「指標管理」頁面不會回報使用者定義的記錄指標。這些指標是透過計算記錄項目中的值而得出,前置字串為 logging.googleapis.com/user
。
事前準備
如要查看「指標管理」頁面中的圖表和記錄、建立警告政策,以及建立指標排除規則,您必須具備正確的授權。
指標管理會從資料收集和使用方式的角度分析指標。如要進一步瞭解這些類別,請參閱「術語」一節。
授權
-
如要取得用於查看資訊主頁和建立警示政策的權限,請使用 Google Cloud 控制台,或建立、編輯及刪除指標排除規則,請要求管理員為您授予專案的 Monitoring 編輯者 (
roles/monitoring.editor
) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
-
如要取得查看稽核記錄所需的權限,請要求管理員為您授予專案的私密記錄檢視者 (
roles/logging.privateLogViewer
) 身分與存取權管理角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。如要進一步瞭解角色,請參閱「使用身分與存取權管理功能控管存取權」。
如要在「指標管理」頁面上查看指標產生的稽核記錄,您必須在Google Cloud 專案中啟用稽核記錄功能。如要在讀取或寫入資料時,讓專案產生稽核記錄,請執行下列操作:
-
在 Google Cloud 控制台中,前往「Audit Logs」頁面:
如果您是使用搜尋列尋找這個頁面,請選取子標題為「IAM 與管理」的結果。
- 在篩選列中輸入「Stackdriver Monitoring API」。
- 選取「Stackdriver Monitoring API」。
- 在「記錄類型」分頁中,選取「資料寫入」和「資料讀取」,然後按一下「儲存」。
詳情請參閱「設定資料存取稽核記錄」。
-
術語
「指標管理」頁面會使用以下術語來說明指標的狀態,以及您使用指標的方式:
- 指標狀態
- 有效指標是指過去 25 小時內專案已擷取資料的計費指標。這些指標會產生費用。
- 停用指標是指可計費指標,但專案在過去 25 小時內未擷取任何資料。這些指標不會產生費用。
指標用法
已使用的指標是指 Cloud Monitoring API 或其他工具在過去 30 天內查詢過的指標,或是用於自訂資訊主頁或警告政策的指標。
圖表和快訊政策可以參照沒有資料的指標 (非活動指標) 並查詢這類指標;在「指標管理」頁面中,即使任何讀取作業都沒有傳回資料,這些指標仍會視為已使用指標。
未使用的計費指標是指在過去 30 天內未收到查詢,且未用於自訂資訊主頁或警告政策的有效指標。這些指標會產生擷取費用,但不會提供可觀察性效益。如果這些指標代表可觀察性差距,您可以為這些指標建立圖表或快訊政策。如果這些指標並未代表可觀察性差距,您可以將其排除,並消除擷取這些指標的成本。
閒置指標是指未使用且未啟用的指標,在過去 30 天內未收到查詢,而且未用於自訂資訊主頁或警告政策。這些指標不會產生費用。
系統每 24 小時會重新計算一次指標使用狀態,呈現最近的查詢記錄,以及資訊主頁和警告政策的變更。
查看指標用量的摘要
如要查看可計費指標數量、指標攝入率和錯誤率的摘要,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
在工具列中選取時間範圍。根據預設,「指標管理」頁面會顯示過去一天內收集的指標資訊。以下螢幕截圖為範例:
如要查看指標範圍內專案目前有多少可計費指標,請參閱「有效指標」分數卡。如果指標在過去 25 小時內曾寫入資料,就會視為有效。
如要判斷有多少有效的計費指標正在查詢或用於圖表或警示政策,請參閱「指標使用情形」評量表。未使用的可計費指標代表可能的觀察差距,您可以建立自訂資訊主頁或快訊政策來填補這些差距,或是完全排除指標來降低成本。
如要判斷哪些因素會影響費用,請使用「已攝入的可計費位元組」和「已攝入的可計費樣本」分頁卡。詳情請參閱「查看指標攝入的整體趨勢」。
如要找出可能有助您找出可計費指標設計或使用問題的資訊,請使用「指標寫入錯誤」分數卡。詳情請參閱「調查指標問題」。
「指標管理」頁面會顯示您擷取的資料量,而非實際費用。如要查看目前的帳單資訊,請按一下工具列中的「查看帳單」。
查看指標範圍相關資訊
「Metrics Management」頁面顯示的指標組合取決於專案的指標範圍。如果專案的指標範圍只包含專案本身,則「指標管理」頁面上的指標會來自目前的專案。如果專案的指標範圍包含多個專案,則「指標管理」頁面顯示的指標就會包含所有這些專案的指標。造成費用最高的指標可能來自其他專案。
如要查看專案的範圍資訊摘要,請按一下「指標範圍」。這份摘要包含以下內容:
- 具備專案存取權的 IAM 主體。主體組合包括使用者、群組和服務帳戶。
- 指標範圍可見的免費和可計費指標數量。
- 由目前專案監控的專案清單。所有這些專案的可計費指標皆可在「指標管理」頁面中找到。
- 可查看目前專案指標的任何專案相關資訊。
如要進一步瞭解指標範圍,請參閱「設定多專案檢視畫面」。
調查計費指標
「指標管理」頁面會提供一份表格,其中包含指標範圍內的每項計費指標。您可以使用這份表格執行下列操作:
- 判斷任何指標對可計費量所做的貢獻。
- 判斷指標在過去 30 天內的讀取頻率。指標讀取作業包括 API 讀取要求和圖表產生的要求。
- 找出收集到的指標,但未用於任何警告政策或資訊主頁。未使用的指標資料可能代表觀察功能有缺陷,或是排除指標可節省成本。
- 針對沒有相關聯的快訊政策或自訂資訊主頁的指標,建立快訊政策或圖表。
- 找出指標資料的來源專案。這份表格會納入指標範圍內所有專案的指標,您可能需要知道特定指標是在哪個專案中收集。
- 查看各項指標的標籤和基數資訊。當您調查指標設計或使用問題時,這些資訊可能會有所幫助。
如要查看每項可計費指標的用量資料表格,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
在工具列中選取時間範圍。根據預設,「指標管理」頁面會顯示過去一天內收集的指標資訊。下圖為指標表的範例:
選取要查看的指標
如要管理費用,您必須瞭解哪些可計費指標會產生最多流量。舉例來說,如果只知道每小時會擷取 60 MiB 的資料,就不足以瞭解整體情況。不過,如果您知道大部分的計費資料都是由一或兩個指標造成,就可以調查這些指標的用量。
如要列出可計費的指標,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在工具列中選取時間範圍。根據預設,這個分頁會顯示過去一天內收集的指標資訊。
- 如要將顯示範圍限制為特定指標群組,請使用快速篩選器或直接篩選表格。查看指標類別,可能會顯示在查看表格中所有指標時難以偵測到的模式。
指標表格會列出目前 Google Cloud 專案指標範圍內的計費指標。表格會針對每項指標顯示該指標對可計費量度的貢獻,並提供與指標相關聯的警示政策和自訂資訊主頁的連結,如以下螢幕截圖所示。如果沒有與指標相關聯的快訊政策或資訊主頁,表格會提供按鈕,讓您建立相關聯的項目。
如要依指標對計費量所做的貢獻排序,請按一下「計費的位元組數/總計」和「計費的樣本數/總計」的欄標題。
指標表格也會顯示指標的網域、指標的標籤組合、擷取指標的專案,以及指標的基數。下圖為這些欄的範例。
標籤和基數資訊可能有助於找出可計費量增加的原因。在 Cloud Monitoring 中,基數是指與指標和資源相關聯的時間序列數量,並與標籤及其值相關聯;每個標籤值組合都有一個時間序列。詳情請參閱「基數」。
可計費量發生變化,表示您正在擷取更多資料,如果變化是突然或意外發生的,可能是因為與指標相關聯的標籤數量發生變化,或是標籤值設定方式發生變化。這兩種情況都會增加指標的基數,導致可結算的量增加。如要瞭解如何使用指標管理功能找出指標問題,請參閱「調查指標問題」。
使用快速篩選器
如要只查看下列群組中的指標,請在「快速篩選器」窗格中選取項目:
指標狀態包括使用中和非作用中的指標。使用中的指標已在過去 25 小時內擷取時間序列資料。如要進一步瞭解這些狀態,請參閱術語。
指標使用情形。這個類別會依據下列項目分類指標:
已使用、未使用和未啟用指標。
- 已使用的指標已透過指標讀取機制存取,或已用於自訂資訊主頁或警告政策。
- 未使用的計費指標未經過指標讀取,或是未用於自訂資訊主頁或警告政策。
- 閒置指標是指「未啟用」和「未使用」的資源。
如要進一步瞭解這些用途類別,請參閱術語。
目前 Google Cloud 專案中警告政策使用的或未使用的指標。
目前 Google Cloud 專案中自訂資訊主頁使用的或未使用的指標。這些篩選器不包含 Cloud Monitoring 提供的預先定義資訊主頁中使用的指標。
系統每 24 小時會重新計算一次指標使用狀態,呈現最近的查詢記錄,以及資訊主頁和警告政策的變更。
按網域劃分的一系列指標,詳情請參閱「可計費指標摘要」。
如果您有未用於警告政策或自訂資訊主頁,且從未收到查詢的指標,則可能會為指標付費,卻無法從中獲得任何可觀察性效益。您可以選取「No alert policies」或「No custom dashboards」快速篩選器,列出沒有快訊政策或在目前 Google Cloud 專案中未定義自訂資訊主頁的情況下顯示的指標。
直接篩選表格
如沒有合適的快速篩選器,您可以使用 filter_list「Filter」(篩選器) 列搜尋指標組。舉例來說,如果您有跨多個專案的指標範圍,且只想列出該專案的指標,就無法使用快速篩選器。如要只列出特定專案的指標,請從篩選器清單中選取 Project
,然後輸入專案的 ID。
您也可以使用明確篩選器,搜尋符合篩選器組合的指定指標。您一次只能選取一個快速篩選器,因此無法使用快速篩選器,只列出在警示政策或自訂資訊主頁中都不會顯示的有效指標。如要搜尋符合多項條件的指標,請在篩選列中新增篩選器。舉例來說,如要列出在沒有警示政策和沒有自訂資訊主頁的情況下顯示的有效指標,請在篩選列中新增下列篩選器:
Status: Active
Alert Policies: (Empty)
Custom Dashboards: (Empty)
根據預設,如果您新增多個篩選器,當資料列符合所有篩選條件時,資料表就會納入該列。不過,您可以在其他兩個篩選器元素之間插入 OR
-filter。
查看指標讀取資訊
表格中每個指標的資料列都包含一個項目,用於記錄過去 30 天的指標讀取次數。您可以使用這個項目來瞭解查詢的來源。查詢來源會歸類為「控制台」或「其他」。從 Metrics Explorer 或自訂資訊主頁的圖表讀取資料為「控制台」讀取,而從其他來源讀取的 API 則為「其他」。
- 如要查看指標讀取來源的簡明摘要,請按一下項目旁邊的 arrow_drop_down 向下箭頭。
- 如要查看指標讀取來源的時間軸圖表,請按一下指標讀取次數。這個值也是圖表的連結。
針對未監控的指標建立快訊政策
如果表格中的指標沒有相關聯的警告政策,表格會提供「建立警告」按鈕。如要為指標建立警告政策,請在指標的資料列中按一下「Create alert」(建立警告)。
系統會開啟快訊政策對話方塊,並填入條件欄位。建議您檢查所有設定,並進行下列修改:
- 更新條件門檻值。預設值可能無法滿足需求。
- 將通知管道加入政策。
- 為政策命名。
您也可以按一下 more_vert「動作」,然後點選「建立指標快訊」,為任何指標建立快訊政策。
詳情請參閱「建立快訊政策」。
如要查看指標範圍內的指標警告政策,但在其他專案中定義,請使用專案挑選器選取儲存指標的Google Cloud 專案。
為未監控的指標建立圖表
如果表格中的指標沒有相關聯的自訂資訊主頁,表格會提供「建立圖表」按鈕。您可以使用這個按鈕建立圖表,並將圖表放在自訂資訊主頁上。如要為指標建立圖表,請按照下列步驟操作:
在指標的資料列中,按一下「建立圖表」。
「Explorer」面板會隨即開啟,並預先設定為顯示所選指標。您可以修改圖表設定。如需有關 Metrics Explorer 使用方式的詳細資訊,請參閱「使用 Metrics Explorer 建立圖表」一文。
如要將圖表儲存至自訂資訊主頁,請按一下「儲存至資訊主頁」。
在「Save Chart」面板中,執行下列操作:
- 接受或修改圖表的預設標題。
- 選取要儲存圖表的現有自訂資訊主頁,或選取「New Dashboard」(新資訊主頁),為圖表建立新的資訊主頁。
- 按一下「儲存圖表」。
如要查看指標範圍內的指標自訂資訊主頁,但在其他專案中定義,請使用專案挑選器選取儲存指標的Google Cloud 專案。
使用指標
雖然您可以使用「指標管理」頁面查看指標的部分資訊,但可能需要更多資訊。舉例來說,您可能想查看特定指標的圖表,或是建立快訊政策,在該指標的攝入率異常時通知您。
如要進一步瞭解特定指標,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
在表格中找出指標,然後按一下 more_vert「動作」,執行下列任一操作:
如要查看顯示目前指標的圖表,請選取「在 Metrics Explorer 中查看」。
Metrics Explorer 會開啟,並預先設定為顯示所選指標。您可以修改圖表設定、捨棄圖表,或是將圖表新增至自訂資訊主頁。
如要建立監控指標的警告政策,請選取「Create alert for metric」。
系統會開啟快訊政策對話方塊,並填入條件欄位。建議您檢查所有設定,並進行下列修改:
- 更新條件門檻值。預設值可能無法滿足需求。
- 將通知管道加入政策。
- 為政策命名。
詳情請參閱「建立快訊政策」。
排除指標。如要進一步瞭解這個選項,請參閱「排除不必要的指標」。
如要查看與指標相關的稽核記錄,請選取「查看指標稽核記錄」。
排除不必要的指標
您可以建立指標排除規則,避免系統將所選指標攝入 Cloud Monitoring。舉例來說,如果您有一系列不需要的未使用計費指標,可以排除這些指標,以免產生相關的擷取成本。日後需求有變更時,您可以編輯或刪除排除規則。
如要建立指標排除規則,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 按一下 add_box「排除指標」。您也可以透過「排除指標」分頁或每個指標資料列中的 more_vert「動作」建立排除條件。
- 選取要排除的指標。
- 如要排除單一指標,請從「指標名稱」表格中選取該指標。
- 如要排除一組指標,請按照下列步驟操作:
- 按一下「規則運算式」
- 輸入規則運算式。舉例來說,如要排除所有
agent.googleapis.com/apache
指標,您可以輸入agent.googleapis.com/apache.*
或agent.*/apache.*
- 按一下「顯示相符項目」,確認運算式與所需指標相符
- 按一下「建立規則」。
規則大約需要 5 分鐘才會生效。
下表列出規則運算式,可用於排除 statsd
或類似動態命名指標的指標:
封鎖名稱含有以下字元的指標 | 規則運算式 |
---|---|
連續出現 1 個以上的底線 | .*_{2,}.* |
一行超過 7 位數字 (可能是時間戳記) | .*\d{7,}.* |
片段太長 (可能為標籤剖析錯誤) | .*[a-zA-Z0-9]{20,}.* |
十六進位子字串,包括 GUID | .*[A-F0-9]{10,}.* |
IP 位址子字串 | .*\d{1,3}_\d{1,3}_\d{1,3}_\d{1,3}.* |
任何數字 (可能對 Prometheus 指標有用) | .*\d+.* |
不明類型的 Prometheus 指標 | prometheus.googleapis.com/.+/unknown.* |
編輯指標排除規則
如要編輯指標排除規則,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 按一下「已排除的指標」分頁標籤。
- 在要刪除的規則所在列中,按一下 more_vert「動作」,然後選取「編輯規則」。
- 清除所選指標或規則運算式
- 選取新的指標或建立新的規則運算式。
- 按一下「更新規則」。
編輯規則會刪除舊規則並建立新規則。
刪除指標排除規則
如要刪除指標排除規則,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 按一下「已排除的指標」分頁標籤。
- 在要刪除的規則所在列中,按一下 more_vert「Actions」,然後選取「Delete rule」。
查看排除的指標數量
如要在 Metrics Explorer 中以圖表形式查看排除的位元組或樣本數量,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 按一下「已排除的指標」分頁標籤。
- 依序點選「記錄」和「排除時間表」。
圖表已預先設定為顯示指標排除資料。您也可以按一下「儲存至資訊主頁」,將圖表儲存至自訂資訊主頁。
查看計費指標的趨勢並發出快訊
系統會根據擷取的計費位元組數和計費樣本數,決定大部分的費用。如要預測因使用可計費指標而產生的每月費用,您必須瞭解資料擷取率。「Metrics Management」頁面會提供指標使用情形摘要,協助您執行下列操作:
- 查看計費指標的使用趨勢。
- 判斷指標範圍內的專案是否傳送比預期多或少的指標資料。
- 找出產生最多資料的指標。
- 找出負責產生最多 Prometheus 資料的命名空間。
- 查看指標中的寫入錯誤率。錯誤率是指,相對於指標寫入總數,傳回錯誤狀態的指標寫入百分比。
指標使用情形摘要窗格提供連結,可查看時間趨勢的詳細資訊,以及可自訂的警示政策連結,方便您設定使用趨勢。
查看指標擷取作業的整體趨勢
如要判斷應用程式是否產生穩定應用程式的預期行為,也就是產生一致的資料量,請使用擷取分數卡查看收集率。變更查看指標的時間範圍,您可能會看到下滑、高峰或趨勢。
如要查看隨時間變化的收集率,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在工具列中選取時間範圍。
如要查看已攝入的位元組或樣本的分數卡,請按一下「查看圖表」。這篇文章將討論可計費的樣本圖表,但可計費位元組的圖表運作方式相同。您會看到一組圖表,如下所示:
根據預設,圖表會顯示收合圖例。如要查看圖表中顯示的時間序列清單,請按一下 legend_toggle「圖例」。如要瞭解如何設定時間參照或在特定時間範圍內擴大圖表,請參閱「探索圖表資料」一文。
舉例來說,如果您將時間範圍設為一週,並發現擷取的資料在一段時間內持續出現意外的增加情形,您可以查看這項增加情形是否來自特定指標,或是一組指標的整體趨勢。如果是某個指標造成問題,您可以調查指標的基數是否也增加了。
如要查看已擷取至目前指標範圍的計費樣本比率,請使用「已擷取的計費樣本總數」圖表。
如要查看指標範圍內每個專案對總可結算值的貢獻,請使用「Projects by billable samples ingested」圖表。這張圖表可顯示哪些專案傳送最多資料,以及是否有任何專案傳送的資料量正在增加或減少。
(僅限可計費的樣本) 如要找出傳送指標的命名空間,並以可計費值為最大貢獻者,請使用「命名空間的擷取音量」圖表。
如要查看指標範圍中對計費值貢獻最大的指標,請使用「按照已擷取計費樣本數顯示的前 10 大指標」圖表。您可以查看收集率的尖峰、低谷或趨勢,或是查看某項指標的線條與其他指標有何不同。
如要查看指標範圍內所有指標對計費值的貢獻,請使用「按照已擷取計費樣本數顯示的所有指標」圖表。這張圖表包含「前 10 名」圖表中的指標,可顯示指標的收集率整體分布情形。
如要進一步分析任何圖表,請按一下 more_vert「更多選項」,然後選取「在 Metrics Explorer 中查看」。如要查看以命名空間擷取量圖表為起點,並使用 Metrics Explorer 執行擷取量歸因的範例,請參閱以下內容:
如要進一步瞭解如何使用 Metrics Explorer 分析資料,包括比較當月與上個月的行為等操作,請參閱「探索圖表資料」。
根據指標攝入建立警報
如要在可計費指標的指標收集率出現異常升高、下降或趨勢時收到通知,請建立警告政策。舉例來說,指標集合的數量減少,可能表示應用程式效能不佳。同樣地,尖峰流量可能會導致非預期的費用。最後,上升趨勢可能表示指標的標籤過多,或基數正在增加。無論情況為何,快訊政策都能通知您發生異常行為,讓您解決問題。
如果您同時使用以擷取的位元組數計費和以擷取的樣本數計費的指標,就必須為這兩種計費值建立警示政策。
如要建立監控指標收集率的快訊政策,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在工具列中選取時間範圍。
- 如要查看已攝入的位元組或樣本,請按一下評量表上的「查看圖表」。
在要監控資料的圖表中,按一下「Create alerting policy」(建立快訊政策)。
系統會開啟快訊政策對話方塊,並填入條件欄位。建議您檢查所有設定,並進行下列修改:
- 更新條件門檻值。預設值可能無法滿足需求。
- 將通知管道加入政策。
- 為政策命名。
詳情請參閱「建立快訊政策」。
調查指標問題
您可以使用「指標管理」頁面,調查可計費指標的結構或用法問題。舉例來說,您可能會遇到以下情況:
- 可歸因於特定指標的可請款量增加。
- 針對特定指標的查詢延遲時間增加的回報。
- 寫入指標資料時發生錯誤,可能因為寫入的資料量或速率達到限制。
寫入指標資料時發生錯誤,可能與其他問題相關,例如可計費量異常增加或查詢延遲時間增加。舉例來說,變更指標設定可能會導致基數問題,進而影響擷取的資料量和查詢延遲時間,也可能導致指標寫入錯誤。
查看指標寫入錯誤
您可以透過「指標寫入錯誤率」分數卡執行下列操作:
- 查看寫入指標要求的狀態。
- 建立快訊政策,在指標寫入錯誤率超過閾值時通知您。
- 如果已啟用稽核記錄,請查看指標寫入錯誤的稽核記錄。這些記錄可提供指標寫入錯誤的原因。
如要查看寫入指標資料時發生錯誤的相關資訊,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在工具列中選取時間範圍。
在「指標寫入錯誤率」分數卡上,按一下「查看錯誤」。
如要查看 Cloud Monitoring API 指標寫入要求的狀態,請使用「API - 建立時間序列 (狀態碼)」圖表。這張圖表顯示對
timeSeries.create
方法的呼叫。每個時間序列都會顯示特定 HTTP 狀態碼的寫入速率。如果圖表顯示 2xx 狀態結果的單一行,表示沒有指標寫入錯誤。下列螢幕截圖顯示 2xx 狀態結果和少數 4xx 和 5xx 狀態結果:
如果您發現指標寫入要求數量增加,可能會遇到基數問題。
如果圖表顯示錯誤的狀態代碼,且您已為專案啟用稽核記錄,則可以使用記錄調查錯誤的原因。預先設定的記錄查詢會尋找與 Monitoring API 方法
timeSeries.create
相關的錯誤。每次寫入指標時,系統都會呼叫這個方法。timeSeries.create
錯誤的記錄可進一步說明錯誤狀態代碼的原因。舉例來說,如果您嘗試一次寫入太多資料,或是超過有效時間序列數量的限制,這個方法就可能會失敗。詳情請參閱「監控配額」說明文件中的「使用者定義的評估指標」一節。
調查指標建立錯誤
與指標相關的另一個可能會失敗的方法是 metricDescriptors.create
方法。當您首次為新指標寫入時間序列資料,或是變更指標資料的結構 (通常是新增標籤) 時,系統會呼叫 metricDescriptors.create
方法。您可以透過指標表中每個指標的項目,查看這項方法的錯誤稽核記錄。
如要查看特定指標的稽核記錄,請按照下列步驟操作:
-
在 Google Cloud 控制台中,前往
「Metrics management」頁面:如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果。
- 在工具列中選取時間範圍。
- 在表格中找出指標,然後按一下 more_vert「動作」。
選取「查看指標稽核記錄」。
預先設定的記錄查詢會尋找與 Monitoring API 方法
metricDescriptors.create
相關的錯誤。
metricDescriptors.create
方法的錯誤資訊可協助您找出指標設計中可能的問題。如果您超出指標描述元允許的數量,或指標描述元中的標籤數量,就可能會看到這個方法產生的錯誤。詳情請參閱「Monitoring 配額」文件中的「使用者定義指標」一節。
計費指標的計費模式
一般來說,Cloud Monitoring 系統指標是免費的,但外部系統或應用程式的指標則不包含在內。計費指標會依據擷取的位元組數或樣本數計費。本節說明以位元組和樣本為基礎的擷取方式。
如要進一步瞭解 Cloud Monitoring 中的付費功能,請參閱定價文件中的「Cloud Monitoring」。如要查看定價資訊,請參閱 Cloud Monitoring 定價總覽。
依據擷取的位元組或樣本計費
計費指標會依據位元組數或擷取的樣本數計費。每次寫入指標時,寫入作業都會包含資料值。資料值可以是純量,例如整數或浮點數,也可以是分布,也就是包含多個不同值的複雜資料類型。如要進一步瞭解指標可能寫入的值類型,請參閱「值類型」。
無論擷取費用是依據擷取的位元組或擷取的樣本計算,指標寫入的頻率 (取樣率) 和指標寫入的資料類型 (純量或分布) 都會影響擷取的資料量。
「擷取的位元組數」是指費用會根據擷取的資料量 (以位元組為單位) 計算。為了方便計算費用,每個純量值會計為 8 個位元組,每個分佈值則會計為 80 個位元組。如需更多資訊和示例,請參閱「根據擷取的位元組數計費的指標」。
「已擷取的樣本」是指費用是依據已擷取的測量值數量計算。為了計算費用,每個純量值都會計為一個樣本,每個分布則計為兩個樣本,再加上每個直方圖值區的計數。如需更多資訊和範例,請參閱按攝取的樣本收費的指標。
這兩種定價模式最大的差異在於發布值。以位元組為基準的攝入作業會以固定費率收取分布的費用,但以樣本為基準的攝入作業會考量分布中的資料;分布中如果直方圖稀疏 (即直方圖值區中只有少數值非零),則會計為較少的樣本,而分布中如果直方圖密集 (即直方圖值區中大多數值非零),則會計為較多樣本。
「指標管理」頁面上的計費指標
「指標管理」頁面會依網域回報計費指標。這個網域會提供指標的收集方式和來源資訊。
下表說明「指標管理」頁面提供的可計費指標類別,以及這些指標是根據擷取的位元組或樣本來評估:
網域 | 指標前置字串 | 定價模式 | 意義 |
---|---|---|---|
虛擬服務專員 | agent.googleapis.com |
位元組 | 代理程式從外部資源收集的指標。如需這些指標的清單,請參閱「作業套件代理程式指標」和「舊版 Monitoring 和 Logging 代理程式指標」。由舊版 Monitoring 代理程式收集的第三方整合指標,也會以「代理程式」指標回報;請參閱「第三方應用程式指標」。
代理程式也會收集自身的指標。這些指標以 |
使用者定義、自訂 | custom.googleapis.com |
位元組 | 您定義的指標。 |
外部 | external.googleapis.com |
位元組 | 部分開放原始碼程式庫或第三方供應商的指標。詳情請參閱「外部指標」。 |
工作負載 | workload.googleapis.com |
位元組 | 由 作業套件代理程式寫入的第三方整合指標。如需這些指標的清單,請參閱「第三方應用程式指標」。 |
Prometheus | prometheus.googleapis.com |
範例 | 使用 Google Cloud Managed Service for Prometheus 或作業套件代理程式和 Prometheus 接收器或 OTLP 接收器收集的指標。 |
其他計費指標
「指標管理」頁面不會回報使用者定義的記錄指標。這些指標是透過計算記錄項目中的值而得出,前置字串為 logging.googleapis.com/user
。使用者定義的記錄指標會根據擷取的位元組數計費。
後續步驟
- 使用 Ops Agent 收集指標:
- 使用 Google Cloud Managed Service for Prometheus 收集指標:
- 使用 BindPlane 收集地端部署和混合雲指標
- 使用 Monitoring API 建立使用者定義的指標
- 定價