Cloud Monitoring 的配額與限制

本文列出 Cloud Monitoring 適用的配額和系統限制。

  • 配額會指定您可使用的可計數共用資源數量。配額是由 Cloud Monitoring 等 Google Cloud 服務定義。
  • 系統限制是固定值,無法變更。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

如要調整大部分配額,請使用 Google Cloud 控制台。詳情請參閱「要求調整配額」。

監控資源也有系統限制。 系統限制無法變更。

使用者定義的指標

Cloud Monitoring 的「指標管理」頁面提供相關資訊,協助您控管可計費指標的支出金額,同時不影響可觀測性。「指標管理」頁面會回報下列資訊:

  • 以位元組和樣本為準的計費方式,在指標網域和個別指標的擷取量。
  • 指標的標籤和基數相關資料。
  • 每個指標的讀取次數。
  • 在警告政策和自訂資訊主頁中使用指標。
  • 指標寫入錯誤率。

您也可以使用「指標管理」頁面排除不必要的指標,藉此省下擷取這些指標的費用。如要進一步瞭解「指標管理」頁面,請參閱「查看及管理指標用量」。

類別 上限
每項專案的自訂指標描述元數量1 10,000
每個自訂、外部和工作負載指標描述元的標籤 30
每個 Prometheus 指標描述元的標籤 200
標籤鍵的字串長度 100
標籤值的字串長度 1024
寫入要求中含有的時間序列數2 200
將資料寫入單一時間序列的速率3 每 5 秒 1 個資料點
每項自訂分布指標的直方圖值區 200
每項專案的工作負載、Prometheus 和外部4 指標描述元 25,000
各項受控資源中自訂指標產生的有效時間序列5 200,000
各項受控資源中工作負載指標產生的有效時間序列5 200,000
各項受監控資源中,Prometheus 產生的有效時間序列5 1,000,000
各項受控資源中外部指標產生的有效時間序列5 200,000
可建立指標描述元的速率 每項專案每分鐘 6,000 次

1 這項限制由 Cloud Monitoring 設定,其他服務設定的上限可能較低。自訂指標是指寫入 custom.googleapis.com 的指標。
2 在單一要求的各個時間序列中,您只能寫入一個資料點,因此這項限制也等同於每項要求的寫入資料點上限。
3 Cloud Monitoring API 要求將資料點寫入時間序列的結束時間至少必須間隔 5 秒。您可以將資料點批次寫入時間序列,前提是系統會依序寫入這些資料點。
4 外部指標是指寫入 external.googleapis.com 的指標。
5 如果您是在過去 24 小時內將資料點寫入時間序列,該時間序列即為有效。該列中指定的限制,是指單一受監控資源 (例如單一 gce_instance VM 或單一 k8s_container 容器) 中,所有使用者定義指標 (自訂、工作負載、Prometheus 或外部) 的有效時間序列總數。不過 global 受控資源不在此限,各項使用者定義指標的限制配額會分開計算。這項安全限制適用於整個系統,因此無法調整。

Monitoring API 配額和限制

類別 上限
API 用量限制

如要查看 API 配額和限制,請執行下列任一操作:

API 頁面權杖的有效期限 24 小時

Monitoring API 配額簡介

Monitoring API 有時間序列擷取要求和時間序列查詢的頻率配額限制。擷取要求是寫入時間序列資料的呼叫,查詢是擷取時間序列資料的呼叫。其他 Monitoring API 端點也會受到內部限制的影響,這些端點無法處理以高頻率發出的要求。

如要減少服務寫入時間序列資料時發出的 API 要求數量,請使用一個 API 要求寫入多個時間序列的資料。建議您在每個要求中至少寫入 10 個物件。 如要進一步瞭解如何批次處理 API 要求,請參閱 timeSeries.create

如果批次處理 API 要求後,您仍需要提高 Monitoring API 配額限制,請與Google Cloud 支援團隊聯絡。

其他配額限制為固定值,如本頁面中所述。

詳情請參閱 Cloud Quotas 說明文件

資料保留

超過保留期限的指標資料點會從時間序列中刪除。

類別
自訂、外部和代理程式指標類型產生的資料點保留期限,包括:
  • 自訂指標、前置字元 custom.googleapis.com
  • Google Cloud Managed Service for Prometheus 的指標, 前置字元 prometheus.googleapis.com2
  • 代理程式指標、前置字串 agent.googleapis.com,包括
    processes/count_by_stateprocesses/fork_state
    其餘 processes 指標的保留期限不同,請參閱下一個項目。
  • 外部指標 (前置碼 external.googleapis.com)
  • OpenTelemetry 和其他工作負載指標,前置字串為 workload.googleapis.com
24 個月1
程序健康狀態指標類型產生的資料點保留期限:agent.googleapis.com/processes
,但 count_by_statefork_state 除外,如前一個項目所述。
24 小時
部分 Google Cloud 服務的資料點保留時間,包括下列類別中的大多數指標:
  • Compute Engine 指標,前置字串為 compute.googleapis.com
  • GKE 和 GKE Enterprise 指標,前置字元為 kubernetes.io
  • Cloud Storage 指標,前置字元 storage.googleapis.com
  • BigQuery 指標,前置字元為 bigquery.googleapis.com
  • Cloud SQL 指標,前置字元為 cloudsql.googleapis.com
  • 內部、HTTPS 和 L7 負載平衡器指標,前置字元為 loadbalancing.googleapis.com
24 個月1
所有其他指標類型產生的資料點保留期限,包括: 6 週
API 頁面權杖的有效期限 24 小時

1 指標資料在原始的取樣頻率時保留 6 週,然後降低取樣至 10 分鐘間隔以擴充儲存空間。
2 Google Cloud Managed Service for Prometheus 指標資料在原始的取樣頻率時保留 1 週,然後降低取樣至 1 分鐘間隔,保留 5 週,接著降低取樣至 10 分鐘間隔以擴充儲存空間。

資源群組

類別
每個指標範圍的資源群組數 500
電子郵件報告中的群組數量上限1 10

1 設定 Cloud Monitoring 電子郵件報告時,您可以要求取得資源群組使用情況的相關資訊。由於電子郵件報告程式有其限制,產生的報告中僅包括 10 個群組的資訊。

受監控專案的限制

Cloud Monitoring 官方支援每個指標範圍最多 375 個專案 Google Cloud

每個指標範圍最多可新增 3,500 個專案 Google Cloud ,但您可能會遇到效能問題,特別是查詢自訂指標或歷史資料時。Cloud Monitoring 僅保證每個指標範圍最多 375 個 Google Cloud 專案的查詢和圖表效能。

如要提高 Google Cloud 每個指標範圍的專案配額,可以要求增加「受監控的專案 / 監控指標範圍」配額。詳情請參閱管理配額的相關文件。

建立及更新指標描述元的限制

Cloud Monitoring 會對建立新指標、為現有指標新增標籤名稱,以及刪除指標,強制執行每分鐘的速率限制。通常只有在首次與 Cloud Monitoring 整合時,才會達到這項速率限制,例如將現有的成熟 Prometheus 部署作業遷移至 Cloud Monitoring 時。這並非資料點的擷取速率限制。只有在建立前所未見的指標,或為現有指標新增標籤名稱時,才會套用這項速率限制。

這項配額是固定的,但只要在每分鐘的限制內建立新指標和指標標籤,任何問題都應會自動解決。

快訊的限制

類別 政策類型1
每個指標範圍的快訊政策 (指標和記錄的總和) 2 2,000 指標、記錄
每個以指標為準的快訊政策的條件 6 指標
每個以 SQL 為基礎的警告政策 (公開預先發布版) 的條件 1 SQL
以 SQL 為基礎的警告政策查詢執行時間上限 (公開搶先版) 5 分鐘 SQL
缺少指標條件的評估時間範圍上限
3
1 天 指標
指標門檻值條件的評估時間範圍上限3
23 個小時 30 分鐘 指標
指標門檻值條件中使用的篩選器長度上限
2,048 個 Unicode 字元 指標
預測條件監控的時間序列數量上限
64 指標
最短預測期間 1 小時 (3,600 秒) 指標
最長預測期間 2.5 天 (216,000 秒) 指標
每個快訊政策的通知管道 16 全部
記錄快訊的事件發生率上限4
每 5 分鐘發生 1 起事件 記錄
記錄快訊的事件數量上限
每個以記錄為準的快訊政策每天最多 20 個事件 記錄
記錄快訊的每個事件最多可發送 5 則通知
每個事件每天最多 20 則通知 記錄
每個專案同時觸發的快訊政策數量上限
80,000 全部
每個快訊政策中同時存在的未解決事件數量上限
1,000 全部
事件在沒有新資料時自動關閉的
時間長度
7 天 指標、SQL
事件的效期上限 (如果未手動關閉) 7 天 記錄
保留已結案的事件 13 個月 不適用
保留未結案的事件 無限期 不適用
每個指標範圍的通知管道 4,000 不適用
每次延後最多可延後的快訊政策數量 16 全部
保留延後項目 13 個月 不適用
1指標:根據指標資料設定的快訊政策;記錄:根據記錄訊息設定的快訊政策 (記錄快訊)
2每個指標範圍的預設上限為 2,000,您可以要求調高至 10,000。 ApigeeApigee Hybrid 與 Cloud Monitoring 緊密整合。所有 Apigee 訂閱層級 (Standard、Enterprise 和 Enterprise Plus) 的快訊限制,都與 Cloud Monitoring 相同:每個指標範圍 2,000 個。
3條件評估的最長時間為對齊週期和持續時間範圍值的總和。舉例來說,如果對齊週期設為 15 小時,時間範圍設為 15 小時,則評估條件時需要 30 小時的資料。
4 如果以記錄為準的快訊政策查詢會擷取標籤值,則每個擷取值組合都會代表各自的事件時間軸。舉例來說,假設以記錄為準的快訊政策會擷取標籤的值,而標籤可以有兩個值。完成這項設定後,系統會在同一 5 分鐘內,為每個標籤值建立一個事件。
5如果是記錄快訊,當系統收到符合篩選條件的記錄項目,且距離最近一次通知已過至少 5 分鐘時,監控功能就會針對未結事件傳送新通知。每個事件每天最多會傳送 20 則通知。系統會將每則通知傳送至快訊政策的所有已設定通知管道。

簡訊限制

簡訊傳送限制會以 24 小時為週期計算。

類別
簡訊驗證碼數量 40
每個電話號碼可接收的簡訊驗證碼數量 5
簡訊快訊訊息數量 2,500
每個電話號碼的簡訊快訊訊息數量 200

綜合監控的限制

類別
每個指標範圍的運作時間檢查 * 100
每次公開運作時間檢查的 ICMP Ping 數量上限 3
每個指標範圍的綜合監控 100
*這項限制適用於運作時間檢查設定的數量,每項運作時間檢查設定中都包含測試指定資源狀態的間隔時間。
如要瞭解如何提高這項限制,請參閱「申請調整配額」。

圖表的限制

類別
每個指標範圍 的資訊主頁 1000
資訊主頁中的圖表數 100
資訊主頁版本記錄保留設定 90 天
圖表上的線條數 50*
資料表中的資料列 300
*基於效能考量,我們設下這項限制。如果圖表中有超過 50 個時間序列,工具列會新增一個紅點圖示。圖示的工具提示會顯示訊息「To improve performance, we've limited the time series displayed in this chart」。如要顯示所有時間序列,請展開工具提示,然後選取標示為「顯示所有時間序列」的按鈕。

服務等級目標

類別
每項服務的服務等級目標數 500