查看應用程式遙測資料

本文將說明如何查看 App Hub 應用程式、服務和工作負載的立即可用 (OOTB) 資訊主頁。這些資訊主頁可協助您瞭解應用程式資源的效能表現,並診斷問題。

這些 OOTB 資訊主頁顯示的遙測資料包含記錄和指標資料,以及開放事件的相關資訊。應用程式資訊主頁會提供位置、重要性和擁有者等資訊。服務和工作負載資訊主頁會提供 App Hub 和基礎架構類型的相關資訊。

應用程式專屬標籤

App Hub 專屬標籤可讓 Google Cloud Observability 建構 OOTB 資訊主頁的階層,並篩選顯示的遙測資料,以便服務或工作負載使用。您也可以使用這些標籤篩選記錄和指標資料。

當您註冊的應用程式在Application Monitoring 支援的基礎架構上執行時,系統會將應用程式專屬標籤附加至記錄和指標資料。在某些 Google Cloud Managed Service for Prometheus 設定中,應用程式標籤也會附加至 Prometheus 指標資料。

記錄標籤

記錄項目包含 apphub 欄位,列出應用程式和服務或工作負載的標籤。以下說明這類資料的格式:

apphub: {
  application: {
    id: "my-app"
    location: "my-app-location"
  }
  workload: {
    criticalityType: "MEDIUM"
    environmentType: "STAGING"
    id: "my-workload-id"
  }
}

指標標籤

本節將說明如何將應用程式專屬標籤附加至由 Google Cloud 資源產生的指標資料,以及透過 Google Cloud Managed Service for Prometheus 擷取的 Prometheus 指標。在以下範例中,將 a.b.{x,y} 解讀為 a.b.xa.b.y

下列 App Hub 標籤會附加至應用程式使用的 Google Cloud 資源指標資料:

  • metadata.system_labels.apphub_application_{container,id,location}
  • metadata.system_labels.apphub_{workload,service}_{criticality_type,environment_type,id}

在下列情況下,App Hub 應用程式標籤會附加至 Google Cloud Managed Service for Prometheus 指標:

  • 工作負載是在版本 1.30 以上的 Google Kubernetes Engine 叢集中執行,且工作負載的控制器類型為下列其中一種:

    • apps.k8s.io/{Deployment,StatefulSet,DaemonSet}
    • batch.k8s.io/CronJob
  • 在 Cloud Run 上使用 OpenTelemetry。

  • 在 Google Kubernetes Engine 上使用 OpenTelemetry,並遵循 OTLP Kubernetes Ingest 指南。

Prometheus 的 Managed Service 會使用 App Hub API 判斷是否存在 App Hub 應用程式。找到應用程式後,系統會在追蹤資料中加入下列應用程式專屬標籤:

  • metric.labels.apphub_application_{container,id,location}
  • metric.labels.apphub_workload_{criticality_type,environment_type,id}

快訊政策標籤

服務和工作負載標籤不會自動附加至警示政策。不過,您可以將警示政策與特定工作負載或服務建立關聯,方法是將下列所有標籤連結至警示政策,並附上下列鍵:

  • apphub_application_location
  • apphub_application_id
  • apphub_service_idapphub_workload_id

當快訊政策包含上述鍵時,系統會在 OOTB 資訊主頁上顯示政策的事件。

詳情請參閱「將快訊政策與服務或工作負載建立關聯」。

開啟 Google Cloud 觀測功能頁面時, Google Cloud 控制台會自動將資源挑選器從已啟用應用程式的資料夾重設為資料夾的管理專案。

Cloud Logging 支援以資料夾做為資源。舉例來說,您可以在資料夾資源中建立記錄接收器和記錄資料夾。同樣地,資料夾包含 _Default_Required 記錄值區,您可能會想查看這些值區的內容。如要存取資料夾資源,請使用資源挑選器,並手動選取已啟用應用程式的資料夾。

事前準備

使用應用程式監控功能前,請先設定 App Hub 代管專案,或已啟用應用程式的資料夾的管理專案。這是用來查看應用程式遙測資料的專案:

  • 如要取得查看記錄和指標資料、建立警示政策和自訂資訊主頁所需的權限,請要求管理員授予您下列 IAM 角色:

    • Logs Viewer (roles/logging.viewer) 在 App Hub 主機專案或已啟用應用程式的資料夾管理專案,以及列出其預設記錄檔範圍的任何其他專案上。這個角色會授予 _Default 記錄值區中大部分記錄項目的存取權。詳情請參閱「記錄角色」。
    • Logs View Accessor (roles/logging.viewAccessor),在 App Hub 主機專案或已啟用應用程式的資料夾管理專案的預設記錄範圍中列出的記錄檢視畫面。如要進一步瞭解如何授予記錄檢視畫面的存取權,請參閱「控管記錄檢視畫面的存取權」。
    • App Hub主機專案或啟用應用程式資料夾的管理專案中,使用Monitoring Editor (roles/monitoring.editor)。如果實體擁有者不需要建立或修改警示政策或資訊主頁,建議您授予「Monitoring Viewer」角色 (roles/monitoring.viewer)。
    • App Hub 主專案或已啟用應用程式的資料夾管理專案中,指派 App Hub 檢視者角色 (roles/apphub.viewer)。詳情請參閱「應用程式中心角色和權限」。

    如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

    您或許還可透過自訂角色或其他預先定義的角色取得必要權限。

  • 請確認您已設定 App Hub 主機專案或已啟用應用程式的資料夾的觀察範圍。詳情請參閱「設定 Application Monitoring」。

    可觀察範圍會控制 App Hub 主機專案或已啟用應用程式的資料夾的管理專案可使用的資料。這些範圍的預設設定可能無法讓您查看所有記錄或指標資料。

  • 更新用於監控應用程式資料的快訊政策,納入應用程式專屬標籤。詳情請參閱「將快訊政策與服務或工作負載建立關聯」。

查看所有應用程式的摘要

頂層 OOTB 資訊主頁提供註冊應用程式的狀態摘要。這個頁面會針對每個應用程式列出未解決事件的數量,以及位置、重要性和環境相關資訊。

如要開啟頂層 OOTB 資訊主頁,其中列出已在 App Hub 註冊的應用程式摘要資訊,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Application monitoring」頁面:

    前往「Application Monitoring」

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在 Google Cloud 控制台的工具列中,選取 App Hub 主機專案或已啟用應用程式的資料夾的管理專案。

  3. 選用步驟:如要在 App Hub 中開啟應用程式,請按一下 「更多」,然後選取「在 App Hub 中管理」

  4. 如要開啟應用程式的 OOTB 資訊主頁,請選取該應用程式。下一節將說明如何探索或解讀遙測資料。

探索應用程式遙測資料和事件

選取「應用程式監控」頁面上列出的應用程式後,系統會開啟該應用程式的頂層 OOTB 資訊主頁。這個資訊主頁會匯總未解決事件的數量,並列出多個黃金信號的值,協助您瞭解應用程式的健康狀況。舉例來說,如果這個頁面顯示廣泛的失敗情形,可能表示失敗的原因是基礎架構,而非應用程式。

如要開啟應用程式的 OOTB 資訊主頁,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Application monitoring」頁面:

    前往「Application Monitoring」

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在 Google Cloud 控制台的工具列中,選取 App Hub 主機專案或已啟用應用程式的資料夾的管理專案。
  3. 在「應用程式監控」頁面中,選取所需應用程式名稱。

    應用程式的 OOTB 資訊主頁會隨即開啟,並選取「總覽」分頁。這個分頁會列出每項服務和工作負載,以及未解決事件的數量和黃金信號值:

    • 流量:所選時間範圍內,服務或工作負載的傳入要求比率。
    • 伺服器錯誤率:在所選時間範圍內,傳入要求產生或對應至 5xx HTTP 回應代碼的平均百分比。
    • P95 延遲時間:在所選時間範圍內,要求的延遲時間第 95 個百分位數,以毫秒為單位。
    • Saturation:評估服務或工作負載的使用率。舉例來說,對於代管執行個體群組 (MIG)、Cloud Run 和 Google Kubernetes Engine 部署,這個欄位會顯示 CPU 使用率。

    在「總覽」分頁中,您可以執行下列所有操作:

    • 重設時間範圍。開啟資訊主頁時,時間範圍會設為最近一小時。
    • 查看應用程式的相關資訊,例如作業人員、開發人員和商家擁有者。
    • 在 App Hub 中開啟應用程式、服務或工作負載。
    • 開啟服務或工作負載的資訊主頁。
  4. 如要查看應用程式遙測資料和未解決事件的相關資訊,請選取「資訊主頁」分頁標籤。

    「資訊主頁」分頁會顯示記錄、指標和事件資訊。這個分頁會在圖表上疊加事件註解。在排解問題時,註解可協助您連結不同來源的資料。如要查看已啟用的註解,請在工具列中依序按一下 「註解」

    這個分頁也包含篩選器,可用於限制分頁顯示的資料。如要進一步瞭解如何探索這個分頁中顯示的資料,請參閱本文件的以下部分:

篩選資訊主頁

「資訊主頁」分頁會顯示應用程式中服務和工作負載的資料。不過,您可以將這個資訊主頁篩選為特定服務或一組服務。

舉例來說,資訊主頁分頁上的工具列包含 apphub_service_id: * 等篩選器。如要查看特定服務的資料,請按一下 「選單」,然後從清單中選取這些服務。

探索記錄檔資料

如果您查看的是應用程式資訊主頁的「Dashboard」分頁,記錄資料會顯示在「Application Logs」部分。否則,您的資料資料會顯示在「Logs」部分。

資訊主頁的「應用程式記錄」和「記錄」部分會顯示符合篩選條件的記錄項目,這些項目是由 App Hub 主機專案或啟用應用程式的資料夾管理專案的預設記錄範圍中列出的資源儲存。應用程式的篩選器如下所示:

-- Application logs
(apphub_application_location=global)
(apphub_application_id=my-app)

針對服務和工作負載,篩選器會包含其他子句。如要查看套用至記錄資料的篩選器,請按一下「顯示查詢」

如要編寫查詢,您可以開啟彈出式視窗或「Logs Explorer」頁面。這兩種選項都讓您撰寫及執行查詢,並變更範圍。不過,彈出式視窗會保留目前的內容,讓您將探索結果儲存至自訂資訊主頁:

  • 如要開啟彈出式視窗,請按一下 「探索資料」

    探索完成後,請按一下「取消」關閉彈出式視窗並捨棄變更。如要將變更內容儲存至自訂資訊主頁,請按一下「儲存至資訊主頁」,然後完成對話方塊。您無法將變更儲存至開啟彈出式視窗時正在查看的資訊主頁。

    彈出式視窗不會列出「顯示查詢」按鈕顯示的篩選器。這些篩選器會套用至資訊主頁層級,且無法移除。

  • 如要在新的瀏覽器分頁中開啟「Logs Explorer」頁面,請按一下「在 Logs Explorer 中查看」

    系統會預先設定查詢,顯示符合特定應用程式標籤,且位於資訊主頁指定時間範圍內的記錄項目。關閉瀏覽器分頁後,系統會捨棄變更。

如要進一步瞭解如何探索記錄,請參閱下列文件:

探索指標資料

資訊主頁上的圖表和表格會顯示關鍵信號和其他指標資料,這些資料與應用程式、服務或工作負載使用的資源相關。顯示的資料可儲存在任何專案中,這些專案會根據 App Hub 主機專案的指標範圍或已啟用應用程式的資料夾的管理專案列出。

對於顯示指標資料的任何圖表或表格,您可以查看指標類型和匯總選項等詳細資料。如要查看這項資訊,請前往圖表或表格的工具列,然後按一下 「資訊」

如要進一步探索圖表或表格,您可以開啟彈出式視窗或 Metrics Explorer 頁面。這兩種方法都能讓您嘗試不同的圖表設定,並將結果儲存至自訂資訊主頁。不過,彈出式視窗會保留您目前的背景資訊:

  • 如要開啟彈出式視窗,請按一下 「探索資料」

    探索完成後,請按一下「取消」關閉彈出式視窗並捨棄變更。如要將變更內容儲存至自訂資訊主頁,請按一下「儲存至資訊主頁」,然後完成對話方塊。您無法將變更儲存至開啟彈出式視窗時正在查看的資訊主頁。

  • 如要在 Metrics Explorer 中查看圖表或表格,請前往工具列,按一下 「More」,然後選取「View in Metrics Explorer」

    您現在有一個可修改及探索的臨時圖表。例如,您可以變更匯總選項或變更顯示樣式。如要將圖表儲存至自訂資訊主頁,請按一下「儲存至資訊主頁」,然後完成

探索事件

資訊主頁的「警示」部分會列出與服務或工作負載相關聯的警告政策,以及最近發生的事件。這些警示政策必須儲存在 App Hub 主機專案或已啟用應用程式的資料夾的管理專案中。

如果「警示」部分沒有任何項目,表示您沒有與服務或工作負載相關聯的警示政策。如要建立這項關聯,請在政策中新增標籤。詳情請參閱「將快訊政策與服務或工作負載建立關聯」。

如要進一步瞭解事件和快訊政策,請按照下列步驟操作:

  • 如要查看造成事件的快訊政策詳細資料,請按一下政策名稱。開啟的資訊主頁會顯示快訊政策的詳細資訊,包括顯示監控資料和標籤的圖表。

  • 如要查看與應用程式相關聯的所有快訊政策,請前往工具列,然後按一下 「Explorer 資料」。系統會開啟彈出式視窗,列出所有政策。如要返回資訊主頁,請按一下「取消」

探索服務或工作負載的遙測資料和事件

每項服務和工作負載都會提供一個 OOTB 資訊主頁。這些資訊主頁會顯示記錄、指標和事件資訊,協助您瞭解特定服務或工作負載的健康狀態。您可以探索這些 OOTB 資訊主頁的資料,方法與探索應用程式「資訊主頁」分頁中顯示的資料類似。

如要為服務或工作負載開啟 OOTB 資訊主頁,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「Application monitoring」頁面:

    前往「Application Monitoring」

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在 Google Cloud 控制台的工具列中,選取 App Hub 主機專案或已啟用應用程式的資料夾的管理專案。
  3. 在「應用程式監控」頁面中,選取應用程式名稱,然後選取服務或工作負載。

    資訊主頁會顯示所選服務或工作負載的記錄、指標和事件資訊。針對工作負載,資訊主頁會設定在圖表上疊加事件註解。在排解問題時,註解可協助您連結不同來源的資料。如要查看已啟用的註解,請在工具列中依序按一下 「註解」

    摘要資訊卡會顯示一般資訊和基礎架構類型。如果無法識別基礎架構類型,這個欄位會顯示「App Hub Service」等通用文字。詳情請參閱「Application Monitoring 支援的基礎架構」。

    如要瞭解如何探索服務或工作負載資訊主頁上的資料,請參閱本文件的以下部分:

建立自訂資訊主頁

Google Cloud Observability 支援建立自訂資訊主頁,讓您可以完全控管資訊主頁的內容。自訂資訊主頁會列於 Google Cloud 控制台的「Dashboards」頁面,您可以複製、編輯及刪除這些資訊主頁。您也可以將已設定好的資訊主頁小工具儲存在這些位置。舉例來說,如果您在應用程式資訊主頁上查看圖表,可以前往工具列並選取「儲存至資訊主頁」,將圖表儲存至自訂資訊主頁。

如果您打算為應用程式、服務或工作負載建立自訂資訊主頁,以下資訊可能會有所幫助:

將警告政策與 App Hub 應用程式建立關聯

您可以將應用程式專屬標籤新增至快訊政策,藉此將快訊政策與服務或工作負載建立關聯。新增這些標籤後,系統會在警示政策中列出這些標籤,並將這些標籤納入任何事件中。如要進一步瞭解標籤,請參閱使用標籤標註事件

如要使用 Google Cloud 控制台將快訊政策與工作負載或服務建立關聯,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的 「Alerting」(警告) 頁面

    前往「Alerting」(快訊)

    如果您是使用搜尋列尋找這個頁面,請選取子標題為「Monitoring」的結果

  2. 在Google Cloud 控制台的工具列中,選取 App Hub 主機專案,或已啟用應用程式的資料夾的管理專案。
  3. 找出快訊政策,按一下 「查看更多」,選取「編輯」,然後前往「通知和名稱」部分。
  4. 在「應用程式標籤」部分,選取應用程式,然後選取工作負載或服務。
  5. 按一下 [Save Policy] (儲存政策)。

完成這些步驟後,系統會將含有下列鍵的標籤附加至警示政策。這些標籤可用來識別應用程式和服務或工作負載:

  • apphub_application_location
  • apphub_application_id
  • apphub_service_idapphub_workload_id

您也可以使用 Google Cloud CLI、Terraform 或 Cloud Monitoring API,在快訊政策中加入使用者標籤。不過,您必須使用前述範例中的標籤鍵。如要瞭解詳情,請參考下列資源:

疑難排解

如要瞭解您查看的資料,或資訊主頁未顯示資料的原因,請參閱「應用程式監控疑難排解」。