定義、建構及執行管道後,您就可以在「Metrics Explorer」中查看與管道工作或管道工作相關的指標。此外,您也可以使用 Cloud Logging 建立自訂記錄指標和警示,以監控管道失敗等事件。
本頁面將說明如何執行下列操作:
在 Cloud Logging 中建立及查看自訂指標會產生相關費用。詳情請參閱 Cloud Logging 定價。
在 Metrics Explorer 中查看標準 Vertex AI Pipelines 指標
您可以在 Metrics Explorer 中查看下列與 Vertex AI Pipelines 相關的指標:
管道工作層級指標:
使用
Vertex Pipelines Job - PipelineJob duration
指標查看管道執行作業的執行時間長度。使用
Location - Executing PipelineJobs
指標查看管道執行次數。
管道工作層級指標:
使用
Vertex Pipelines Job - Completed PipelineTasks
查看已完成的管道工作數量。使用
Location - Executing PipelineTasks
查看管道執行作業中執行的管道工作數量。
查看管道工作執行時間長度
請按照下列操作說明,在 Google Cloud 主控台中查看 Vertex Pipelines Job - PipelineJob duration
指標:
前往 Metrics Explorer:
在「指標」清單中,依序選取「Vertex Pipelines Job」 >「Pipelinejob」 >「PipelineJob duration」。
按一下 [套用]。
選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。例如:
如要查看特定管道作業的執行時間長度,請使用
pipeline_job_id
篩選器。如要查看特定位置的管道工作執行時間長度,請使用
location
篩選器。如要查看管道工作在
PIPELINE_STATE_CANCELLED
、PIPELINE_STATE_CANCELLING
、PIPELINE_STATE_FAILED
、PIPELINE_STATE_PENDING
、PIPELINE_STATE_RUNNING
或PIPELINE_STATE_SUCCEEDED
狀態中的執行時間長度,請使用run_state
篩選器。
查看管道執行次數
請按照下列操作說明,在 Google Cloud 主控台中查看 Location - Executing PipelineJobs
指標:
前往 Metrics Explorer:
在「指標」清單中,依序選取「位置」 >「Executing_vertexai_pipeline_jobs」 >「Executing PipelineJobs」。
按一下 [套用]。
選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。舉例來說,如要查看特定位置的管道工作數量,請使用
location
篩選器。
查看已完成的管道工作數量
請按照下列操作說明,在 Google Cloud 主控台中查看 Vertex Pipelines Job - Completed PipelineTasks
指標:
前往 Metrics Explorer:
在「指標」清單中,依序選取「Vertex Pipelines Job」 >「Pipelinejob」 >「Completed PipelineTasks」。
按一下 [套用]。
選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。例如:
如要查看特定管道執行作業中已完成的工作數量,請使用
pipeline_job_id
篩選器。如要查看管道執行作業在特定位置完成的工作數量,請使用
location
篩選器。
查看已執行的管道工作數量
請按照下列操作說明,在 Google Cloud 主控台中查看 Location - Executing PipelineTasks
指標:
前往 Metrics Explorer:
在「指標」清單中,依序選取「位置」 >「Executing_vertexai_pipeline_tasks」 >「Executing PipelineTasks」。
按一下 [套用]。
選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。舉例來說,如要查看為特定位置執行的管道工作數量,請使用
location
篩選器。
在 Logs Explorer 中建立及查看自訂指標
您可以使用 Google Cloud 控制台的記錄檔探索工具,建立自訂的記錄指標,追蹤及分析管道記錄中的模式。
自訂指標範例
本節將舉例說明您可以建立哪些自訂指標。其中包括:
為失敗的管道工作建立自訂指標
如要建立自訂記錄計數器指標,用於監控失敗的管道工作,請執行下列步驟:
前往「Logs Explorer」:
選取適當的 Google Cloud 專案。
在「Resource」下拉式選單中,選取「Vertex Pipelines Job」。
在「位置」下拉式選單中,選取管道的所在位置。
在「All pipeline_job_id」下拉式選單中,選取管道工作 ID。
按一下 [套用]。
按一下 [建立指標]。
在「Create logs metric」畫面中:
設定「指標類型」:選取「計數器」。
在「詳細資料」部分中設定下列欄位:
- 記錄指標名稱:輸入記錄指標的名稱,例如
pipelinejob_failed
。選擇在 Google Cloud 專案的記錄指標中不重複的名稱。存在一些命名限制。詳情請參閱「疑難排解」。 - 說明:輸入指標的說明。
- 單位:請將這個欄位留空,或輸入數字「1」。
- 記錄指標名稱:輸入記錄指標的名稱,例如
在「篩選器選項」部分定義指標篩選器。請使用記錄查詢語言建立篩選器,只收集您要在指標中計數的記錄項目,例如:
resource.type="aiplatform.googleapis.com/PipelineJob" jsonPayload.state="PIPELINE_STATE_FAILED"
您也可以使用規則運算式建立指標的篩選器。
如要開啟面板,查看符合篩選條件的記錄項目,請按一下「預覽記錄」。
選用:在「標籤」部分新增標籤。如需建立標籤的操作說明,請參閱「建立標籤」。
如要建立指標,請按一下「建立指標」。
建立最終管道狀態的自訂指標
如要建立自訂記錄計數器指標,以監控管道作業的最終狀態,請執行下列操作:
前往「Logs Explorer」(記錄檔探索工具):
選取適當的 Google Cloud 專案。
在「Resource」下拉式選單中,選取「Vertex Pipelines Job」。
在「位置」下拉式選單中,選取管道的所在位置。
在「All pipeline_job_id」下拉式選單中,選取管道工作 ID。
按一下 [套用]。
按一下 [建立指標]。
在「Create logs metric」畫面中:
設定「指標類型」:選取「計數器」。
在「詳細資料」部分中設定下列欄位:
- 記錄指標名稱:輸入記錄指標的名稱,例如
Pipeline_state_final
。選擇在 Google Cloud 專案的記錄指標中不重複的名稱。存在一些命名限制。詳情請參閱「疑難排解」。 - 說明:輸入指標的說明。
- 單位:請將這個欄位留空,或輸入數字「1」。
- 記錄指標名稱:輸入記錄指標的名稱,例如
在「篩選器選項」部分定義指標篩選器。使用記錄查詢語言建立篩選器,只收集您要在指標中計數的記錄項目,例如:
resource.type="aiplatform.googleapis.com/PipelineJob" jsonPayload.state="PIPELINE_STATE_SUCCEEDED" OR "PIPELINE_STATE_FAILED" OR "PIPELINE_STATE_CANCELLED"
您也可以使用規則運算式建立指標的篩選器。
如要開啟面板,查看符合篩選條件的記錄項目,請按一下「預覽記錄」。
選用:在「標籤」部分新增標籤。如需建立標籤的操作說明,請參閱「建立標籤」。
如要建立指標,請按一下「建立指標」。
查看管道工作失敗率
管道工作失敗率的計算方式為,將最終狀態的管道工作數量除以失敗的管道工作數量。如要建立資訊主頁來監控管道工作失敗率,請按照下列步驟操作:
建立指標,以便監控管道工作處於最終狀態。詳情請參閱「建立最終管道狀態的自訂指標」。
建立用於監控失敗狀態管道工作的指標。詳情請參閱「為失敗的管道工作建立自訂指標」。
在 Google Cloud 控制台的「Monitoring」專區中,前往「Metrics Explorer」頁面。
在「Configuration」分頁中,執行下列操作:
按一下「新增其他指標」。
選取「以比率顯示指標」選項。選取這個選項後,會造成下列影響:
「時間序列 A」窗格已重新命名為「分子」。
「時間序列 B」窗格已重新命名為「分母」。
在「分母」窗格中,按一下「選取指標」,選取為失敗管道作業建立的指標。
在「分母」窗格中,按一下「選取指標」,選取為最終狀態管道工作建立的指標。
(選用) 新增篩選器或更新分組欄位和對齊參數,設定分子和分母。
如要進一步瞭解如何新增篩選器,或更新分組欄位和對齊參數,請參閱「繪製指標比率圖表」。
選取分子和分母後,圖表就會顯示管道工作失敗率。
產生管道工作失敗率圖表後,您可以將其新增至自訂資訊主頁。詳情請參閱「儲存圖表以供日後參考」。
如要複製含有圖表設定的網址,請按一下圖表右上角的「/」圖示,然後點選「透過網址分享」。