查看管道指標

定義、建構及執行管道後,您就可以在「Metrics Explorer」中查看與管道工作或管道工作相關的指標。此外,您也可以使用 Cloud Logging 建立自訂記錄指標和警示,以監控管道失敗等事件。

本頁面將說明如何執行下列操作:

在 Cloud Logging 中建立及查看自訂指標會產生相關費用。詳情請參閱 Cloud Logging 定價

在 Metrics Explorer 中查看標準 Vertex AI Pipelines 指標

您可以在 Metrics Explorer 中查看下列與 Vertex AI Pipelines 相關的指標:

查看管道工作執行時間長度

請按照下列操作說明,在 Google Cloud 主控台中查看 Vertex Pipelines Job - PipelineJob duration 指標:

  1. 前往 Metrics Explorer

    前往 Metrics Explorer

  2. 在「指標」清單中,依序選取「Vertex Pipelines Job」 >「Pipelinejob」 >「PipelineJob duration」

  3. 按一下 [套用]

  4. 選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。例如:

    • 如要查看特定管道作業的執行時間長度,請使用 pipeline_job_id 篩選器。

    • 如要查看特定位置的管道工作執行時間長度,請使用 location 篩選器。

    • 如要查看管道工作在 PIPELINE_STATE_CANCELLEDPIPELINE_STATE_CANCELLINGPIPELINE_STATE_FAILEDPIPELINE_STATE_PENDINGPIPELINE_STATE_RUNNINGPIPELINE_STATE_SUCCEEDED 狀態中的執行時間長度,請使用 run_state 篩選器。

查看管道執行次數

請按照下列操作說明,在 Google Cloud 主控台中查看 Location - Executing PipelineJobs 指標:

  1. 前往 Metrics Explorer

    前往 Metrics Explorer

  2. 在「指標」清單中,依序選取「位置」 >「Executing_vertexai_pipeline_jobs」 >「Executing PipelineJobs」

  3. 按一下 [套用]

  4. 選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。舉例來說,如要查看特定位置的管道工作數量,請使用 location 篩選器。

查看已完成的管道工作數量

請按照下列操作說明,在 Google Cloud 主控台中查看 Vertex Pipelines Job - Completed PipelineTasks 指標:

  1. 前往 Metrics Explorer

    前往 Metrics Explorer

  2. 在「指標」清單中,依序選取「Vertex Pipelines Job」 >「Pipelinejob」 >「Completed PipelineTasks」

  3. 按一下 [套用]

  4. 選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。例如:

    • 如要查看特定管道執行作業中已完成的工作數量,請使用 pipeline_job_id 篩選器。

    • 如要查看管道執行作業在特定位置完成的工作數量,請使用 location 篩選器。

查看已執行的管道工作數量

請按照下列操作說明,在 Google Cloud 主控台中查看 Location - Executing PipelineTasks 指標:

  1. 前往 Metrics Explorer

    前往 Metrics Explorer

  2. 在「指標」清單中,依序選取「位置」 >「Executing_vertexai_pipeline_tasks」 >「Executing PipelineTasks」

  3. 按一下 [套用]

  4. 選用:如要篩選查詢,請按一下「篩選」,指定一或多個條件。舉例來說,如要查看為特定位置執行的管道工作數量,請使用 location 篩選器。

在 Logs Explorer 中建立及查看自訂指標

您可以使用 Google Cloud 控制台的記錄檔探索工具,建立自訂的記錄指標,追蹤及分析管道記錄中的模式。

自訂指標範例

本節將舉例說明您可以建立哪些自訂指標。其中包括:

為失敗的管道工作建立自訂指標

如要建立自訂記錄計數器指標,用於監控失敗的管道工作,請執行下列步驟:

  1. 前往「Logs Explorer」

    前往「Logs Explorer」

  2. 選取適當的 Google Cloud 專案。

  3. 在「Resource」下拉式選單中,選取「Vertex Pipelines Job」

  4. 在「位置」下拉式選單中,選取管道的所在位置。

  5. 在「All pipeline_job_id」下拉式選單中,選取管道工作 ID。

  6. 按一下 [套用]

  7. 按一下 [建立指標]

  8. 在「Create logs metric」畫面中:

    1. 設定「指標類型」:選取「計數器」

    2. 在「詳細資料」部分中設定下列欄位:

      • 記錄指標名稱:輸入記錄指標的名稱,例如 pipelinejob_failed。選擇在 Google Cloud 專案的記錄指標中不重複的名稱。存在一些命名限制。詳情請參閱「疑難排解」。
      • 說明:輸入指標的說明。
      • 單位:請將這個欄位留空,或輸入數字「1」
    3. 在「篩選器選項」部分定義指標篩選器。請使用記錄查詢語言建立篩選器,只收集您要在指標中計數的記錄項目,例如:

      resource.type="aiplatform.googleapis.com/PipelineJob"
      jsonPayload.state="PIPELINE_STATE_FAILED"
      

      您也可以使用規則運算式建立指標的篩選器。

      如要開啟面板,查看符合篩選條件的記錄項目,請按一下「預覽記錄」

    4. 選用:在「標籤」部分新增標籤。如需建立標籤的操作說明,請參閱「建立標籤」。

    5. 如要建立指標,請按一下「建立指標」

建立最終管道狀態的自訂指標

如要建立自訂記錄計數器指標,以監控管道作業的最終狀態,請執行下列操作:

  1. 前往「Logs Explorer」(記錄檔探索工具):

    前往「Logs Explorer」

  2. 選取適當的 Google Cloud 專案。

  3. 在「Resource」下拉式選單中,選取「Vertex Pipelines Job」

  4. 在「位置」下拉式選單中,選取管道的所在位置。

  5. 在「All pipeline_job_id」下拉式選單中,選取管道工作 ID。

  6. 按一下 [套用]

  7. 按一下 [建立指標]

  8. 在「Create logs metric」畫面中:

    1. 設定「指標類型」:選取「計數器」

    2. 在「詳細資料」部分中設定下列欄位:

      • 記錄指標名稱:輸入記錄指標的名稱,例如 Pipeline_state_final。選擇在 Google Cloud 專案的記錄指標中不重複的名稱。存在一些命名限制。詳情請參閱「疑難排解」。
      • 說明:輸入指標的說明。
      • 單位:請將這個欄位留空,或輸入數字「1」
    3. 在「篩選器選項」部分定義指標篩選器。使用記錄查詢語言建立篩選器,只收集您要在指標中計數的記錄項目,例如:

      resource.type="aiplatform.googleapis.com/PipelineJob"
      jsonPayload.state="PIPELINE_STATE_SUCCEEDED" OR
      "PIPELINE_STATE_FAILED" OR "PIPELINE_STATE_CANCELLED"
      

      您也可以使用規則運算式建立指標的篩選器。

      如要開啟面板,查看符合篩選條件的記錄項目,請按一下「預覽記錄」

    4. 選用:在「標籤」部分新增標籤。如需建立標籤的操作說明,請參閱「建立標籤」。

    5. 如要建立指標,請按一下「建立指標」

查看管道工作失敗率

管道工作失敗率的計算方式為,將最終狀態的管道工作數量除以失敗的管道工作數量。如要建立資訊主頁來監控管道工作失敗率,請按照下列步驟操作:

  1. 建立指標,以便監控管道工作處於最終狀態。詳情請參閱「建立最終管道狀態的自訂指標」。

  2. 建立用於監控失敗狀態管道工作的指標。詳情請參閱「為失敗的管道工作建立自訂指標」。

  3. 在 Google Cloud 控制台的「Monitoring」專區中,前往「Metrics Explorer」頁面。

    前往 Metrics Explorer 頁面

  4. 在「Configuration」分頁中,執行下列操作:

    1. 按一下「新增其他指標」

    2. 選取「以比率顯示指標」選項。選取這個選項後,會造成下列影響:

      • 「時間序列 A」窗格已重新命名為「分子」

      • 「時間序列 B」窗格已重新命名為「分母」

    3. 在「分母」窗格中,按一下「選取指標」,選取為失敗管道作業建立的指標。

    4. 在「分母」窗格中,按一下「選取指標」,選取為最終狀態管道工作建立的指標。

    5. (選用) 新增篩選器或更新分組欄位和對齊參數,設定分子和分母。

      如要進一步瞭解如何新增篩選器,或更新分組欄位和對齊參數,請參閱「繪製指標比率圖表」。

    選取分子和分母後,圖表就會顯示管道工作失敗率。

    • 產生管道工作失敗率圖表後,您可以將其新增至自訂資訊主頁。詳情請參閱「儲存圖表以供日後參考」。

    • 如要複製含有圖表設定的網址,請按一下圖表右上角的「/」圖示,然後點選「透過網址分享」