設定失敗政策

您可以透過 aiplatform.PipelineJob 類別的 failure_policy 參數,設定管道是否應在其中一項工作失敗時立即失敗。

Vertex AI Pipelines 支援下列失敗政策設定:

  • 快速失敗 (failure_policy = 'fast'):如果希望管道在工作失敗後停止排程新工作,請選擇這項設定。已排定的工作會繼續執行,直到完成為止。

  • 緩慢失敗 (failure_policy = 'slow'):如果希望管道在工作失敗後繼續執行,請選擇這項設定。管道會持續執行,直到所有工作都完成為止。

使用下列程式碼範例,透過 Python 適用的 Vertex AI SDK 設定管道的失敗政策:


job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
                             template_path = 'COMPILED_PIPELINE_PATH',
                             pipeline_root = 'PIPELINE_ROOT',
                             project = 'PROJECT_ID',
                             location = 'LOCATION',
                             failure_policy = 'FAILURE_POLICY')

更改下列內容:

  • DISPLAY_NAME:管道名稱,會顯示在 Google Cloud 控制台中。

  • COMPILED_PIPELINE_PATH:已編譯管道 YAML 檔案的路徑。可以是本機路徑或 Google Cloud Storage URI。

  • PIPELINE_ROOT:指定管道服務帳戶可存取的 Cloud Storage URI。管道執行作業的構件會儲存在管道根目錄中。

  • PROJECT_ID:這個管道執行的 Google Cloud 專案。

  • LOCATION:管道執行的區域。如要進一步瞭解 Vertex AI Pipelines 的可用區域,請參閱 Vertex AI 服務地區指南。如未設定這個參數,系統會使用 aiplatform.init 中設定的預設位置。

  • FAILURE_POLICY:指定整個管道的失敗政策。可用的設定如下:

    • 如要設定管道程序在一個工作失敗後即失敗,請輸入 fast

    • 如要設定管道,在某項工作失敗後繼續排定工作,請輸入 slow

    如未設定這項參數,系統會預設將失敗政策設定為 slow

後續步驟