您可以透過 aiplatform.PipelineJob
類別的 failure_policy
參數,設定管道是否應在其中一項工作失敗時立即失敗。
Vertex AI Pipelines 支援下列失敗政策設定:
快速失敗 (
failure_policy = 'fast'
):如果希望管道在工作失敗後停止排程新工作,請選擇這項設定。已排定的工作會繼續執行,直到完成為止。緩慢失敗 (
failure_policy = 'slow'
):如果希望管道在工作失敗後繼續執行,請選擇這項設定。管道會持續執行,直到所有工作都完成為止。
使用下列程式碼範例,透過 Python 適用的 Vertex AI SDK 設定管道的失敗政策:
job = aiplatform.PipelineJob(display_name = 'DISPLAY_NAME',
template_path = 'COMPILED_PIPELINE_PATH',
pipeline_root = 'PIPELINE_ROOT',
project = 'PROJECT_ID',
location = 'LOCATION',
failure_policy = 'FAILURE_POLICY')
更改下列內容:
DISPLAY_NAME:管道名稱,會顯示在 Google Cloud 控制台中。
COMPILED_PIPELINE_PATH:已編譯管道 YAML 檔案的路徑。可以是本機路徑或 Google Cloud Storage URI。
PIPELINE_ROOT:指定管道服務帳戶可存取的 Cloud Storage URI。管道執行作業的構件會儲存在管道根目錄中。
PROJECT_ID:這個管道執行的 Google Cloud 專案。
LOCATION:管道執行的區域。如要進一步瞭解 Vertex AI Pipelines 的可用區域,請參閱 Vertex AI 服務地區指南。如未設定這個參數,系統會使用
aiplatform.init
中設定的預設位置。FAILURE_POLICY:指定整個管道的失敗政策。可用的設定如下:
如要設定管道程序在一個工作失敗後即失敗,請輸入
fast
。如要設定管道,在某項工作失敗後繼續排定工作,請輸入
slow
。
如未設定這項參數,系統會預設將失敗政策設定為
slow
。
後續步驟
- 瞭解如何設定重試失敗的管道工作。