此旧版 AI Platform Pipelines 已弃用，2024 年 7 月 31 日之后将不再在 Google Cloud 上提供。旧版 AI Platform Pipelines 的所有功能以及新功能均在 Vertex AI 平台上提供。将资源迁移至 Vertex AI Pipelines 即可获取 Kubeflow 流水线 (KFP) 和许多其他功能的代管式编排引擎。

部署在 Google Kubernetes Engine (GKE) 上的 KFP 集群将在 2024 年 7 月 31 日之后继续存在。您可以通过 GKE 界面访问它们。您可以通过 Cloud Marketplace 在 GKE 上部署新的 KFP 集群。

此页面由 Cloud Translation API 翻译。

运行机器学习流水线
使用集合让一切井井有条根据您的偏好保存内容并对其进行分类。

AI Platform Pipelines 提供了一个平台，您可以利用该平台将机器学习 (ML) 工作流作为流水线自动执行。通过将机器学习流程作为流水线运行，您可以：

临时运行流水线。
安排周期性运行，以定期重新训练您的模型。
通过使用不同的超参数集、训练步数或迭代次数等运行流水线来进行实验。然后比较实验结果。

本指南将介绍如何运行流水线和安排周期性运行。本指南还提供了一些资源，供您详细了解 Kubeflow Pipelines 界面。

准备工作

本指南将介绍如何使用 Kubeflow Pipelines 界面来运行流水线。您必须先设置 AI Platform Pipelines 集群并确保有足够的权限来访问 AI Platform Pipelines 集群，然后才能运行流水线。

运行机器学习流水线

请按照以下说明在您的 AI Platform Pipelines 集群上运行机器学习流水线。

在 Google Cloud Console 中打开 AI Platform Pipelines。

转到 AI Platform Pipelines
如需查看您的 Kubeflow Pipelines 集群情况，请点击打开流水线信息中心。Kubeflow Pipelines 界面将在新标签页中打开。
在左侧导航面板中，点击流水线。
点击要运行的流水线的名称。如果您尚未加载流水线，请点击示例流水线的名称，例如 [Demo] TFX - Taxi Tip 预测模式训练程序。系统随即会打开一个显示流水线步骤的图表。
如需运行或安排流水线，请点击创建运行。系统会打开一个表单，您可以在其中输入运行详情。
在运行流水线之前，您必须指定运行详情、运行类型和运行参数。
- 在运行详情部分中，指定以下内容：
  1. 流水线：选择要运行的流水线。
  2. 流水线版本：选择要运行的流水线版本。
  3. 运行名称：输入此运行的唯一名称。然后您可以使用该名称来查找此运行。
  4. 说明：(可选）输入说明以提供有关此运行的详细信息。
  5. 实验：（可选）如需将相关运行组合在一起，请选择一个实验。
- 在运行类型部分，指明执行该运行的频率。
  1. 选择这是一次性还是周期性运行。
  2. 如果这是周期性运行，请指定运行触发器：
    1. 触发器类型：选择是定期还是按照 cron 日程表触发此运行。
    2. 最大并发运行次数：输入一次可激活的最大运行次数。
    3. 包含开始日期：请选中包含开始日期，然后输入开始日期和开始时间以指定此触发器应何时开始创建运行。
    4. 包含结束日期：请选中包含结束日期，然后输入结束日期和结束时间以指定此触发器应何时停止创建运行。
    5. 每运行一次：选择触发新运行的频率。如果此运行是基于 cron 日程表触发的，请选中允许编辑 cron 表达式以直接输入 cron 表达式。
- 在运行参数中，自定义此运行的流水线参数。您可以使用参数来设置加载训练数据或存储工件的路径、超参数、训练迭代次数等值。流水线参数是在构建流水线时定义的。
  
  如果您正在运行 [演示] TFX - Taxi Tip 预测模式训练程序流水线，请指定以下内容：
  1. pipeline-root：pipeline-root 参数指定流水线输出应存储在何处。该流水线将运行工件保存到 AI Platform Pipelines 默认的 Cloud Storage 存储分区。
    
    您可以覆盖此值，以指定您的集群可以访问的其他 Cloud Storage 存储分区的路径。详细了解如何创建 Cloud Storage 存储分区。
  2. data-root：data-root 参数用于指定流水线训练数据的路径。使用默认值。
  3. module-file：module-file 参数指定此流水线中使用的模块的源代码路径。使用默认值。
    
    通过从 Cloud Storage 存储分区加载代码，您可以快速更改组件的行为，而无需重新构建组件的容器映像。
点击启动。流水线信息中心会显示流水线运行列表。
在流水线运行列表中，点击运行名称。此时会显示您的运行的图表。在您的运行的进行过程中，图表会随着每个步骤的执行而变化。
点击流水线步骤以浏览运行的输入、输出、日志等。

了解 Kubeflow Pipelines 界面

请参考以下资源，详细了解 Kubeflow Pipelines 界面。

运行机器学习流水线 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

准备工作

运行机器学习流水线

了解 Kubeflow Pipelines 界面

后续步骤

运行机器学习流水线
使用集合让一切井井有条根据您的偏好保存内容并对其进行分类。