使用作业构建器保存和加载 YAML 作业定义

您可以将作业构建器作业保存为封装作业配置的 Apache Beam YAML 文件。这些 YAML 文件可以重新加载到作业构建器中,以供重复使用和进一步修改。

保存流水线

如需将流水线保存为 Beam YAML,请执行以下操作:

  1. 使用作业构建器创建流水线

  2. 点击 Save YAML(保存 YAML)以打开 Save YAML(保存 YAML)窗口。

  3. 执行以下操作之一:

    • 如需将 YAML 复制到剪贴板,请点击 Copy(复制)。
    • 如需保存到 Cloud Storage,请输入 Cloud Storage 路径,然后点击保存
    • 如需下载本地文件,请点击下载

加载流水线

将流水线保存为 Beam YAML 后,您可以将其重新加载到作业构建器中。然后,您可以使用作业构建器修改或运行流水线。

您可以从 Cloud Storage 或文本加载 Beam YAML。

从 Cloud Storage 加载数据流

如需从 Cloud Storage 加载流水线,请执行以下操作:

  1. 前往 Google Cloud 控制台中的作业页面。

    转到作业

  2. 点击 基于构建器创建作业

  3. 点击 Load YAML

  4. 点击从 Cloud Storage 加载

  5. YAML 文件位置框中,输入 YAML 文件的 Cloud Storage 位置,或点击浏览以选择该文件。

  6. 点击加载

从文本加载流水线

如需从文本加载流水线,请执行以下操作:

  1. 前往 Google Cloud 控制台中的作业页面。

    转到作业

  2. 点击 基于构建器创建作业

  3. 点击 Load YAML

  4. 点击从文本加载

  5. 将 YAML 粘贴到该窗口中。

  6. 点击加载