将数据沿袭与 Google Cloud 系统搭配使用

数据沿袭会显示项目资源与创建这些资源的流程之间的关系。您可以在 Google Cloud 控制台中以图表可视化或列表视图的形式查看数据谱系信息,也可以从 Data Lineage API 中以 JSON 数据的形式检索数据谱系信息。

系统会跨项目捕获谱系。查看从多个项目生成的谱系时,您可以在任何相关项目中查看汇总的谱系信息。

角色与权限

如需查看数据沿袭信息,请让您的管理员向您授予查看者角色,如预定义的数据沿袭角色中所述。您必须同时对查看谱系的项目和记录谱系的项目拥有访问权限。

启用 Data Lineage API 后,Data Catalog 会自动跟踪沿袭信息。您无需拥有任何管理员或编辑者角色,即可为数据资产获取谱系。

如需详细了解如何授予角色,请参阅管理访问权限。 您可以在更高级别的文件夹或组织层级分配角色(请参阅授予或撤消单个角色)。

启用数据沿袭

启用数据传承功能,开始自动跟踪受支持的系统的传承信息。您必须在查看谱系的项目和记录谱系的项目中启用 Data Lineage API。如需了解详情,请参阅项目类型

  1. 如需捕获谱系信息,请执行以下操作:

    1. 在 Google Cloud 控制台的项目选择器页面上,选择您要记录谱系的项目。

      前往“项目选择器”

    2. 启用 Data Lineage API。

      启用 Data Lineage API

    3. 对您要记录谱系的每个项目重复上述步骤。
  2. 在您查看谱系的项目中,启用 Data Lineage API 和 Data Catalog API。

    启用 API

在 Dataplex 界面中查看沿袭

您可以在 Dataplex 界面中以图表或列表的形式查看数据沿袭信息。

沿袭图表示 Data Lineage API 为特定条目收集的信息。

示例图表显示了两个表中的数据经过转换后合并的过程。
图 1. Dataplex 界面中的谱系可视化图示例。

谱系列表视图(预览版)会在单个表格中显示实体的详细谱系信息,其中包含具有多个关联的实体的谱系信息。

如需查看谱系,请按以下说明操作:

  1. 打开 Dataplex 搜索页面,然后找到您要查看其谱系信息的资产。

    打开 Dataplex 搜索页面

    如需了解详情,请参阅如何搜索数据资产

  2. 在条目详情页面上,选择谱系标签页。

  3. 选择流程或数据源按钮以显示详细信息面板。

  4. 如需查看资源的上游或下游谱系信息,请点击 展开

  5. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

在 BigQuery 界面中查看谱系

您可以在 BigQuery 界面中以图表或列表的形式查看数据谱系信息(预览版)。

如需查看谱系,请按以下说明操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    打开 BigQuery 页面

  2. 打开您要查看数据谱系的表。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 如需查看资源的上游或下游谱系信息,请点击 展开

  6. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

在 Vertex AI 界面中查看谱系

Vertex AI Pipelines 等系统会为 Vertex AI 模型和数据集生成谱系数据。您可以在 Vertex AI 界面中以图表或列表的形式查看数据谱系信息(预览版)。

在 Vertex AI 中查看代管式数据集的谱系

如需查看数据集的谱系,请按以下说明操作:

  1. 在 Google Cloud 控制台中,进入数据集页面。

    打开“数据集”页面

  2. 点击要查看其数据谱系的数据集。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 如需查看资源的上游或下游谱系信息,请点击 展开

  6. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

在 Vertex AI 中查看模型的谱系

如需查看模型的谱系,请按以下说明操作:

  1. 在 Google Cloud 控制台中,前往 Model Registry 页面。

    打开 Model Registry 页面

  2. 点击您要查看其数据谱系的模型。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 如需查看资源的上游或下游谱系信息,请点击 展开

  6. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

后续步骤