Google Cloud システムでデータリネージを使用する

データリネージには、プロジェクトのリソースとそれらを作成したプロセスの関係が表示されます。

データリネージ情報は、 Google Cloud コンソールに次の形式で表示されます。

  • リネージグラフ: 1 つのルートエントリのアップストリームまたはダウンストリームのリネージが表示されます。詳細については、リネージグラフをご覧ください。
  • リネージパスの可視化プレビュー): 選択した 2 つのリソース間のリネージリンクが表示されます。詳細については、リネージパスの可視化をご覧ください。
  • リネージのリスト表示プレビュー): リソースの詳細なリネージ情報が 1 つのテーブルに表示されます。このテーブルには、多くの接続を持つリソースのリネージ情報も含まれます。詳細については、リネージのリスト表示をご覧ください。

データリネージ API からリネージ情報を JSON データの形式で取得することもできます。

リネージはプロジェクト間でキャプチャされます。複数のプロジェクトで生成されたリネージを表示する場合は、関連するプロジェクトのいずれかで集計されたリネージ情報を表示できます。

ロールと権限

リネージ情報を表示するには、データリネージの事前定義ロールで説明されているように、閲覧者ロールを付与するよう管理者に依頼してください。リネージを表示するプロジェクトと、リネージが記録されているプロジェクトの両方にアクセスできる必要があります。

Data Lineage API を有効にすると、Dataplex Universal Catalog はリネージ情報を自動的に追跡します。データアセットのリネージのキャプチャには管理者や編集者のロールは必要ありません。

ロールの付与の詳細については、アクセスの管理をご覧ください。より上位のフォルダレベルまたは組織レベルでロールを割り当てることができます(単一ロールの付与または取り消しをご覧ください)。

データリネージを有効にする

データリネージを有効にして、サポートされているシステムのリネージ情報の自動追跡を開始します。リネージを表示するプロジェクトと、リネージが記録されているプロジェクトの両方でデータリネージ API を有効にする必要があります。詳細については、プロジェクトのタイプをご覧ください。

  1. リネージ情報をキャプチャする手順は次のとおりです。

    1. Google Cloud コンソールの [プロジェクト セレクタ] ページで、リネージを記録するプロジェクトを選択します。

      プロジェクト セレクタに移動

    2. データリネージ API を有効にします。

      データリネージ API を有効にする

    3. リネージを記録するプロジェクトごとに、上記の手順を繰り返します。
  2. リネージを表示するプロジェクトで、データリネージ API と Dataplex API を有効にします。

    API を有効にする

Dataplex Universal Catalog でリネージを表示する

データリネージ情報は、Dataplex Universal Catalog ウェブ インターフェースで表示できます。

リネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで、Dataplex Universal Catalog の [検索] ページに移動します。

    検索に移動

  2. 検索モードとして [Dataplex Catalog] を選択します。

  3. リネージ情報を表示するエントリを検索します。詳細については、Dataplex Universal Catalog でリソースを検索するをご覧ください。

  4. エントリの詳細ページで、[リネージ] タブを選択します。

  5. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [開く] をクリックします。

  6. リネージをリスト表示で表示するには、[リスト] をクリックします。

  7. リネージパスの可視化を表示するには、[リスト] をクリックし、結果のテーブルでターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

BigQuery でリネージを表示する

データリネージ情報は BigQuery ウェブ インターフェースで表示できます。

リネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで、[BigQuery] ページに移動します。

    [BigQuery] ページを開く

  2. データリネージを表示するテーブルを開きます。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [開く] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果のテーブルでターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

Vertex AI でリネージを表示する

Vertex AI Pipelines などのシステムは、Vertex AI モデルとデータセットのリネージデータを生成します。データリネージ情報は、Vertex AI UI ウェブ インターフェースで表示できます。

Vertex AI でマネージド データセットのリネージを表示する

データセットのリネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで [データセット] ページに移動します。

    [データセット] ページを開く

  2. データリネージを表示するデータセットをクリックします。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [開く] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果のテーブルでターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

Vertex AI でモデルのリネージを表示する

モデルのリネージを表示する手順は次のとおりです。

  1. Google Cloud コンソールで、[Model Registry] ページに移動します。

    [Model Registry] ページを開く

  2. データリネージを表示するモデルをクリックします。

  3. [リネージ] タブをクリックします。

  4. リネージグラフを表示するには、[グラフ] をクリックします。

    • プロセスまたはデータソースのボタンを選択して、詳細パネルを表示します。

    • リソースのアップストリームまたはダウンストリームのリネージ情報を表示するには、 [開く] をクリックします。

  5. リネージをリスト表示で表示するには、[リスト] をクリックします。

  6. リネージパスの可視化を表示するには、[リスト] をクリックし、結果のテーブルでターゲット リソースを選択します。詳細パネルで [ターゲット]、[リネージを可視化] の順にクリックします。

次のステップ