Datenherkunft mit Google Cloud-Systemen verwenden

Die Datenabstammung zeigt die Beziehungen zwischen den Ressourcen Ihres Projekts und den Prozessen, die sie erstellt haben.

Sie können Informationen zur Datenabfolge in der Google Cloud Console in den folgenden Formen aufrufen:

  • Abstammungsdiagramm: Zeigt die Abfolge von Einträgen, die vor oder nach einem einzelnen Stammeintrag liegen. Weitere Informationen finden Sie unter Abstammungsdiagramm.
  • Visualisierung des Herkunftspfads (Vorabversion): Hier sehen Sie die Herkunftsverknüpfungen zwischen zwei ausgewählten Ressourcen. Weitere Informationen finden Sie unter Visualisierung des Abfolgepfads.
  • Listansicht der Datenherkunft (Vorabversion): Hier werden detaillierte Informationen zur Datenherkunft für Ressourcen in einer einzigen Tabelle angezeigt, einschließlich Informationen zur Datenherkunft für Ressourcen mit vielen Verbindungen. Weitere Informationen finden Sie unter Listansicht der Abfolge.

Sie können Informationen zur Herkunft auch in Form von JSON-Daten über die Data Lineage API abrufen.

Die Abfolge wird projektübergreifend erfasst. Wenn Sie eine Abfolge aufrufen, die aus mehreren Projekten generiert wurde, können Sie die aggregierten Abfolgeinformationen in einem beliebigen der entsprechenden Projekte aufrufen.

Rollen und Berechtigungen

Wenn Sie Informationen zur Datenherkunft aufrufen möchten, bitten Sie Ihren Administrator, Ihnen die Rollen „Betrachter“ zuzuweisen, wie unter Vordefinierte Rollen für die Datenherkunft beschrieben. Sie benötigen Zugriff sowohl auf das Projekt, in dem Sie die Abfolge aufrufen, als auch auf die Projekte, in denen die Abfolge aufgezeichnet wird.

In Dataplex werden Informationen zur Herkunft automatisch erfasst, wenn Sie die Data Lineage API aktivieren. Sie benötigen keine Administrator- oder Bearbeiterrollen, um die Herkunft Ihrer Daten-Assets zu erfassen.

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff verwalten. Sie können eine Rolle auf einer höheren Ordner- oder Organisationsebene zuweisen (siehe Einzelne Rolle zuweisen oder widerrufen).

Datenabfolge aktivieren

Aktivieren Sie die Data Lineage, um automatisch Informationen zur Datenherkunft für unterstützte Systeme zu erfassen. Sie müssen die Data Lineage API sowohl in dem Projekt aktivieren, in dem Sie die Herkunft ansehen, als auch in den Projekten, in denen die Herkunft aufgezeichnet wird. Weitere Informationen finden Sie unter Projekttypen.

  1. So erfassen Sie Informationen zur Herkunft:

    1. Wählen Sie in der Google Cloud Console auf der Seite Projektauswahl das Projekt aus, in dem Sie die Herkunft aufzeichnen möchten.

      Zur Projektauswahl

    2. Aktivieren Sie die Data Lineage API.

      Data Lineage API aktivieren

    3. Wiederholen Sie die vorherigen Schritte für jedes Projekt, für das Sie die Herkunft aufzeichnen möchten.
  2. Aktivieren Sie in dem Projekt, in dem Sie die Herkunft ansehen möchten, die Data Lineage API und die Dataplex API.

    APIs aktivieren

Lineage in Dataplex ansehen

Informationen zur Datenherkunft finden Sie in der Dataplex-Weboberfläche.

So rufen Sie die Abfolge auf:

  1. Rufen Sie in der Google Cloud Console die Seite der Dataplex-Suche auf.

    Zur Suche

  2. Wählen Sie Dataplex Catalog als Suchmodus aus.

  3. Suchen Sie nach dem Eintrag, für den Sie Informationen zur Abstammung aufrufen möchten. Weitere Informationen finden Sie unter Ressourcen im Dataplex Catalog suchen.

  4. Wählen Sie auf der Seite mit den Details zum Eintrag den Tab Abstammung aus.

  5. Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.

    • Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

    • Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  6. Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.

  7. Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.

Herkunft in BigQuery ansehen

Informationen zur Datenabfolge finden Sie in der BigQuery-Weboberfläche.

So rufen Sie die Abfolge auf:

  1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

    Zur Seite „BigQuery“

  2. Öffnen Sie die Tabelle, für die Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.

    • Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

    • Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  5. Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.

  6. Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.

Herkunft in Vertex AI ansehen

Systeme wie Vertex AI Pipelines generieren Abstammungsdaten für Vertex AI-Modelle und ‑Datasets. Informationen zur Datenabfolge finden Sie in der Vertex AI-Benutzeroberfläche.

Herkunft eines verwalteten Datasets in Vertex AI aufrufen

So rufen Sie die Herkunftsabfolge für ein Dataset auf:

  1. Rufen Sie in der Google Cloud Console die Seite Datasets auf.

    Seite „Datasets“ öffnen

  2. Klicken Sie auf das Dataset, für das Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.

    • Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

    • Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  5. Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.

  6. Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.

Herkunft eines Modells in Vertex AI ansehen

So rufen Sie die Abfolge für ein Modell auf:

  1. Rufen Sie in der Google Cloud Console die Seite Model Registry auf.

    Seite „Model Registry“ öffnen

  2. Klicken Sie auf das Modell, für das Sie die Datenabfolge sehen möchten.

  3. Klicken Sie auf den Tab Abstammung.

  4. Klicken Sie auf Diagramm, um das Herkunftsdiagramm aufzurufen.

    • Wählen Sie die Schaltflächen „Prozess“ oder „Datenquelle“ aus, um den Detailbereich aufzurufen.

    • Wenn Sie Informationen zur Vor- oder Nachverfolgung einer Ressource aufrufen möchten, klicken Sie auf Maximieren.

  5. Wenn Sie die Stammbaumstruktur in der Listenansicht aufrufen möchten, klicken Sie auf Liste.

  6. Wenn Sie die Visualisierung des Herkunftspfads aufrufen möchten, klicken Sie auf Liste und wählen Sie dann in der Ergebnistabelle die Zielressource aus. Klicken Sie im Detailbereich auf Ziel und dann auf Herkunft visualisieren.

Nächste Schritte