Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
In diesem Dokument finden Sie Informationen zur Einhaltung der Datenherkunft und zu Einschränkungen.
Die Datenherkunft wird pro Projekt und nicht pro System aktiviert.
Das bedeutet, dass nach der Aktivierung der Data Lineage API Herkunftsinformationen für mehrere Systeme im Projekt automatisch gemeldet werden können, je nach Herkunftssteuerung auf Produktebene für jedes System.
Die automatische Herkunftsanalyse wird für die folgenden Systeme unterstützt:
Abstammungssteuerung auf Produktebene in Google Cloud unterstützten Systemen
System
Verfügbare Lineage-Einstellungen
BigQuery, Cloud Data Fusion
Wenn die Data Lineage API in einem Projekt aktiviert ist, kann die Lineage-Erfassung nicht auf Cloud Data Fusion oder BigQuery beschränkt werden.
Cloud Composer
Cloud Composer verwendet die Steuerung der Datenherkunftsintegration auf Umgebungsebene. Die Datenherkunft wird automatisch für alle neuen Cloud Composer-Umgebungen aktiviert, sofern sie die Anforderungen erfüllen. Weitere Informationen finden Sie unter
Datenherkunft mit Dataplex Universal Catalog. Bei vorhandenen Umgebungen können Sie die Integration der Datenherkunft in den Umgebungseinstellungen aktivieren oder deaktivieren.
Dataflow
Mit Dataflow-Jobs können Herkunftsereignisse erfasst und in der Data Lineage API veröffentlicht werden.
Weitere Informationen finden Sie unter Data Lineage in Dataflow verwenden.
Dataproc
Dataproc-Spark-Jobs können Herkunftsereignisse erfassen und in der Data Lineage API veröffentlichen.
Weitere Informationen finden Sie unter Dataproc-Integration für Datenherkunft.
Vertex AI
Die Datenherkunft ist für Vertex AI-Artefakte und -Parameter wie Modelle, Datasets, Pipeline-Vorlagen und Komponenten automatisch aktiviert. Die Herkunft einer Pipeline umfasst Faktoren, die zu ihrer Erstellung beigetragen haben, sowie Artefakte und Metadaten, die danach abgeleitet wurden.
Weitere Informationen finden Sie unter Herkunft von Pipeline-Artefakten verfolgen.
Auswirkungen auf die Abrechnung
Wenn Sie die Data Lineage API für ein Projekt aktivieren, sollten Sie sich die Auswirkungen auf Ihre Abrechnungsgebühren ansehen, da die Data Lineage API pro Projekt aktiviert wird (siehe vorheriger Abschnitt).
Weitere Informationen zur Abrechnung der Datenherkunft finden Sie unter Dataplex Universal Catalog-Preise.
Bei BigQuery Omni wird die Verarbeitung von Lineage-Daten auf bestimmte Regionen verteilt. Die Kosten hängen von den Regionen ab, in denen die Verarbeitung erfolgt.
Data Lineage als Teil von Dataplex Universal Catalog bietet Unterstützung für VPC Service Controls.
Dataplex Universal Catalog bietet nicht die Möglichkeit, vom Kunden verwaltete Verschlüsselungsschlüssel zum Schutz der erfassten Lineage-Metadaten zu verwenden.
Einschränkungen bei Datenreihen
Wenn Sie einen Knoten im Herkunftsdiagramm auswählen, ist die Seitenleiste mit den Knotendetails leer, wenn:
Die Ressource befindet sich in einer anderen Organisation.
Der Nutzer ist kein Mitglied der Organisation, in der die Ressource gehostet wird.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-19 (UTC)."],[[["\u003cp\u003eData lineage is enabled per project, allowing automatic reporting for multiple systems within that project based on each system's product-level lineage control.\u003c/p\u003e\n"],["\u003cp\u003eAutomatic lineage tracking is supported for various systems, including BigQuery, Cloud Data Fusion, Cloud Composer, Dataflow, Dataproc, and Vertex AI, each with its own lineage control features.\u003c/p\u003e\n"],["\u003cp\u003eEnabling the Data Lineage API has a billing impact, as it is enabled per project, and BigQuery Omni's lineage processing costs depend on the regions where it is performed.\u003c/p\u003e\n"],["\u003cp\u003eData lineage captures metadata about data movement, not the data itself, and it provides VPC-SC support but does not support Customer Managed Encryption Keys for lineage metadata.\u003c/p\u003e\n"],["\u003cp\u003eLineage node details might be empty if the resource is in another organization or the user isn't part of the organization hosting the resource.\u003c/p\u003e\n"]]],[],null,["# Data lineage considerations\n\nThis document provides information on data lineage compliance and limitations.\nData lineage is enabled on a per-project basis, not a\nper-system basis.\nThis means that after you enable the Data Lineage API, lineage information\ncan be automatically reported for multiple systems in the project, depending on\neach system's product-level lineage control.\n\nAutomatic lineage tracking is supported for the following systems:\n\n| **Important:** See [Supported systems](/dataplex/docs/about-data-lineage#lineage-supported-systems) for details on the support status of these systems. When a new system becomes available, depending on the level of that system's lineage control, the Data Lineage API can automatically start harvesting lineage data.\n\nBilling impact\n--------------\n\nWhen you enable the Data Lineage API on a project, review\nthe impact on your billing charges because the Data Lineage API is enabled\non a per-project basis (see the previous section for details).\nFor more information about how data lineage is charged, see\n[Dataplex Universal Catalog pricing](https://cloud.google.com/dataplex/pricing).\n\nFor BigQuery Omni, lineage processing\nis distributed to specific regions, and costs depend on the regions where\nthe processing is performed.\n\nData lineage compliance\n-----------------------\n\n- Data lineage records metadata about data movement but doesn't capture the data itself. See [data lineage information model](/dataplex/docs/about-data-lineage#information-model) and [Data Lineage API reference](/dataplex/docs/reference/data-lineage/rest) for details on what fields are included in the metadata.\n- Data lineage as part of Dataplex Universal Catalog offers VPC-SC support.\n- Dataplex Universal Catalog doesn't offer the ability to use Customer Managed Encryption Keys to protect the harvested lineage metadata.\n\nData lineage limitations\n------------------------\n\nWhen you select a node in the lineage graph, the node details side panel\nwill be empty when:\n\n1. the resources is located in another organization, or\n2. the user is not a member of the organization hosting the resource."]]