La traçabilité des données affiche les relations entre les ressources de votre projet et les processus qui les ont créées. Vous pouvez afficher les informations sur la lignée des données sous la forme d'une visualisation graphique ou d'une vue de liste dans la console Google Cloud, ou les récupérer à partir de l'API Data Lineage sous la forme de données JSON.
La généalogie est capturée dans plusieurs projets. Lorsque vous affichez la lignée générée à partir de plusieurs projets, vous pouvez afficher les informations de lignée agrégées dans l'un des projets concernés.
Rôles et autorisations
Pour afficher des informations sur la traçabilité, demandez à votre administrateur de vous accorder les rôles de lecteur décrits dans la section Rôles de traçabilité des données prédéfinis. Vous devez avoir accès au projet dans lequel vous consultez la lignée et aux projets dans lesquels elle est enregistrée.
Data Catalog suit automatiquement les informations de traçabilité lorsque vous activez l'API Data Lineage. Vous n'avez pas besoin de rôles Administrateur ou Éditeur pour capturer la lignée de vos composants de données.
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès. Vous pouvez attribuer un rôle à un niveau de dossier ou d'organisation supérieur (voir la section Attribuer ou révoquer un rôle unique).
Activer la traçabilité des données
Activez la traçabilité des données pour commencer à suivre automatiquement les informations de traçabilité pour les systèmes compatibles. Vous devez activer l'API Data Lineage dans le projet dans lequel vous consultez la traçabilité et dans les projets dans lesquels elle est enregistrée. Pour en savoir plus, consultez la section Types de projets.
Pour capturer des informations sur la lignée:
-
Dans la console Google Cloud, sur la page Sélecteur de projet, sélectionnez le projet dans lequel vous souhaitez enregistrer la lignée.
Activez l'API Data Lineage.
- Répétez les étapes précédentes pour chaque projet dans lequel vous souhaitez enregistrer la lignée.
-
Dans le projet dans lequel vous affichez la traçabilité, activez l'API Data Lineage et l'API Data Catalog.
Afficher la traçabilité dans l'interface utilisateur de Dataplex
Vous pouvez afficher les informations sur la traçabilité des données dans l'interface utilisateur de Dataplex sous la forme d'un graphique ou d'une liste.
Les graphiques de la généalogie représentent les informations collectées par l'API Data Lineage pour une entrée spécifique.
La vue Liste de la lignée (Aperçu) affiche des informations détaillées sur la lignée des entités dans un seul tableau, y compris des informations sur la lignée des entités ayant de nombreuses connexions.
Pour afficher la lignée, procédez comme suit:
Ouvrez la page de recherche Dataplex et recherchez l'élément pour lequel vous souhaitez afficher des informations sur la lignée.
Ouvrir la page de recherche Dataplex
Pour en savoir plus, consultez Rechercher des éléments de données.Sur la page d'informations sur l'entrée, sélectionnez l'onglet Lignée.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.
Afficher la traçabilité dans l'interface utilisateur de BigQuery
Vous pouvez afficher les informations sur la lignée des données dans l'UI BigQuery sous la forme d'un graphique ou d'une liste (Aperçu).
Pour afficher la lignée, procédez comme suit:
- Dans la console Google Cloud, accédez à la page BigQuery.
Ouvrez la table pour laquelle vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.
Afficher la traçabilité dans l'interface utilisateur de Vertex AI
Des systèmes tels que Vertex AI Pipelines génèrent des données de lignée pour les modèles et les ensembles de données Vertex AI. Vous pouvez afficher les informations sur la traçabilité des données dans l'interface utilisateur de Vertex AI sous forme de graphique ou de liste (Aperçu).
Afficher la généalogie d'un ensemble de données géré dans Vertex AI
Pour afficher la lignée d'un ensemble de données, procédez comme suit:
- Dans la console Google Cloud, accédez à la page Ensembles de données.
Cliquez sur l'ensemble de données pour lequel vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.
Afficher la généalogie d'un modèle dans Vertex AI
Pour afficher la lignée d'un modèle, procédez comme suit:
Dans la console Google Cloud, accédez à la page Registre de modèles.
Cliquez sur le modèle pour lequel vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.
Étape suivante
Suivez la lignée des données pour une copie de table BigQuery et des tâches de requête.
En savoir plus sur le modèle d'informations sur la traçabilité des données