La traçabilité des données affiche les relations entre les ressources de votre projet et les processus qui les ont créées.
Vous pouvez afficher des informations sur la lignée des données dans la console Google Cloud sous les formes suivantes :
- Graphique de traçabilité : affiche la traçabilité en amont ou en aval d'une seule entrée racine. Pour en savoir plus, consultez Graphique de traçabilité.
- Visualisation du chemin de traçabilité (Aperçu) : affiche les liens de traçabilité entre deux ressources sélectionnées. Pour en savoir plus, consultez Visualiser le chemin de traçabilité.
- Vue en liste de la traçabilité (Aperçu) : affiche des informations détaillées sur la traçabilité des ressources dans un tableau unique, y compris des informations sur la traçabilité des ressources comportant de nombreuses connexions. Pour en savoir plus, consultez Vue Liste de la traçabilité.
Vous pouvez également récupérer des informations sur la lignée à partir de l'API Data Lineage sous forme de données JSON.
La provenance est capturée dans tous les projets. Lorsque vous consultez la lignée générée à partir de plusieurs projets, vous pouvez afficher les informations agrégées sur la lignée dans l'un des projets concernés.
Selon le volume de données traitées, il faut un certain temps pour que la traçabilité des données affiche un graphique. La plupart des tâches prennent trois heures, mais certaines peuvent prendre jusqu'à 24 heures.
Rôles et autorisations
Pour afficher les informations sur la traçabilité, demandez à votre administrateur de vous accorder des rôles de lecteur, comme décrit dans Rôles prédéfinis pour la traçabilité des données. Vous devez y avoir accès à la fois dans le projet dans lequel vous consultez la traçabilité et dans les projets dans lesquels elle est enregistrée.
Dataplex Universal Catalog suit automatiquement les informations de traçabilité lorsque vous activez l'API Data Lineage. Vous n'avez besoin d'aucun rôle d'administrateur ni d'éditeur pour capturer la lignée de vos composants de données.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer les accès. Vous pouvez attribuer un rôle à un niveau supérieur de dossier ou d'organisation (consultez Attribuer ou révoquer un seul rôle).
Activer la traçabilité des données
Activez la traçabilité des données pour commencer à suivre automatiquement les informations de traçabilité pour les systèmes compatibles. Vous devez activer l'API Data Lineage à la fois dans le projet où vous consultez la traçabilité et dans les projets où elle est enregistrée. Pour en savoir plus, consultez Types de projets.
Pour capturer les informations sur la lignée, procédez comme suit :
-
Dans la console Google Cloud , sur la page Sélecteur de projet, sélectionnez le projet dans lequel vous souhaitez enregistrer la provenance.
Activez l'API Data Lineage.
- Répétez les étapes précédentes pour chaque projet dans lequel vous souhaitez enregistrer la provenance.
-
Dans le projet où vous consultez la traçabilité, activez l'API Data Lineage et l'API Dataplex.
Afficher la traçabilité dans Dataplex Universal Catalog
Vous pouvez afficher les informations sur la traçabilité des données dans l'interface Web Dataplex Universal Catalog.
Pour afficher la lignée, procédez comme suit :
Dans la console Google Cloud , accédez à la page Rechercher de Dataplex Universal Catalog.
Sélectionnez Dataplex Universal Catalog comme mode de recherche.
Recherchez l'entrée pour laquelle vous souhaitez afficher des informations sur la lignée. Pour en savoir plus, consultez Rechercher des ressources dans Dataplex Universal Catalog.
Sur la page d'informations sur l'entrée, sélectionnez l'onglet Lignée.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations sur la lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur Liste, puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la traçabilité dans BigQuery
Vous pouvez afficher des informations sur la provenance des données dans l'interface Web BigQuery.
Pour afficher la lignée, procédez comme suit :
- Dans la console Google Cloud , accédez à la page BigQuery.
Ouvrez le tableau pour lequel vous souhaitez afficher la lignée de données.
Cliquez sur l'onglet Traçabilité.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations sur la lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur Liste, puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la traçabilité dans Vertex AI
Des systèmes tels que Vertex AI Pipelines génèrent des données de traçabilité pour les modèles et les ensembles de données Vertex AI. Vous pouvez afficher des informations sur la traçabilité des données dans l'interface Web de l'UI Vertex AI.
Afficher la traçabilité d'un ensemble de données géré dans Vertex AI
Pour afficher la lignée d'un ensemble de données, procédez comme suit :
- Dans la console Google Cloud , accédez à la page Ensembles de données.
Cliquez sur l'ensemble de données pour lequel vous souhaitez afficher la provenance des données.
Cliquez sur l'onglet Traçabilité.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations sur la lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur Liste, puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la traçabilité d'un modèle dans Vertex AI
Pour afficher la lignée d'un modèle, procédez comme suit :
Dans la console Google Cloud , accédez à la page Model Registry.
Cliquez sur le modèle pour lequel vous souhaitez afficher l'origine des données.
Cliquez sur l'onglet Traçabilité.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations sur la lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur Liste, puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Étapes suivantes
Suivez la traçabilité des données pour les jobs de copie et de requête d'une table BigQuery.
En savoir plus sur le modèle d'informations sur la traçabilité des données