Gérer les glossaires d'entreprise dans Data Catalog

Ce document décrit comment créer et utiliser du contenu de glossaire d'entreprise dans Dataplex Universal Catalog avec Data Catalog.

Le glossaire d'entreprise permet de gérer et de conserver en un seul endroit les termes et définitions liés à l'activité de l'entreprise. Il vous permet d'associer des termes aux colonnes des entrées de données cataloguées.

Vous pouvez utiliser le glossaire d'entreprise Dataplex Universal Catalog pour effectuer les opérations suivantes :

  • Créez et gérez des glossaires, des catégories et des termes d'entreprise.
  • Utilisez des catégories pour représenter des structures hiérarchiques de catégories et de termes.
  • Établissez des relations entre les termes en tant que synonymes ou termes associés.
  • Associez des termes aux colonnes de saisie de données.
  • Parcourez et filtrez les termes du glossaire d'entreprise.
  • Affichez les termes et les entrées de données associés à un terme donné.
  • Recherchez les entrées de données taguées avec un terme spécifique.
  • Affichez les termes associés à une entrée de données donnée.

Terminologie

Cette section décrit la terminologie utilisée dans ce document.

Le glossaire d'entreprise

Le glossaire d'entreprise est un dépôt qui fournit des vocabulaires appropriés et régit les termes commerciaux d'une entreprise, ainsi que les définitions de termes associées et les relations entre les termes. Il permet de gérer et de conserver les termes commerciaux et leurs définitions de manière centralisée. Un glossaire d'entreprise présente la propriété suivante dans la console :

  • Présentation : description en texte enrichi de l'objectif et du contenu du glossaire d'entreprise.

Catégorie

Une catégorie est définie dans un glossaire d'entreprise. Elle vous permet d'organiser et de structurer différentes catégories et différents termes. Vous pouvez imbriquer des catégories sur trois niveaux maximum. Voici les propriétés d'une catégorie :

  • Catégorie : relation utilisée pour établir le conteneur de la catégorie actuelle, le cas échéant.
  • Description : définition métier de la catégorie au format texte enrichi.
  • Responsable des données : indique la personne chargée de gérer la catégorie. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations associées à la catégorie.

Terme

Un terme est défini dans un glossaire d'entreprise, soit directement dans le glossaire, soit dans une catégorie du glossaire. Il décrit un concept utilisé dans une branche d'activité spécifique au sein d'une entreprise. Un terme présente les propriétés suivantes dans la console :

  • Catégorie : relation utilisée pour établir le conteneur du terme actuel, le cas échéant.
  • Description : définition métier du terme au format texte enrichi.
  • Responsable des données : spécifie la personne chargée de la gestion du terme. Il s'agit d'une propriété descriptive qui n'a aucune incidence sur les autorisations associées au terme.

Vous pouvez associer des termes aux colonnes d'une entrée de données pour indiquer que ces colonnes sont décrites par ces termes.

Synonyme

Un synonyme est une relation utilisée pour indiquer une similarité ou une équivalence sémantique entre deux termes différents. Il est utilisé lorsque deux termes semblables sont définis par différentes équipes dans différents glossaires. Par exemple, earnings et income.

Un terme associé est une relation utilisée pour indiquer que deux termes sont sémantiquement liés, mais différents. Par exemple, profit et income.

Limites

  • L'importation groupée de termes dans un glossaire d'entreprise n'est pas acceptée.
  • La fonctionnalité de glossaire d'entreprise n'est disponible que dans la console Google Cloud .
  • Lorsque vous recherchez des entrées de données sur la page Recherche du catalogue universel Dataplex, les résultats incluent les entrées de données dont l'un des termes associés correspond au terme utilisé pour la recherche. Toutefois, la référence au terme correspondant n'est pas affichée dans le résultat de recherche.
  • Les régions BigQuery Omni ne sont pas compatibles. Vous ne pouvez pas créer de contenu de glossaire d'entreprise ni associer de termes à des entrées de données dans ces régions.
  • Lorsque vous utilisez le glossaire d'entreprise dans Data Catalog, vous ne pouvez pas associer de termes du glossaire d'entreprise aux colonnes des entrées du catalogue universel.

Rôles et autorisations requis

Pour obtenir les autorisations nécessaires pour créer et gérer des glossaires, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :

Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Ces rôles prédéfinis contiennent les autorisations requises pour créer et gérer des glossaires. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Les autorisations suivantes sont requises pour créer et gérer des glossaires :

  • Accès complet aux glossaires, aux catégories et aux termes :
    • datacatalog.entries.*
    • datacatalog.relationships.*
  • Lire des glossaires, des catégories et des termes, créer des pièces jointes entre des termes, et créer des pièces jointes entre des termes et des entrées de données :
    • datacatalog.entries.get
    • datacatalog.entries.list
    • datacatalog.relationships.*
  • Accès en lecture seule aux glossaires, aux catégories et aux termes :
    • datacatalog.entries.get
    • datacatalog.entries.list
    • datacatalog.entryGroups.get
    • datacatalog.relationships.list
    • resourcemanager.projects.list
    • resourcemanager.projects.get
  • Créer ou supprimer des glossaires : datacatalog.entryGroups.create

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Pour en savoir plus, consultez Rôles prédéfinis pour Data Catalog.

Créer et gérer des glossaires d'entreprise

Les sections suivantes expliquent comment créer, afficher, modifier et supprimer un glossaire d'entreprise.

Créer un glossaire d'entreprise

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Cliquez sur Créer un glossaire d'entreprise.

  3. Sur la page Créer un glossaire d'entreprise, spécifiez un nom, un emplacement et une description pour le glossaire d'entreprise.

    Les champs "Nom" et "Emplacement" sont obligatoires. Vous ne pouvez pas modifier l'emplacement après avoir créé le glossaire.

  4. Cliquez sur Créer.

    Le glossaire est créé dans le projet actuel et la page du glossaire s'affiche.

Afficher la liste des glossaires disponibles

  • Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

    Le volet Mes glossaires affiche tous les glossaires de l'organisation que vous êtes autorisé à consulter, ainsi que leurs descriptions et les codes temporels de leur dernière modification.

Modifier un glossaire

Vous pouvez modifier le nom et la description d'un glossaire.

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Cliquez sur le glossaire que vous souhaitez modifier.

    • Pour modifier le nom, cliquez sur  Modifier, saisissez un nouveau nom, puis cliquez sur Enregistrer.

    • Pour modifier la description, cliquez sur Modifier la description, saisissez-en une nouvelle, puis cliquez sur Enregistrer.

Supprimer un glossaire

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Cliquez sur le glossaire que vous souhaitez supprimer.

  3. Cliquez sur Supprimer.

    Pour confirmer votre action, saisissez le nom du glossaire, puis cliquez sur Confirmer.

Créer et gérer des catégories

Les sections suivantes expliquent comment créer, afficher, modifier et supprimer des catégories.

Créer une catégorie dans un glossaire

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Sélectionnez le glossaire dans lequel vous souhaitez créer une catégorie, puis cliquez sur Créer une catégorie.

  3. Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.

  4. Cliquez sur Créer.

    La page des détails de la catégorie s'ouvre.

Créer une catégorie dans une catégorie

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire dans lequel vous souhaitez créer une catégorie.

  3. Sélectionnez la catégorie parente dans laquelle vous souhaitez créer une autre catégorie, puis cliquez sur Créer une catégorie. Vous pouvez imbriquer une catégorie sur un maximum de trois niveaux.

  4. Sur la page Créer une catégorie, saisissez un nom et une description pour la catégorie.

  5. Cliquez sur Créer.

    La page des détails de la catégorie s'ouvre.

Afficher la liste des catégories disponibles

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Pour afficher la liste des catégories disponibles dans un glossaire, développez-le.

  3. Pour afficher la liste des catégories imbriquées disponibles, développez la catégorie.

Modifier une catégorie

Vous pouvez modifier le nom, la description, le responsable des données et la catégorie parente de la catégorie actuelle.

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire et cliquez sur la catégorie que vous souhaitez modifier.

    1. Pour modifier le nom, cliquez sur  Modifier, puis saisissez un nouveau nom.

    2. Pour modifier la description, cliquez sur Modifier la description, puis saisissez-en une nouvelle.

    3. Pour modifier la liste des responsables des données, cliquez sur Modifier à côté de Responsable, fournissez une liste d'adresses e-mail de responsables des données, puis cliquez sur Enregistrer.

    4. Pour modifier la catégorie, cliquez sur Modifier à côté de Catégorie.

      • Pour modifier la catégorie parente, saisissez le nom d'une nouvelle catégorie parente issue du glossaire actuel dans le champ Sélectionnez une catégorie, puis sélectionnez-la.

      • Pour supprimer la catégorie actuelle, sélectionnez ---Aucune--- dans le champ Sélectionnez une catégorie.

      Cliquez sur Enregistrer.

Supprimer une catégorie

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire, puis cliquez sur la catégorie que vous souhaitez supprimer définitivement.

    Un avertissement s'affiche pour indiquer que la suppression est irréversible et que tous les termes et catégories de la catégorie actuelle seront déplacés au niveau supérieur.

    Pour confirmer la suppression, saisissez le nom de la catégorie, puis cliquez sur Confirmer.

Créer et gérer des conditions

Les sections suivantes expliquent comment créer, afficher, accéder à un terme, le modifier et le supprimer.

Créer un terme

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Sélectionnez le glossaire dans lequel vous souhaitez créer un terme, puis cliquez sur Créer un terme.

  3. Sur la page Créer un terme, saisissez un nom et une description pour le terme.

  4. Cliquez sur Créer.

    La page des détails du terme s'ouvre.

Afficher la liste des termes disponibles

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Pour afficher la liste des termes disponibles dans un glossaire, développez-le.

Accéder aux détails d'un terme

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Pour afficher la liste des termes disponibles dans un glossaire, développez-le.

  3. Cliquez sur un terme.

    La page de détails du terme affiche son nom, sa description, les termes associés, les synonymes et les entrées associées.

Modifier un terme

Vous pouvez modifier le nom, la description et le responsable des données d'un terme.

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire et cliquez sur le terme que vous souhaitez modifier.

    1. Pour modifier le nom, cliquez sur  Modifier, puis saisissez un nouveau nom.

    2. Pour modifier la description, cliquez sur Modifier la description, puis saisissez-en une nouvelle.

    3. Pour modifier la liste des responsables des données, cliquez sur Modifier à côté de Responsable, fournissez une liste d'adresses e-mail de responsables des données, puis cliquez sur Enregistrer.

    4. Pour modifier la catégorie, cliquez sur Modifier à côté de Catégorie.

      • Pour modifier la catégorie parente, saisissez le nom d'une nouvelle catégorie parente issue du glossaire actuel dans le champ Sélectionnez une catégorie, puis sélectionnez-la.

      • Pour supprimer la catégorie actuelle, sélectionnez ---Aucune--- dans le champ Sélectionnez une catégorie.

      Cliquez sur Enregistrer.

Supprimer un terme

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire et cliquez sur le terme que vous souhaitez supprimer définitivement.

    Un avertissement s'affiche, indiquant que la suppression est irréversible et que toutes les relations associées au terme seront supprimées.

    Pour confirmer la suppression, saisissez le nom du terme, puis cliquez sur Confirmer.

Vous pouvez ajouter des relations entre les termes en les marquant comme termes associés ou synonymes. Les listes de termes associés et de synonymes s'affichent sur la page des détails du terme.

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire, puis cliquez sur le terme auquel vous souhaitez associer un synonyme ou un terme associé.

  3. Cliquez sur Modifier pour Termes associés ou Synonymes.

  4. Dans le champ Rechercher des termes du glossaire, saisissez le terme que vous souhaitez associer, puis sélectionnez-le dans les résultats de recherche.

    Le terme est associé immédiatement lorsque vous le sélectionnez.

  5. Cliquez sur OK.

  1. Dans la console Google Cloud , accédez à la page Glossaires de Dataplex Universal Catalog.

    Accéder à Glossaires

  2. Développez le glossaire, puis cliquez sur le terme dont vous souhaitez supprimer un synonyme ou un terme associé.

  3. Pour supprimer un terme associé :

    1. Cliquez sur Modifier à côté de Termes associés.

    2. Pour le terme associé que vous souhaitez supprimer, cliquez sur Supprimer . La pièce jointe est supprimée immédiatement.

    3. Cliquez sur OK.

  4. Pour supprimer un synonyme, procédez comme suit :

    1. Cliquez sur Modifier à côté de Synonymes.

    2. Pour le synonyme que vous souhaitez supprimer, cliquez sur Supprimer. La pièce jointe est supprimée immédiatement.

    3. Cliquez sur OK.

Gérer les termes au niveau des colonnes

Vous pouvez associer des termes aux colonnes des entrées Data Catalog (obsolète) qui comportent des schémas (par exemple, des tables et des ensembles de fichiers) pour fournir plus de contexte sur les données des colonnes.

Associer des termes à des colonnes

  1. Accédez à une entrée Data Catalog qui comporte un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Conditions commerciales, cliquez sur Ajouter pour le champ auquel vous souhaitez associer des conditions .

  4. Dans le champ Recherche de termes, saisissez le nom du terme et sélectionnez-le dans les résultats de recherche. Vous pouvez sélectionner plusieurs termes.

  5. Cliquez sur Associer des conditions d'utilisation.

Afficher les détails des termes associés aux colonnes

  1. Accédez à une entrée Data Catalog qui comporte un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Termes commerciaux, cliquez sur un terme pour afficher sa description. Vous pouvez également supprimer le terme ou accéder à la page d'informations du terme à l'aide des options de cette fenêtre.

Supprimer des termes associés à des colonnes

  1. Accédez à une entrée Data Catalog qui comporte un schéma.

  2. Cliquez sur l'onglet Schéma.

  3. Dans la colonne Conditions commerciales, cliquez sur Supprimer pour la condition que vous souhaitez supprimer.

    Vous pouvez également supprimer le terme associé en cliquant dessus, puis sur Supprimer le terme métier > Confirmer.

Localiser des glossaires et des termes

Pour parcourir le contenu de votre glossaire d'entreprise, utilisez l'arborescence des glossaires et des termes sur la page Glossaires du catalogue universel Dataplex.

Vous pouvez utiliser la barre de filtres sur la page Glossaires de Dataplex Universal Catalog pour trouver des catégories par nom à afficher ou des termes selon un critère. Le filtre renvoie les éléments dont les attributs correspondent à la requête de filtre. Vous pouvez également utiliser les qualificatifs suivants :

  • parent:VALUE : met en évidence les termes dont le nom ou la description du glossaire parent correspondent à VALUE. Par exemple, parent:Finance met en évidence les termes associés au nom ou à la description du glossaire parent contenant l'expression Finance.

  • contact:VALUE : met en évidence les termes pour lesquels le responsable des données est VALUE. Par exemple, contact:johndoe@company.org met en évidence les entrées associées à des termes dont le responsable des données correspond à johndoe@company.org.

  • synonym:VALUE : met en évidence les termes qui comportent au moins un synonyme dont le nom ou la description correspondent à VALUE. Par exemple, synonym:interest met en évidence les termes associés dont le nom ou la description contiennent l'expression interest.

  • related_to:VALUE : met en évidence les termes qui comportent au moins un terme associé dont le nom ou la description correspondent à VALUE. Par exemple, related_to:discounting met en évidence les termes associés dont le nom ou la description contiennent l'expression discounting.

Rechercher des entrées de données à l'aide de termes

Vous pouvez utiliser le contenu du glossaire d'entreprise Dataplex Universal Catalog lorsque vous recherchez des entrées sur la page Recherche de Dataplex Universal Catalog.

Les scénarios de recherche suivants sont acceptés :

  • Recherche simple : la requête de recherche est spécifiée sous forme de texte libre qui capture le nom ou la description du terme. Les résultats de recherche incluent les entrées associées à un terme dont le nom ou la description correspondent à la requête de recherche. Ces résultats s'affichent à côté de ceux obtenus par d'autres méthodes de correspondance qui ne sont pas liées au contenu du glossaire d'entreprise.

  • Rechercher à l'aide de qualificatifs : la requête de recherche est spécifiée sous la forme term:VALUE. Le résultat de la recherche inclut les entrées associées à un terme pour lequel une sous-chaîne du nom, de la description ou du responsable des données correspond à VALUE.

Étapes suivantes