Ce document explique comment utiliser le magasin d'attributs du catalogue universel Dataplex.
Migrer de l'Attribute Store vers les tags et les conditions IAM
Pour migrer depuis Attribute Store, vous devez remplacer la fonctionnalité Attribute Store par des tags, des tags de stratégie et des conditions IAM.
Pour les ensembles de données et les tables BigQuery, procédez comme suit :
- Créez un tag qui réplique l'attribut Dataplex Universal Catalog. Pour en savoir plus, consultez Créer et définir un nouveau tag.
- Associez le tag à l'ensemble de données ou à la table BigQuery. Pour en savoir plus, consultez Associer des tags à un ensemble de données existant et Associer des tags à une table existante.
- Créez une condition IAM pour gérer l'accès à l'ensemble de données ou à la table en fonction du tag. Pour en savoir plus, consultez Contrôler l'accès avec les conditions IAM.
Pour les colonnes BigQuery, procédez comme suit :
- Créez un tag avec stratégie dans BigQuery qui réplique l'attribut du catalogue universel Dataplex.
- Définissez le tag avec stratégie sur la colonne.
- Utilisez le tag avec stratégie pour gérer l'accès à la colonne à l'aide du contrôle des accès au niveau des colonnes ou du masquage dynamique des données.
Pour en savoir plus, consultez Présentation du contrôle des accès au niveau des colonnes et Configurer le contrôle des accès au niveau des colonnes.
Présentation du magasin d'attributs
Le magasin d'attributs Dataplex Universal Catalog est une infrastructure extensible qui vous permet de spécifier des comportements liés aux règles sur les ressources associées. Les administrateurs Dataplex Universal Catalog peuvent utiliser l'Attribute Store pour définir la façon dont certaines données doivent être traitées, en associant des données à des attributs.
Avec le magasin d'attributs, vous pouvez ajouter plusieurs attributs à un objet, comme une colonne. Le magasin d'attributs fusionne les comportements de tous les attributs associés à un objet et les présente sous la forme d'une règle unique sur la ressource sous-jacente.
Vous pouvez définir des attributs pour les ensembles de données publiés. Les ensembles de données publiés font référence aux ensembles de données créés par Dataplex Universal Catalog à partir des tables découvertes dans un bucket.
Les comportements de règle suivants sont acceptés :
- Spécifications des ressources : spécifient l'accès à une ressource, telle qu'une table
- Spécifications de colonne : spécifient l'accès à une colonne d'une table BigQuery
Vous pouvez utiliser le magasin d'attributs pour définir une hiérarchie d'attributs appelée taxonomie. Dans une taxonomie, un attribut enfant hérite des spécifications de la hiérarchie des attributs parents. Les spécifications du parent et de l'enfant sont fusionnées dans une liste unifiée, qui est propagée à la ressource.
Vous pouvez utiliser le magasin d'attributs Dataplex Universal Catalog pour effectuer les opérations suivantes :
- créer des taxonomies ;
- Créez des attributs et organisez-les dans une hiérarchie.
- Associez un ou plusieurs attributs à des tables.
- Associez un ou plusieurs attributs à des colonnes.
Terminologie
Cette section décrit la terminologie utilisée dans ce document.
Taxonomie des attributs
Une taxonomie de données est une hiérarchie d'attributs. Dans une taxonomie, les attributs des nœuds parents permettent aux attributs situés en dessous (attributs enfants) d'hériter des spécifications de comportement des attributs parents et de les ajouter aux leurs.
Par exemple :
Si un attribut nommé PII
possède une spécification de ressource group-a@company.com
et qu'un attribut enfant PII
nommé Social Security numbers
possède une spécification de ressource group-b@company.com
, les spécifications de ressource appliquées aux règles auxquelles l'attribut Social Security numbers
est associé seront group-a@company.com
et group-b@company.com
.
Lorsque vous définissez un attribut, vous pouvez choisir s'il s'agit d'un attribut parent ou enfant. Lorsque vous définissez un attribut enfant, vous devez spécifier son attribut parent.
Spécifications des colonnes
Spécifications de comportement pour les colonnes. Elle spécifie les personnes ou les groupes qui ont accès en lecture aux colonnes. Si vous associez un attribut contenant une spécification de colonne à la colonne d'une table, un tag avec stratégie de colonne BigQuery est ajouté à cette colonne.
Spécifications des ressources
Autorisations accordées aux personnes ou aux groupes pour accéder aux ressources (tables). Si vous associez un attribut à une spécification de ressource, Dataplex Universal Catalog propage les rôles IAM aux utilisateurs spécifiés pour leur permettre d'accéder aux tables associées à l'attribut.
Avant de commencer
Limites
Dataplex Universal Catalog propage les règles de spécification de colonne en tant que tags avec stratégie BigQuery. BigQuery limite le nombre de tags avec stratégie à un par colonne. Si un tag de règle existe déjà sur une colonne, Dataplex Universal Catalog génère une erreur dans le journal de gouvernance de l'onglet Gérer.
Quotas
Voici les quotas et limites qui s'appliquent au magasin d'attributs Dataplex Universal Catalog :
Limite | Par défaut |
---|---|
Nombre maximal de taxonomies dans une région | 100 |
Nombre maximal d'attributs dans toutes les taxonomies d'une région | 10 000 |
Nombre maximal d'attributs pouvant être associés à une ressource (table) | 50 |
Nombre maximal d'attributs pouvant être associés à une colonne | 100 |
Profondeur maximale par arbre d'attributs dans une taxonomie d'attributs | 4 |
Rôles requis
Pour obtenir les autorisations nécessaires pour utiliser le magasin d'attributs Dataplex Universal Catalog, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
-
Gérer les taxonomies et les attributs :
Administrateur de taxonomies Dataplex (
roles/dataplex.taxonomyAdmin
) -
Affichez les liaisons associées aux ressources et aux attributs :
Lecteur de taxonomies Dataplex (
roles/dataplex.taxonomyViewer
) -
Créez et gérez des ressources de liaison dans un projet :
-
Administrateur de liaisons Dataplex (
roles/dataplex.bindingAdmin
) -
Administrateur Dataplex (
roles/dataplex.admin
sur la ressource Zone)
-
Administrateur de liaisons Dataplex (
-
Gérer les spécifications d'accès aux ressources et aux données :
Administrateur de sécurité Dataplex (
roles/dataplex.securityAdmin
)
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ces rôles prédéfinis contiennent les autorisations requises pour utiliser le magasin d'attributs du catalogue universel Dataplex. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour utiliser le magasin d'attributs Dataplex Universal Catalog :
-
Gérer les taxonomies et les attributs :
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Affichez les liaisons associées aux ressources et aux attributs :
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Créez et gérez des ressources de liaison dans un projet :
dataplex.dataattributebindings.*
-
Gérez les spécifications d'accès aux ressources et aux données :
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Exemples de cas d'utilisation
Prenons l'exemple d'une entreprise nommée ACME
qui dispose de trois types de données :
Red
données sensibles- Données
Green
restreintes, mais moins sensibles - Données non classées
L'administrateur Dataplex Universal Catalog de ACME
crée l'ensemble d'attributs suivant :
Attribut :
Red
- Spécifications de la colonne :
secrets_team@acme
avec autorisation de lecture - Spécifications des ressources :
secrets_team@acme
ettenured_employees@acme
avec autorisation de lecture
- Spécifications de la colonne :
Attribut :
Green
- Spécifications de la colonne :
full_time_employees@acme
avec autorisation de lecture - Spécifications des ressources :
full_time_employees@acme
avec autorisation de modification
- Spécifications de la colonne :
Les attributs Red
et Green
contrôlent le comportement d'accès aux ressources (tables) en fonction des attributs associés aux tables et à leurs colonnes.
Prenons l'exemple d'une table contenant les colonnes suivantes :
- ID
- Code postal
- Nom
- Adresse
- $Value
Cas d'utilisation 1 : Associer le même attribut à la table et à une colonne
Si vous associez l'attribut Red
à la table et à sa colonne Name, Dataplex Universal Catalog propage les règles suivantes :
- Les employés des groupes
secrets_team@acme
ettenured_employees@acme
peuvent lire la table, consulter ses métadonnées et l'interroger. - Seuls les employés du groupe
secrets_team@acme
peuvent interroger la colonne Name, car elle est également protégée par des spécifications de colonne.
Cas d'utilisation 2 : Combiner des attributs
Voici quelques exemples d'associations :
- Associez les attributs
Red
etGreen
à la table. - Associez les attributs
Red
etGreen
à la colonne Nom. - Associez l'attribut
Red
à la colonne $Value.
Dans ce cas, Dataplex Universal Catalog propage les règles suivantes :
- Les employés des groupes
secrets_team@acme
,tenured_employees@acme
etfull_time_employees@acme
peuvent accéder à la table. En effet, Dataplex Universal Catalog fusionne les spécifications de ressources des attributsRed
etGreen
. - Les employés des groupes
secrets_team@acme
etfull_time_employees@acme
peuvent accéder à la colonne Nom. En effet, Dataplex Universal Catalog fusionne les spécifications de colonne des attributsRed
etGreen
. - Seuls les employés de
secrets_team@acme
peuvent interroger la colonne $Value.
Cas d'utilisation 3 : Organiser les attributs dans une hiérarchie
Vous pouvez organiser les attributs dans une hiérarchie en spécifiant leurs sous-types. Considérez l'ensemble d'attributs suivant :
Attribut parent 1 :
Attribut : PII
- Spécifications des colonnes :
secrets_team@acme
- Spécifications des ressources :
secrets_team@acme
ettenured_employees@acme
Attribut enfant de PII
:
Attribut : Email
- Spécifications des colonnes :
email_comm@acme
- Spécifications des ressources :
email_comm@acme
Attribut parent 2 :
Attribut : Financial
- Spécifications des colonnes :
full_time_employees@acme
- Spécifications des ressources :
full_time_employees@acme
Voici quelques exemples d'associations :
- Associez les attributs
Email
etFinancial
à la table. - Associez les attributs
Email
etFinancial
à la colonne Nom. - Associez l'attribut
PII
à la colonne $Value.
Dans ce cas, Dataplex Universal Catalog propage les règles suivantes :
- Les employés des groupes
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
etemail_comm@acme
peuvent accéder à la table. En effet, Dataplex Universal Catalog fusionne les spécifications de ressources des attributsFinancial
etEmail
, et l'attributEmail
hérite des spécifications de l'attributPII
. - Les employés des groupes
secrets_team@acme
,email_comm@acme
etfull_time_employees@acme
peuvent accéder à la colonne Nom. En effet, Dataplex Universal Catalog fusionne les spécifications de colonne des attributsFinancial
etEmail
. - Seuls les employés de
secrets_team@acme
peuvent interroger la colonne $Value.
Configurer les attributs
Pour créer un attribut, vous devez d'abord créer une taxonomie, puis créer les attributs de données parents et enfants.
Créer une taxonomie d'attributs de données
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Cliquez sur Créer une taxonomie.
Saisissez le nom, l'ID et la description de la taxonomie.
Sélectionnez une région.
Cliquez sur Envoyer.
La nouvelle taxonomie s'affiche sur la page Taxonomies de données.
Créer un attribut parent
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Sur la page Taxonomies de données, cliquez sur la taxonomie dans laquelle vous souhaitez créer l'attribut parent.
Sur la page Détails de la taxonomie, cliquez sur Ajouter un attribut de données.
Sélectionnez Créer un attribut de données parent.
Saisissez un nom, un ID et une description pour l'attribut parent.
Facultatif : Configurez les spécifications des attributs.
Configurez les spécifications des ressources :
- Cliquez sur Gérer les autorisations pour Ressource.
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe ayant besoin d'accéder à la ressource.
- Sélectionnez les Rôles requis, puis cliquez sur Enregistrer.
- Cliquez sur Enregistrer.
Configurez les spécifications de colonne :
- Cliquez sur Gérer les autorisations pour Colonne.
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe qui a besoin d'accéder à la colonne.
- Sélectionnez les Rôles requis, puis cliquez sur Enregistrer.
- Cliquez sur Enregistrer.
Cliquez sur Créer.
Créer un attribut enfant
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Sur la page Taxonomies de données, cliquez sur la taxonomie dans laquelle vous souhaitez créer l'attribut enfant.
Sur la page Détails de la taxonomie, cliquez sur Ajouter un attribut de données.
Sélectionnez Créer un attribut de données enfant.
Sélectionnez un attribut de données parent pour l'attribut enfant que vous créez.
Saisissez un nom, un ID et une description pour l'attribut enfant.
Facultatif : Configurez les spécifications des attributs.
Configurez les spécifications des ressources :
- Cliquez sur Gérer les autorisations pour Ressource.
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe ayant besoin d'accéder à la ressource.
- Sélectionnez les Rôles requis, puis cliquez sur Enregistrer.
- Cliquez sur Enregistrer.
Configurez les spécifications de colonne :
- Cliquez sur Gérer les autorisations pour Colonne.
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe qui a besoin d'accéder à la colonne.
- Sélectionnez les Rôles requis, puis cliquez sur Enregistrer.
- Cliquez sur Enregistrer.
Cliquez sur Créer.
Mettre à jour les ressources du magasin d'attributs
Modifier les détails de la taxonomie
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Cliquez sur la taxonomie que vous souhaitez modifier.
Cliquez sur Modifier.
Modifiez le nom et la description de la taxonomie si nécessaire.
Cliquez sur Envoyer.
Modifier les détails d'un attribut
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Cliquez sur la taxonomie contenant l'attribut que vous souhaitez modifier.
Cliquez sur l'attribut que vous souhaitez modifier.
Pour modifier le nom et la description de l'attribut, cliquez sur Modifier.
- Si vous mettez à jour un attribut parent, vous pouvez le remplacer par un attribut enfant et inversement. Sélectionnez les options en conséquence.
- Modifiez le nom et la description de l'attribut si nécessaire.
- Cliquez sur Mettre à jour.
Pour mettre à jour les spécifications de ressource pour l'attribut, cliquez sur
Modifier pour Spécifications de ressource.Pour ajouter un principal, procédez comme suit :
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe qui a besoin d'accéder à la ressource.
- Sélectionnez les rôles requis.
- Cliquez sur Enregistrer.
Pour modifier un principal existant, procédez comme suit :
- Pour le compte principal que vous souhaitez modifier, cliquez sur Modifier.
- Sélectionnez les rôles requis.
- Cliquez sur Enregistrer.
Pour supprimer un principal existant, procédez comme suit :
- Sélectionnez le compte principal que vous souhaitez supprimer.
- Cliquez sur Supprimer.
Pour mettre à jour les spécifications de colonne de l'attribut, cliquez sur
Modifier pour Spécifications de colonne.Pour ajouter un principal, procédez comme suit :
- Cliquez sur Ajouter.
- Dans le champ Nouveaux comptes principaux, saisissez l'adresse e-mail d'une personne ou d'un groupe qui a besoin d'accéder à la colonne.
- Sélectionnez les rôles requis.
- Cliquez sur Enregistrer.
Pour modifier un principal existant, procédez comme suit :
- Pour le compte principal que vous souhaitez modifier, cliquez sur Modifier.
- Sélectionnez les rôles requis.
- Cliquez sur Enregistrer.
Pour supprimer un principal existant, procédez comme suit :
- Sélectionnez le compte principal que vous souhaitez supprimer.
- Cliquez sur Supprimer.
Associer des attributs à des ressources
Associer un attribut à une table
Dans la console Google Cloud , accédez à la page Attribute Store du catalogue universel Dataplex.
Cliquez sur la taxonomie contenant l'attribut.
Cliquez sur l'attribut auquel vous souhaitez associer un tableau.
Cliquez sur l'onglet Ressources.
Cliquez sur Ajouter des ressources.
Sélectionnez un tableau dans la liste.
Cliquez sur Sélectionner.
Associer un attribut à une colonne
Dans la console Google Cloud , accédez à la page Rechercher de Data Catalog.
Recherchez et sélectionnez la table pour laquelle vous souhaitez associer un attribut à une colonne.
Cliquez sur l'onglet Tags de colonne et de schéma.
Dans la colonne à laquelle vous souhaitez associer un attribut, dans Tags avec stratégie, cliquez sur
Ajouter.Sélectionnez la taxonomie qui contient l'attribut.
Sélectionnez l'attribut.
Cliquez sur Joindre.
Étapes suivantes
- En savoir plus sur la sécurité de Dataplex Universal Catalog
- En savoir plus sur la gestion des règles dans Dataplex Universal Catalog
- En savoir plus sur les rôles IAM de Dataplex Universal Catalog