Questo documento descrive come utilizzare l'archivio degli attributi del catalogo universale di Dataplex.
Migrazione da Attribute Store a tag e condizioni IAM
Per eseguire la migrazione da Attribute Store, sostituisci la funzionalità di Attribute Store con tag, tag di policy e condizioni IAM.
Per i set di dati e le tabelle BigQuery:
- Crea un tag che replichi l'attributo Dataplex Universal Catalog. Per maggiori informazioni, vedi Creare e definire un nuovo tag.
- Collega il tag al set di dati o alla tabella BigQuery. Per ulteriori informazioni, consulta Allegare tag a un set di dati esistente e Allegare tag a una tabella esistente.
- Crea una condizione IAM per gestire l'accesso al set di dati o alla tabella in base al tag. Per saperne di più, consulta Controllare l'accesso con le condizioni IAM.
Per le colonne BigQuery:
- Crea un tag di criteri in BigQuery che replichi l'attributo Dataplex Universal Catalog.
- Imposta il tag di criteri sulla colonna.
- Utilizza il tag di criteri per gestire l'accesso alla colonna utilizzando controllo dell'accesso a livello di colonna o il mascheramento dinamico dei dati.
Per maggiori informazioni, consulta Introduzione al controllo dell'accesso a livello di colonna e Configurare il controllo dell'accesso a livello di colonna.
Panoramica dell'archivio attributi
L'archivio degli attributi del catalogo universale Dataplex è un'infrastruttura estensibile che ti consente di specificare i comportamenti correlati alle norme sulle risorse associate. Gli amministratori di Dataplex Universal Catalog possono utilizzare Attribute Store per definire il modo in cui determinati dati devono essere trattati, associandoli agli attributi.
Utilizzando l'archivio degli attributi, puoi aggiungere più attributi a un oggetto, ad esempio una colonna. L'archivio degli attributi unisce i comportamenti di tutti gli attributi associati a un oggetto e li presenta come un'unica norma nella risorsa sottostante.
Puoi impostare gli attributi per i set di dati pubblicati. I set di dati pubblicati si riferiscono ai set di dati creati da Dataplex Universal Catalog dalle tabelle rilevate in un asset bucket.
Sono supportati i seguenti comportamenti delle norme:
- Specifiche delle risorse: specifica l'accesso a una risorsa, ad esempio una tabella
- Specifiche della colonna: specifica l'accesso a una colonna in una tabella BigQuery
Puoi utilizzare l'archivio degli attributi per definire una gerarchia di attributi chiamata tassonomia. In una tassonomia, un attributo secondario eredita le specifiche dalla gerarchia degli attributi principali. Le specifiche della risorsa padre e della risorsa figlio vengono unite in un elenco unificato, che viene propagato alla risorsa.
Puoi utilizzare l'archivio degli attributi di Dataplex Universal Catalog per:
- Crea tassonomie.
- Crea attributi e organizzali in una gerarchia.
- Associa uno o più attributi alle tabelle.
- Associa uno o più attributi alle colonne.
Terminologia
Questa sezione descrive la terminologia utilizzata in questo documento.
Tassonomia degli attributi
Una tassonomia dei dati è una gerarchia di attributi. In una tassonomia, gli attributi nei nodi principali consentono agli attributi sottostanti (attributi secondari) di ereditare e aggiungere le specifiche di comportamento degli attributi principali ai propri.
Ad esempio:
Se un attributo denominato PII
ha una specifica di risorsa group-a@company.com
e un attributo secondario di PII
denominato Social Security numbers
ha una specifica di risorsa
group-b@company.com
, le specifiche di risorsa applicate ai
criteri in cui è associato l'attributo Social Security numbers
saranno
group-a@company.com
e group-b@company.com
.
Quando definisci un attributo, puoi scegliere se si tratta di un attributo principale o secondario. Quando definisci un attributo secondario, devi specificare l'attributo principale.
Specifiche delle colonne
Le specifiche di comportamento per le colonne. Specifica le persone o i gruppi che hanno accesso in lettura alle colonne. Se associ un attributo contenente una specifica di colonna alla colonna di una tabella, viene aggiunto un tag di policy della colonna BigQuery a quella colonna.
Specifiche delle risorse
Le autorizzazioni per persone o gruppi di accedere alle risorse (tabelle). Se associ un attributo alla specifica della risorsa, Dataplex Universal Catalog propaga i ruoli IAM agli utenti specificati per accedere alle tabelle associate all'attributo.
Prima di iniziare
Limitazioni
Dataplex Universal Catalog propaga i criteri di specifica delle colonne come tag di criteri BigQuery. BigQuery ha una limitazione di un tag di criteri per colonna. Se un tag di criteri esiste già in una colonna, Dataplex Universal Catalog genera un errore nel log Governance nella scheda Gestisci.
Quote
Di seguito sono riportate le quote e i limiti applicabili all'archivio attributi di Dataplex Universal Catalog:
Limite | Predefinito |
---|---|
Numero massimo di classificazioni in una regione | 100 |
Numero massimo di attributi in tutte le classificazioni in una regione | 10.000 |
Numero massimo di attributi che possono essere associati a una risorsa (tabella) | 50 |
Numero massimo di attributi che possono essere associati a una colonna | 100 |
Profondità massima per albero di attributi dei dati in una tassonomia degli attributi | 4 |
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per utilizzare l'archivio degli attributi di Dataplex Universal Catalog, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
-
Gestisci le classificazioni e gli attributi:
Dataplex Taxonomy Admin (
roles/dataplex.taxonomyAdmin
) -
Visualizza le associazioni associate a risorse e attributi:
Dataplex Taxonomy Viewer (
roles/dataplex.taxonomyViewer
) -
Crea e gestisci le risorse di binding in un progetto:
-
Dataplex Binding Admin (
roles/dataplex.bindingAdmin
) -
Dataplex Admin (
roles/dataplex.admin
sulla risorsa Zona)
-
Dataplex Binding Admin (
-
Gestisci le specifiche di accesso a risorse e dati:
Dataplex Security Admin (
roles/dataplex.securityAdmin
)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per utilizzare l'archivio degli attributi di Dataplex Universal Catalog. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per utilizzare l'archivio degli attributi di Dataplex Universal Catalog sono necessarie le seguenti autorizzazioni:
-
Gestisci tassonomie e attributi:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Visualizza i binding associati a risorse e attributi:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Crea e gestisci le risorse di binding in un progetto:
dataplex.dataattributebindings.*
-
Gestisci le specifiche di accesso a risorse e dati:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Esempi di casi d'uso
Considera un'azienda di nome ACME
che dispone di tre tipi di dati:
Red
dati sensibili- Dati
Green
con restrizioni, ma meno sensibili - Dati senza categoria
L'amministratore di Dataplex Universal Catalog di ACME
crea il seguente insieme di
attributi:
Attributo:
Red
- Specifiche della colonna:
secrets_team@acme
con autorizzazione di lettura - Specifiche delle risorse:
secrets_team@acme
etenured_employees@acme
con autorizzazione di lettura
- Specifiche della colonna:
Attributo:
Green
- Specifiche della colonna:
full_time_employees@acme
con autorizzazione di lettura - Specifiche delle risorse:
full_time_employees@acme
con autorizzazione di modifica
- Specifiche della colonna:
Gli attributi Red
e Green
controllano il comportamento di accesso alle risorse
(tabelle) a seconda degli attributi associati alle tabelle e alle relative colonne.
Considera una tabella con le seguenti colonne:
- ID
- Codice postale
- Nome
- Indirizzo
- $Value
Caso d'uso 1: associa lo stesso attributo alla tabella e a una colonna
Se associ l'attributo Red
alla tabella e alla relativa colonna Name,
Dataplex Universal Catalog propaga i seguenti criteri:
- I dipendenti in
secrets_team@acme
etenured_employees@acme
possono leggere la tabella, visualizzarne i metadati ed eseguire query. - Solo i dipendenti di
secrets_team@acme
possono eseguire query sulla colonna Nome, in quanto è ulteriormente protetta dalle specifiche delle colonne.
Caso d'uso 2: combinare gli attributi
Considera le seguenti associazioni:
- Associa gli attributi
Red
eGreen
alla tabella. - Associa gli attributi
Red
eGreen
alla colonna Nome. - Associa l'attributo
Red
alla colonna $Value.
In questo caso, Dataplex Universal Catalog propaga i seguenti criteri:
- I dipendenti di
secrets_team@acme
,tenured_employees@acme
efull_time_employees@acme
possono accedere alla tabella. Questo perché Dataplex Universal Catalog unisce le specifiche delle risorse degli attributiRed
eGreen
. - I dipendenti di
secrets_team@acme
efull_time_employees@acme
possono accedere alla colonna Nome. Questo perché Dataplex Universal Catalog unisce le specifiche delle colonne degli attributiRed
eGreen
. - Solo i dipendenti di
secrets_team@acme
possono eseguire query sulla colonna $Value.
Caso d'uso 3: organizzare gli attributi in una gerarchia
Puoi organizzare gli attributi in una gerarchia specificando i sottotipi di attributi. Considera il seguente insieme di attributi:
Attributo principale 1:
Attributo: PII
- Specifiche delle colonne:
secrets_team@acme
- Specifiche delle risorse:
secrets_team@acme
etenured_employees@acme
Attributo secondario di PII
:
Attributo: Email
- Specifiche delle colonne:
email_comm@acme
- Specifiche delle risorse:
email_comm@acme
Attributo principale 2:
Attributo: Financial
- Specifiche delle colonne:
full_time_employees@acme
- Specifiche delle risorse:
full_time_employees@acme
Considera le seguenti associazioni:
- Associa gli attributi
Email
eFinancial
alla tabella. - Associa gli attributi
Email
eFinancial
alla colonna Nome. - Associa l'attributo
PII
alla colonna $Value.
In questo caso, Dataplex Universal Catalog propaga i seguenti criteri:
- I dipendenti di
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
eemail_comm@acme
possono accedere alla tabella. Questo perché Dataplex Universal Catalog unisce le specifiche delle risorse degli attributiFinancial
eEmail
e l'attributoEmail
eredita le specifiche dell'attributoPII
. - I dipendenti in
secrets_team@acme
,email_comm@acme
,full_time_employees@acme
possono accedere alla colonna Nome. Questo perché Dataplex Universal Catalog unisce le specifiche delle colonne degli attributiFinancial
eEmail
. - Solo i dipendenti di
secrets_team@acme
possono eseguire query sulla colonna $Value.
Configurare gli attributi
Per creare un attributo, devi prima creare una tassonomia, quindi creare gli attributi dei dati principali e secondari.
Crea una tassonomia degli attributi dei dati
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Fai clic su Crea tassonomia.
Inserisci Nome tassonomia, ID e Descrizione.
Seleziona una regione.
Fai clic su Invia.
La nuova tassonomia viene visualizzata nella pagina Tassonomie dei dati.
Crea un attributo principale
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Nella pagina Tassonomie dei dati, fai clic sulla tassonomia in cui vuoi creare l'attributo principale.
Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.
Seleziona Crea attributo dei dati padre.
Inserisci un nome, un ID e una descrizione per l'attributo principale.
(Facoltativo) Configura le specifiche degli attributi.
Configura le specifiche delle risorse:
- Fai clic su Gestisci autorizzazioni per Risorsa.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
- Seleziona i ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Configura le specifiche delle colonne:
- Fai clic su Gestisci autorizzazioni per Colonna.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
- Seleziona i ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Fai clic su Crea.
Crea un attributo figlio
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Nella pagina Tassonomie dei dati, fai clic sulla tassonomia in cui vuoi creare l'attributo secondario.
Nella pagina Dettagli tassonomia, fai clic su Aggiungi attributo dati.
Seleziona Crea attributo dei dati figlio.
Seleziona un attributo dei dati genitore per l'attributo figlio che stai creando.
Inserisci un nome, un ID e una descrizione per l'attributo secondario.
(Facoltativo) Configura le specifiche degli attributi.
Configura le specifiche delle risorse:
- Fai clic su Gestisci autorizzazioni per Risorsa.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
- Seleziona i ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Configura le specifiche delle colonne:
- Fai clic su Gestisci autorizzazioni per Colonna.
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
- Seleziona i ruoli richiesti e fai clic su Salva.
- Fai clic su Salva.
Fai clic su Crea.
Aggiornare le risorse dell'archivio degli attributi
Aggiornare i dettagli della tassonomia
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Fai clic sulla tassonomia da aggiornare.
Fai clic su Modifica.
Modifica il nome della tassonomia e la relativa descrizione in base alle tue esigenze.
Fai clic su Invia.
Aggiornare i dettagli dell'attributo
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Fai clic sulla tassonomia che contiene l'attributo da aggiornare.
Fai clic sull'attributo che vuoi aggiornare.
Per aggiornare il nome e la descrizione dell'attributo, fai clic su Modifica.
- Se stai aggiornando un attributo principale, hai la possibilità di aggiornarlo a un attributo secondario e viceversa. Seleziona le opzioni di conseguenza.
- Modifica il nome dell'attributo e la relativa descrizione in base alle esigenze.
- Fai clic su Aggiorna.
Per aggiornare le specifiche delle risorse per l'attributo, fai clic su
Modifica per Specifiche delle risorse.Per aggiungere un nuovo principal, segui questi passaggi:
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla risorsa.
- Seleziona i ruoli richiesti.
- Fai clic su Salva.
Per aggiornare un principal esistente:
- Per l'entità che vuoi aggiornare, fai clic su Modifica.
- Seleziona i ruoli richiesti.
- Fai clic su Salva.
Per rimuovere un principal esistente:
- Seleziona l'entità che vuoi rimuovere.
- Fai clic su Rimuovi.
Per aggiornare le specifiche di colonna per l'attributo, fai clic su
Modifica per Specifiche di colonna.Per aggiungere un nuovo principal, segui questi passaggi:
- Fai clic su Aggiungi.
- Nel campo Nuove entità, inserisci l'indirizzo email di una persona o di un gruppo che deve accedere alla colonna.
- Seleziona i ruoli richiesti.
- Fai clic su Salva.
Per aggiornare un principal esistente:
- Per l'entità che vuoi aggiornare, fai clic su Modifica.
- Seleziona i ruoli richiesti.
- Fai clic su Salva.
Per rimuovere un principal esistente:
- Seleziona l'entità che vuoi rimuovere.
- Fai clic su Rimuovi.
Associa attributi alle risorse
Associare un attributo a una tabella
Nella console Google Cloud , vai alla pagina Attribute Store del catalogo universale Dataplex.
Fai clic sulla tassonomia che contiene l'attributo.
Fai clic sull'attributo a cui vuoi associare una tabella.
Fai clic sulla scheda Risorse.
Fai clic su Aggiungi risorse.
Seleziona una tabella dall'elenco.
Fai clic su Seleziona.
Associare un attributo a una colonna
Nella console Google Cloud , vai alla pagina Ricerca di Data Catalog.
Cerca e seleziona la tabella a cui vuoi associare un attributo a una colonna.
Fai clic sulla scheda Tag di schema e colonna.
Per la colonna a cui vuoi associare un attributo, in Tag di policy, fai clic su
Aggiungi.Seleziona la tassonomia che contiene l'attributo.
Seleziona l'attributo.
Fai clic su Allega.
Passaggi successivi
- Scopri di più sulla sicurezza di Dataplex Universal Catalog.
- Scopri di più sulla gestione delle policy in Dataplex Universal Catalog.
- Scopri di più sui ruoli IAM per Dataplex Universal Catalog.