Este documento descreve como usar o repositório de atributos do catálogo universal do Dataplex.
Migrar da loja de atributos para tags e condições do IAM
Para migrar da Attribute Store, substitua a funcionalidade dela por tags, tags de política e condições do IAM.
Para conjuntos de dados e tabelas do BigQuery, faça o seguinte:
- Crie uma tag que replique o atributo do Catálogo Universal do Dataplex. Para mais informações, consulte Como criar e definir uma nova tag.
- Anexe a tag ao conjunto de dados ou à tabela do BigQuery. Para mais informações, consulte Anexar tags a um conjunto de dados e Anexar tags a uma tabela.
- Crie uma condição do IAM para gerenciar o acesso ao conjunto de dados ou à tabela com base na tag. Para mais informações, consulte Controlar o acesso com as condições do IAM.
Para colunas do BigQuery, faça o seguinte:
- Crie uma tag de política no BigQuery que replique o atributo do catálogo universal do Dataplex.
- Defina a tag de política na coluna.
- Use a tag de política para gerenciar o acesso à coluna usando o controle de acesso no nível da coluna ou o mascaramento de dados dinâmicos.
Para mais informações, consulte Introdução ao controle de acesso no nível da coluna e Configurar o controle de acesso no nível da coluna.
Visão geral do Attribute Store
O repositório de atributos do catálogo universal do Dataplex é uma infraestrutura extensível que permite especificar comportamentos relacionados a políticas nos recursos associados. Os administradores do Dataplex Universal Catalog podem usar a loja de atributos para definir como determinados dados devem ser tratados, associando-os a atributos.
Com a loja de atributos, é possível adicionar vários atributos a um objeto, como uma coluna. A Attribute Store mescla os comportamentos de todos os atributos associados a um objeto e os apresenta como uma única política no recurso subjacente.
É possível definir atributos para conjuntos de dados publicados. Os conjuntos de dados publicados se referem aos conjuntos de dados criados pelo Dataplex Universal Catalog com base nas tabelas descobertas em um recurso de bucket.
Os seguintes comportamentos de política são compatíveis:
- Especificações de recursos: especifica o acesso a um recurso, como uma tabela.
- Especificações de coluna: especificam o acesso a uma coluna em uma tabela do BigQuery
Você pode usar a loja de atributos para definir uma hierarquia de atributos chamada taxonomia. Em uma taxonomia, um atributo filho herda especificações da hierarquia de atributos pai. As especificações do pai e do filho são mescladas em uma lista unificada, que é propagada para o recurso.
É possível usar a loja de atributos do Dataplex Universal Catalog para fazer o seguinte:
- Criar taxonomias.
- Crie atributos e organize-os em uma hierarquia.
- Associe um ou mais atributos às tabelas.
- Associe um ou mais atributos a colunas.
Terminologia
Esta seção descreve a terminologia usada neste documento.
Taxonomia de atributos
Uma taxonomia de dados é uma hierarquia de atributos. Em uma taxonomia, os atributos nos nós principais permitem que os atributos abaixo deles (atributos filhos) herdem e adicionem as especificações de comportamento dos atributos principais aos próprios.
Por exemplo, se um atributo chamado PII
tiver uma especificação de recurso group-a@company.com
e um atributo filho de PII
chamado Social Security numbers
tiver uma especificação de recurso group-b@company.com
, as especificações de recurso aplicadas às políticas em que o atributo Social Security numbers
está associado serão group-a@company.com
e group-b@company.com
.
Ao definir um atributo, você pode escolher se ele é um atributo principal ou secundário. Ao definir um atributo filho, é preciso especificar o atributo pai.
Especificações de coluna
As especificações de comportamento para colunas. Ele especifica pessoas ou grupos que têm acesso de leitura às colunas. Se você associar um atributo que contém uma especificação de coluna à coluna de uma tabela, uma tag de política de coluna do BigQuery será adicionada a essa coluna.
Especificações dos recursos
As permissões para pessoas ou grupos acessarem recursos (tabelas). Se você associar um atributo à especificação de recurso, o Dataplex Universal Catalog vai propagar os papéis do IAM aos usuários especificados para acessar as tabelas associadas ao atributo.
Antes de começar
Limitações
O Catálogo Universal do Dataplex propaga as políticas de especificação de coluna como tags de política do BigQuery. O BigQuery tem uma limitação de uma tag de política por coluna. Se uma tag de política já existir em uma coluna, o Dataplex Universal Catalog vai gerar um erro no registro de governança na guia Gerenciar.
Cotas
Estas são as cotas e os limites aplicáveis à loja de atributos do Dataplex Universal Catalog:
Limite | Padrão |
---|---|
Número máximo de taxonomias em uma região | 100 |
Número máximo de atributos em todas as taxonomias em uma região | 10.000 |
Número máximo de atributos que podem ser associados a um recurso (tabela) | 50 |
Número máximo de atributos que podem ser associados a uma coluna | 100 |
Profundidade máxima por árvore de atributos de dados em uma taxonomia de atributos | 4 |
Funções exigidas
Para receber as permissões necessárias para usar o repositório de atributos do catálogo universal do Dataplex, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Gerenciar taxonomias e atributos:
Administrador de taxonomia do Dataplex (
roles/dataplex.taxonomyAdmin
) -
Confira as vinculações associadas a recursos e atributos:
Leitor de taxonomia do Dataplex (
roles/dataplex.taxonomyViewer
) -
Crie e gerencie recursos de vinculação em um projeto:
-
Administrador de vinculação do Dataplex (
roles/dataplex.bindingAdmin
) -
Administrador do Dataplex (
roles/dataplex.admin
no recurso de zona)
-
Administrador de vinculação do Dataplex (
-
Gerenciar especificações de acesso a recursos e dados:
Administrador de segurança do Dataplex (
roles/dataplex.securityAdmin
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esses papéis predefinidos contêm as permissões necessárias para usar o repositório de atributos do catálogo universal do Dataplex. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para usar a loja de atributos do Dataplex Universal Catalog:
-
Gerenciar taxonomias e atributos:
-
dataplex.datataxonomies.*
-
dataplex.dataattributes.*
(exceptdataplex.dataattributes.configureResourceAccess
anddataplex.dataattributes.configureDataAccess
)
-
-
Confira as vinculações associadas a recursos e atributos:
-
dataplex.datataxonomies.get
-
dataplex.datataxonomies.list
-
dataplex.dataattributes.get
-
dataplex.dataattributes.list
-
dataplex.dataattributebindings.get
-
dataplex.dataattributebindings.list
-
-
Criar e gerenciar recursos de vinculação em um projeto:
dataplex.dataattributebindings.*
-
Gerenciar especificações de acesso a recursos e dados:
-
dataplex.datataxonomies.configureResourceAccess
-
dataplex.datataxonomies.configureDataAccess
-
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Exemplos de casos de uso
Considere uma empresa chamada ACME
que tem três tipos de dados:
Red
dados sensíveisGreen
dados restritos, mas menos sensíveis- Dados sem classificação
O administrador do Dataplex Universal Catalog de ACME
cria o seguinte conjunto de atributos:
Atributo:
Red
- Especificações de coluna:
secrets_team@acme
com permissão de leitura - Especificações de recursos:
secrets_team@acme
etenured_employees@acme
com permissão de leitura
- Especificações de coluna:
Atributo:
Green
- Especificações de coluna:
full_time_employees@acme
com permissão de leitura - Especificações de recursos:
full_time_employees@acme
com permissão para edição
- Especificações de coluna:
Os atributos Red
e Green
controlam o comportamento de acesso aos recursos (tabelas) dependendo dos atributos associados às tabelas e às colunas delas.
Considere uma tabela com as seguintes colunas:
- ID
- CEP
- Nome
- Endereço
- $Value
Caso de uso 1: associar o mesmo atributo à tabela e a uma coluna
Se você associar o atributo Red
à tabela e à coluna Name, o Catálogo Universal do Dataplex vai propagar as seguintes políticas:
- Os funcionários em
secrets_team@acme
etenured_employees@acme
podem ler a tabela, ver os metadados e fazer consultas nela. - Somente funcionários em
secrets_team@acme
podem consultar a coluna Name, já que ela é protegida por especificações de coluna.
Caso de uso 2: combinar atributos
Considere as seguintes associações:
- Associe os atributos
Red
eGreen
à tabela. - Associe os atributos
Red
eGreen
à coluna Nome. - Associe o atributo
Red
à coluna $Value.
Nesse caso, o Dataplex Universal Catalog propaga as seguintes políticas:
- Os funcionários em
secrets_team@acme
,tenured_employees@acme
efull_time_employees@acme
podem acessar a tabela. Isso acontece porque o Dataplex Universal Catalog mescla as especificações de recursos dos atributosRed
eGreen
. - Os funcionários em
secrets_team@acme
efull_time_employees@acme
podem acessar a coluna Nome. Isso ocorre porque o Dataplex Universal Catalog mescla as especificações de coluna dos atributosRed
eGreen
. - Somente funcionários em
secrets_team@acme
podem consultar a coluna $Value.
Caso de uso 3: organizar atributos em uma hierarquia
É possível organizar atributos em uma hierarquia especificando os subtipos de atributos. Considere o seguinte conjunto de atributos:
Atributo principal 1:
Atributo: PII
- Especificações da coluna:
secrets_team@acme
- Especificações de recursos:
secrets_team@acme
etenured_employees@acme
Atributo filho de PII
:
Atributo: Email
- Especificações da coluna:
email_comm@acme
- Especificações do recurso:
email_comm@acme
Atributo principal 2:
Atributo: Financial
- Especificações da coluna:
full_time_employees@acme
- Especificações do recurso:
full_time_employees@acme
Considere as seguintes associações:
- Associe os atributos
Email
eFinancial
à tabela. - Associe os atributos
Email
eFinancial
à coluna Nome. - Associe o atributo
PII
à coluna $Value.
Nesse caso, o Dataplex Universal Catalog propaga as seguintes políticas:
- Os funcionários em
secrets_team@acme
,tenured_employees@acme
,full_time_employees@acme
eemail_comm@acme
podem acessar a tabela. Isso acontece porque o Dataplex Universal Catalog mescla as especificações de recursos dos atributosFinancial
eEmail
, e o atributoEmail
herda as especificações do atributoPII
. - Os funcionários em
secrets_team@acme
,email_comm@acme
efull_time_employees@acme
podem acessar a coluna Nome. Isso ocorre porque o Dataplex Universal Catalog mescla as especificações de coluna dos atributosFinancial
eEmail
. - Somente funcionários em
secrets_team@acme
podem consultar a coluna $Value.
Configurar atributos
Para criar um atributo, primeiro crie uma taxonomia e depois os atributos de dados pai e filho.
Criar uma taxonomia de atributos de dados
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Clique em Criar taxonomia.
Insira o Nome da taxonomia, o ID e a Descrição.
Selecione uma região.
Clique em Enviar.
A nova taxonomia aparece na página Taxonomias de dados.
Criar um atributo principal
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Na página Taxonomias de dados, clique na taxonomia em que você quer criar o atributo principal.
Na página Detalhes da taxonomia, clique em Adicionar atributo de dados.
Selecione Criar atributo de dados pai.
Insira um nome, um ID e uma descrição para o atributo principal.
Opcional: configure as especificações de atributos.
Configure as especificações de recursos:
- Clique em Gerenciar permissões para Recurso.
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou um grupo que precisa de acesso ao recurso.
- Selecione as Funções necessárias e clique em Salvar.
- Clique em Salvar.
Configure as especificações de coluna:
- Clique em Gerenciar permissões para Coluna.
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou um grupo que precisa de acesso à coluna.
- Selecione as Funções necessárias e clique em Salvar.
- Clique em Salvar.
Clique em Criar.
Criar um atributo filho
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Na página Taxonomias de dados, clique na taxonomia em que você quer criar o atributo filho.
Na página Detalhes da taxonomia, clique em Adicionar atributo de dados.
Selecione Criar atributo de dados filho.
Selecione um atributo de dados principal para o atributo filho que você está criando.
Insira um nome, um ID e uma descrição para o atributo filho.
Opcional: configure as especificações de atributos.
Configure as especificações de recursos:
- Clique em Gerenciar permissões para Recurso.
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou um grupo que precisa de acesso ao recurso.
- Selecione as Funções necessárias e clique em Salvar.
- Clique em Salvar.
Configure as especificações de coluna:
- Clique em Gerenciar permissões para Coluna.
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou um grupo que precisa de acesso à coluna.
- Selecione as Funções necessárias e clique em Salvar.
- Clique em Salvar.
Clique em Criar.
Atualizar recursos da loja de atributos
Atualizar detalhes da taxonomia
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Clique na taxonomia que você quer atualizar.
Clique em Editar.
Edite o nome e a descrição da taxonomia conforme necessário.
Clique em Enviar.
Atualizar detalhes do atributo
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Clique na taxonomia que contém o atributo que você quer atualizar.
Clique no atributo que você quer atualizar.
Para atualizar o nome e a descrição do atributo, clique em Editar.
- Se você estiver atualizando um atributo principal, poderá atualizá-lo para um atributo secundário e vice-versa. Selecione as opções de acordo com sua preferência.
- Edite o nome e a descrição do atributo conforme necessário.
- Clique em Atualizar.
Para atualizar as especificações de recursos do atributo, clique em
Editar em Especificações de recursos.Para adicionar um novo principal, siga estas etapas:
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou de um grupo que precisa de acesso ao recurso.
- Selecione as funções necessárias.
- Clique em Salvar.
Para atualizar um principal, siga estas etapas:
- No principal que você quer atualizar, clique em Editar.
- Selecione as funções necessárias.
- Clique em Salvar.
Para remover um principal, siga estas etapas:
- Selecione o principal que você quer remover.
- Clique em Remover.
Para atualizar as especificações de coluna do atributo, clique em
Editar em Especificações de coluna.Para adicionar um novo principal, siga estas etapas:
- Clique em Adicionar.
- No campo Novos participantes, digite o endereço de e-mail de uma pessoa ou um grupo que precisa de acesso à coluna.
- Selecione as funções necessárias.
- Clique em Salvar.
Para atualizar um principal, siga estas etapas:
- No principal que você quer atualizar, clique em Editar.
- Selecione as funções necessárias.
- Clique em Salvar.
Para remover um principal, siga estas etapas:
- Selecione o principal que você quer remover.
- Clique em Remover.
Associar atributos a recursos
Associar um atributo a uma tabela
No console Google Cloud , acesse a página Armazenamento de atributos do catálogo universal do Dataplex.
Clique na taxonomia que contém o atributo.
Clique no atributo que você quer associar a uma tabela.
Clique na guia Recursos.
Clique em Adicionar recursos.
Selecione uma tabela na lista.
Clique em Selecionar.
Associar um atributo a uma coluna
No console do Google Cloud , acesse a página Pesquisa do Data Catalog.
Pesquise e selecione a tabela em que você quer associar um atributo a uma coluna.
Clique na guia Tags de coluna e esquema.
Na coluna em que você quer associar um atributo, clique em
Adicionar em Tags de política.Selecione a taxonomia que contém o atributo.
Selecione o atributo.
Clique em Anexar.
A seguir
- Saiba mais sobre a segurança do Dataplex Universal Catalog.
- Saiba mais sobre o gerenciamento de políticas no Dataplex Universal Catalog.
- Saiba mais sobre os papéis do IAM do Dataplex Universal Catalog.