Neste guia, explicamos como usar a Proteção de Dados Sensíveis com o Cloud Data Fusion.
O Cloud Data Fusion fornece um plug-in de proteção de dados sensíveis que fornece três transformações que podem filtrar, encobrir ou descriptografar os dados confidenciais:
A transformação do filtro de PIIs permite filtrar registros confidenciais de um fluxo de dados de entrada.
A transformação "Redact" permite transformar dados confidenciais, como mascarar os dados ou criptografá-los.
A transformação "Decrypt" permite descriptografar dados confidenciais que foram criptografados anteriormente usando a transformação Redact:
Custos
Neste documento, você usará os seguintes componentes faturáveis do Google Cloud:
Para gerar uma estimativa de custo baseada na projeção de uso deste tutorial, use a calculadora de preços.
Antes de começar
No console do Google Cloud, acesse a página do seletor de projetos e selecione ou crie um projeto.
Ative a API Cloud Data Fusion para o projeto.
Ative a API DLP (parte da proteção de dados sensíveis) no seu projeto.
Conceder permissões de proteção de dados sensíveis
No console do Google Cloud, abra a página IAM.
Na tabela de permissões, selecione uma das contas de serviço a seguir Na coluna Principal:
Para permissão a recursos no ambiente de execução, selecione a conta de serviço que usado pelo cluster do Dataproc. O padrão é a instância do Compute Engine conta de serviço, o que não é recomendado por motivos de segurança
Para permissão a recursos ao usar o Wrangler ou a visualização no Cloud Data Fusion (não no ambiente de execução). Selecione o serviço que corresponde ao formato:
service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com
:
Clique no ícone de lápis à direita da conta de serviço.
Clique em Adicionar outro papel.
Clique na lista suspensa exibida.
Use a barra de pesquisa para pesquisar e selecione Administrador do DLP.
Clique em Save. Verifique se o Administrador do DLP aparece na coluna Papel.
Implantar o plug-in de proteção de dados sensíveis
Acesse sua instância:
No console do Google Cloud, acesse a página do Cloud Data Fusion.
Para abrir a instância no Cloud Data Fusion Studio, clique em Instâncias e em Ver instância.
Na IU da Web do Cloud Data Fusion, clique em Hub no canto superior direito.
Clique no plug-in Prevenção contra perda de dados.
Clique em Deploy.
Clique em Finish.
Clique em Criar um pipeline.
Usar a transformação PII Filter
Essa transformação separa registros confidenciais de registros não confidenciais. registro A será considerado sensível se corresponder aos critérios definidos em um Modelo de proteção de dados sensíveis. Por exemplo, ao criar seu modelo, é possível definir dados confidenciais, como informações de cartão de crédito ou CPF.
Abra o pipeline no Cloud Data Fusion e clique em Studio > Transform.
Clique na transformação PII Filter.
Mantenha o ponteiro sobre o nó PII Filter e clique em Propriedades.
Em Filtrar, escolha se você quer filtrar registros ou campos.
Conforme os limites de proteção de dados sensíveis, Se um registro exceder 0,5 MB, o pipeline do Cloud Data Fusion vai falhar. Para evitar essa falha, filtre por campo em vez de registro.
Em ID do modelo, insira o ID do modelo do ID da proteção de dados sensíveis modelo que você criou.
Em Manipulação de erros, defina como prosseguir quando o pipeline encontrar dados confidenciais. Escolha uma das seguintes opções de tratamento de erros:
- Interromper pipeline: interrompe o pipeline assim que um erro é encontrado.
- Ignorar registro: pula o registro que causou o erro. O pipeline continua em execução e nenhum erro é relatado.
- Enviar para erro: envia erros para a porta de erro. O pipeline continua em execução.
Clique no botão X.
Usar a transformação de edição
Essa transformação identifica registros confidenciais no fluxo de entrada e aplica transformações definidas a esses registros. Um registro é considerado sensível se corresponder a filtros predefinidos de proteção de dados sensíveis escolhidos ou a um modelo personalizado definido por você.
Na página Studio da IU da Web do Cloud Data Fusion, clique para expandir o menu Transformar.
Clique na transformação Editar.
Mantenha o ponteiro sobre o nó Editar e clique em Propriedades.
Escolha se você quer aplicar transformações a filtros predefinidos ou se para criar o seu próprio.
Não é possível combinar essas duas opções. É possível usar opções predefinidas filtros OU crie um modelo personalizado.
Filtros predefinidos
Para aplicar transformações a filtros predefinidos, deixe a seção Personalizada Modelo definido como Não e, em Correspondência, defina uma regra:
Depois de Aplicar, clique na lista suspensa e escolha uma transformação. Saiba mais sobre as transformações disponíveis na seção Descrição da guia Documentação do plug-in.
Seguindo em, clique no menu suspenso e escolha uma categoria, um conjunto de filtros predefinidos de proteção de dados sensíveis agrupados por tipo. Para a lista completa de categorias fornecidas e quais filtros elas contêm, consulte a seção Mapeamento de filtro da DLP na guia Documentação do plug-in.
Para definir várias regras de correspondência, clique no botão +.
Modelo personalizado
Para aplicar transformações de acordo com um modelo personalizado, defina o Modelo personalizado como Sim.
Criar um modelo personalizado de proteção de dados sensíveis.
De volta à IU da Web do Cloud Data Fusion, no menu de propriedades de edição, em ID do modelo, insira o ID do modelo personalizado que você criou.
Clique no botão X.
Usar a transformação Decrypt
Esta transformação identifica registros que foram criptografados usando a Proteção de Dados Sensíveis no fluxo de entrada e aplica a descriptografia. Apenas registros que foram criptografados usando um algoritmo reversível, como a criptografia com preservação de formato ou A criptografia determinística pode ser descriptografada.
Na página Studio da IU da Web do Cloud Data Fusion, clique para expandir o menu Transformar.
Clique na transformação Decrypt.
Mantenha o ponteiro sobre o nó Decrypt e clique em Propriedades.
Digite os mesmos valores usados para configurar o plug-in Redact que criptografou esses dados. As propriedades deste plug-in são idênticas às Redact.
Clique no botão X.
A seguir
- Siga um tutorial para editar dados confidenciais do usuário.
- Leia mais sobre a Proteção de Dados Sensíveis.