Usa la protección de datos sensibles con Cloud Data Fusion

En esta guía, se explica cómo usar Sensitive Data Protection con Cloud Data Fusion.

Cloud Data Fusion proporciona un complemento de protección de datos sensibles que proporciona tres transformaciones que pueden filtrar, ocultar o desencriptar tus datos sensibles:

  • La transformación del filtro de PII te permite filtrar registros sensibles de una transmisión de datos de entrada.

  • La transformación de ocultamiento te permite transformar datos sensibles, como enmascarar los datos o encriptarlos.

  • La transformación de desencriptación te permite desencriptar datos sensibles que se encriptaron previamente con la transformación Ocultar.

Costos

En este documento, usarás los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costos en función del uso previsto, usa la calculadora de precios. Es posible que los usuarios nuevos de Google Cloud califiquen para obtener una prueba gratuita.

Antes de comenzar

  1. En la consola de Google Cloud, ve a la página del selector de proyectos y selecciona crear un proyecto.

    Ve al selector de proyectos

  2. Habilita la API de Cloud Data Fusion para el proyecto.

    Habilitar la API de Cloud Data Fusion

  3. Habilita la API de DLP (parte de Sensitive Data Protection) para tu proyecto.

    Habilita la API de DLP

  4. Crea una instancia de Cloud Data Fusion.

Otorga permisos de protección de datos sensibles

  1. En la consola de Google Cloud, ve a la página IAM.

    Ir a IAM

  2. En la tabla de permisos, selecciona una de las siguientes cuentas de servicio. en la columna Principal:

    1. Para obtener permiso para los recursos en el entorno de ejecución, selecciona la cuenta de servicio que usa tu clúster de Dataproc. La configuración predeterminada es Compute Engine, cuenta de servicio, lo cual no se recomienda por motivos de seguridad

    2. Para obtener permiso a los recursos cuando usas Wrangler o Preview en Cloud Data Fusion (no en el tiempo de ejecución), selecciona la cuenta de servicio que coincida con el formato: service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. Haz clic en el ícono de lápiz a la derecha de la cuenta de servicio.

  4. Haz clic en Agregar otra función.

  5. Haz clic en el menú desplegable que aparece.

  6. Usa la barra de búsqueda para buscar y, luego, selecciona Administrador de DLP.

  7. Haga clic en Save. Verifica que el Administrador de DLP aparezca en la columna Función.

Implementa el complemento de protección de datos sensibles

  1. Ve a tu instancia:

    1. En la consola de Google Cloud, ve a la página de Cloud Data Fusion.

    2. Para abrir la instancia en Cloud Data Fusion Studio, haz clic en Instancias y, luego, en Ver instancia.

      Ir a Instancias

  2. En la IU web de Cloud Data Fusion, haz clic en Centro en la parte superior derecha.

  3. Haz clic en el complemento Prevención de pérdida de datos.

  4. Haz clic en Implementar.

  5. Haz clic en Finalizar.

  6. Haga clic en Crear una canalización.

Usa la transformación del filtro de PII

Esta transformación separa los registros sensibles de los registros no sensibles. Registro A se considera confidencial si coincide con los criterios que defines en un Plantilla de protección de datos sensibles. Por ejemplo, cuando creas tu plantilla, puedes definir datos sensibles como información de tarjetas de crédito o números de identificación personal.

  1. Crea una plantilla de inspección de Sensitive Data Protection.

  2. Abre tu canalización en Cloud Data Fusion y haz clic en Studio > Transform.

  3. Haz clic en la transformación Filtro de PII.

  4. Mantén el puntero sobre el nodo de Filtro de PII y haz clic en Propiedades.

  5. En Filtro activado, elige si deseas filtrar registros o campos.

    Cumple con los límites de la protección de datos sensibles, Si un registro supera los 0.5 MB, tu canalización de Cloud Data Fusion fallará. Para evitar este tipo de fallas, filtra por campo en lugar de registro.

  6. En ID de plantilla, ingresa el ID de plantilla de Sensitive Data Protection. plantilla que creaste.

  7. En Administración de errores, define cómo proceder cuando tu canalización encuentre datos sensibles. Elige una de las siguientes opciones de administración de errores:

    • Detener canalización: detiene la canalización apenas se encuentra un error.
    • Omitir registro: omite el registro que causó el error. La canalización continúa ejecutándose y no se informa ningún error.
    • Enviar al error: envía errores al puerto de error. La canalización continúa ejecutándose.
  8. Haz clic en el botón X.

Usa la transformación de ocultamiento

Esta transformación identifica registros sensibles en el flujo de entrada y aplica las transformaciones que defines para esos registros. Un registro se considera son sensibles si coinciden con los filtros predefinidos de la protección de datos sensibles que elijas o una plantilla personalizada que hayas definido.

  1. En la página Estudio de la IU web de Cloud Data Fusion, haz clic para expandir el menú Transformar.

  2. Haz clic en la transformación Ocultar.

  3. Mantén el puntero sobre el nodo Ocultar y haz clic en Propiedades.

  4. Elige si deseas aplicar transformaciones a filtros predefinidos o si deseas crear uno propio.

    No puedes combinar estas dos opciones. Puedes usar parámetros predefinidos filtros O crear una plantilla personalizada.

    Filtros predefinidos

    Para aplicar transformaciones a filtros predefinidos, deja el menú Personalizado Plantilla configurada como No y, en Coincidencia, define una regla:

    1. En Aplicar, haz clic en el menú desplegable y elige una transformación. Obtén más información sobre las transformaciones disponibles en la sección Descripción de la pestaña Documentación del complemento.

    2. Después de activar, haz clic en el menú desplegable y elige una categoría: un conjunto de filtros predefinidos de Sensitive Data Protection agrupados por tipo. Para ver la lista completa de categorías proporcionadas y los filtros que contienen, consulta la sección Asignación de filtro de DLP en la pestaña Documentación del complemento.

    Para configurar varias reglas coincidentes, haz clic en el botón +.

    Plantilla personalizada

    Para aplicar transformaciones según una plantilla personalizada, configura la Plantilla personalizada como .

    1. Crea una plantilla personalizada de protección de datos sensibles.

    2. De regreso en la IU web de Cloud Data Fusion, en el menú de propiedades Ocultar, en ID de plantilla, ingresa el ID de plantilla de la plantilla personalizada que creaste.

  5. Haz clic en el botón X.

Usa la transformación de desencriptación

Esta transformación identifica los registros que se encriptaron con Sensitive Data Protection en el flujo de entrada y aplica la desencriptación. Solo los registros que se encriptaron con un algoritmo reversible, como la encriptación que preserva el formato La encriptación determinista se puede desencriptar.

  1. En la página Estudio de la IU web de Cloud Data Fusion, haz clic para expandir el menú Transformar.

  2. Haz clic en la transformación Desencriptar.

  3. Mantén el puntero sobre el nodo Desencriptar y haz clic en Propiedades.

  4. Ingresa los mismos valores que se usaron para configurar el complemento Redact que y encriptó estos datos. Las propiedades de este complemento son idénticas a las Redact.

  5. Haz clic en el botón X.

¿Qué sigue?