En esta página se describen los pasos que puede seguir para corregir los resultados de los perfiles de datos.
Riesgo de datos alto
Los recursos de datos con un riesgo de datos alto tienen pruebas de información sensible sin protecciones adicionales. Para reducir la puntuación de riesgo de los datos, puede hacer lo siguiente:
En las columnas de BigQuery que contengan datos sensibles, aplique una etiqueta de política de BigQuery para restringir el acceso a las cuentas con derechos de acceso específicos.
Antes de hacer este cambio, asegúrate de que tu agente de servicio tenga los permisos necesarios para crear perfiles de tablas con restricciones a nivel de columna. De lo contrario, Protección de Datos Sensibles mostrará un error. Para obtener más información, consulta Solucionar problemas con el profiler de datos.
Desidentifica los datos sensibles sin procesar mediante técnicas de desidentificación, como el enmascaramiento y la tokenización.
Habilita el etiquetado automático y elige la opción de definir automáticamente el riesgo de los datos de los recursos de datos perfilados como
Low
.Si no necesitas los datos de alto riesgo, plantéate eliminarlos.
Puntuación alta de texto libre
Una columna con una puntuación de texto libre alta, sobre todo si contiene pruebas de varios infoTipos (como PHONE_NUMBER
, US_SOCIAL_SECURITY_NUMBER
y DATE_OF_BIRTH
), puede incluir datos sin estructurar e instancias de información personal identificable (IPI). Esta columna puede ser un campo de nota o comentario. El texto libre
supone un riesgo potencial. Por ejemplo, en estos campos, alguien podría introducir "El cliente nació el 1 de enero de 1985".
Protección de Datos Sensibles se ha diseñado para gestionar datos no estructurados. Para entender mejor este tipo de datos, te recomendamos que hagas lo siguiente:
En el caso de los datos de BigQuery y Cloud Storage, puede identificar las ubicaciones exactas de la información personal identificable ejecutando una inspección bajo demanda en la tabla de BigQuery o en el segmento de Cloud Storage.
Desidentifica los datos sensibles sin procesar mediante técnicas como el enmascaramiento y la tokenización.
Siguientes pasos
Consulta cómo calcula Protección de Datos Sensibles los niveles de riesgo y sensibilidad de los datos de tus recursos de datos.
Consulta cómo la tokenización convierte los datos en recursos utilizables sin sacrificar la privacidad.
Consulta cómo Forrester ha nombrado Google Cloud a Google Cloud líder en plataformas de seguridad de datos no estructurados.