Corregir resultados del profiler de datos

En esta página se describen los pasos que puede seguir para corregir los resultados de los perfiles de datos.

Riesgo de datos alto

Los recursos de datos con un riesgo de datos alto tienen pruebas de información sensible sin protecciones adicionales. Para reducir la puntuación de riesgo de los datos, puede hacer lo siguiente:

Puntuación alta de texto libre

Una columna con una puntuación de texto libre alta, sobre todo si contiene pruebas de varios infoTipos (como PHONE_NUMBER, US_SOCIAL_SECURITY_NUMBER y DATE_OF_BIRTH), puede incluir datos sin estructurar e instancias de información personal identificable (IPI). Esta columna puede ser un campo de nota o comentario. El texto libre supone un riesgo potencial. Por ejemplo, en estos campos, alguien podría introducir "El cliente nació el 1 de enero de 1985".

Protección de Datos Sensibles se ha diseñado para gestionar datos no estructurados. Para entender mejor este tipo de datos, te recomendamos que hagas lo siguiente:

  • En el caso de los datos de BigQuery y Cloud Storage, puede identificar las ubicaciones exactas de la información personal identificable ejecutando una inspección bajo demanda en la tabla de BigQuery o en el segmento de Cloud Storage.

  • Desidentifica los datos sensibles sin procesar mediante técnicas como el enmascaramiento y la tokenización.

Siguientes pasos