Sensitive Data Protection vous aide à comprendre, gérer et protéger les données sensibles. Avec la protection des données sensibles, vous pouvez facilement classifier et masquer les données sensibles apparaissant dans des contenus de type texte et dans des images, y compris des contenus stockés dans des dépôts Google Cloud Storage.
Classification de texte
Examinez l'entrée de texte suivante :
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Nous obtenons une liste de résultats organisés dans les catégories suivantes :
InfoType
Likelihood
Offset
(l'emplacement de la chaîne où la valeurInfoType
potentielle a été trouvée)
Des exemples de résultats sont indiqués dans le tableau ci-dessous.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Masquage automatique de texte
Plutôt que de vous présenter une liste de résultats, le masquage automatique génère un résultat duquel sont effacées les correspondances de données sensibles.
Exemple d'entrée avec masquage automatique :
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Exemple de résultat utilisant un espace réservé "***" :
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Classification d'images
Sensitive Data Protection identifie du texte à l'aide de la technologie de reconnaissance optique des caractères (OCR) avant de le classifier. Comme pour la classification de texte, il renvoie les résultats, mais ajoute également un cadre de délimitation là où le texte a été trouvé.
Classification du stockage
La classification du stockage analyse les données stockées dans Cloud Storage, Firestore en mode Datastore (Datastore) et BigQuery. Au lieu de diffuser les données dans la protection des données sensibles, vous spécifiez dans votre requête l'emplacement de stockage du bucket Cloud Storage, du genre Datastore ou de la table BigQuery que vous souhaitez faire analyser par la protection des données sensibles.
Lors de l'analyse de fichiers dans des emplacements Cloud Storage, la protection des données sensibles est compatible avec l'analyse de fichiers binaires, texte, image, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF et Apache Avro. Une liste des extensions de fichiers pour les types de fichiers Cloud Storage pouvant être analysés par la protection des données sensibles est disponible sur la page de référence de l'API pour FileType
.
Les fichiers de types non reconnus sont analysés en tant que fichiers binaires.
Les résultats de l'analyse peuvent être enregistrés dans une nouvelle table BigQuery ou publiés dans un sujet Pub/Sub. Vous pouvez alors vous servir des outils BigQuery intégrés pour générer des analyses SQL approfondies ou des outils tels que Looker Studio pour générer des rapports.
Pour en savoir plus sur l'analyse de données sensibles dans les dépôts de stockage à l'aide de la protection des données sensibles, consultez la page Inspecter le stockage et les bases de données pour identifier les données sensibles.
Pour en savoir plus sur la visualisation des résultats d'analyse à l'aide d'autres outils Google Cloud, consultez la page Examiner les résultats des analyses de protection des données sensibles et créer des rapports.
Étape suivante
- Apprenez-en plus sur l'inspection et le masquage d'images.
- Découvrez les méthodes de transformation que vous pouvez utiliser avec la protection des données sensibles.
- Suivez le atelier de programmation sur le masquage des données sensibles avec Sensitive Data Protection.
- Découvrez comment créer une copie anonymisée des données dans l'espace de stockage.