Sensitive Data Protection ti aiuta a comprendere, gestire e proteggere i dati sensibili. Con la protezione dei dati sensibili, puoi classificare e oscurare facilmente i dati sensibili contenuti in immagini e contenuti basati su testo, inclusi i contenuti archiviati nei repository di Google Cloud Storage.
Classificazione del testo
Dato il seguente input di testo:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
L'output è un elenco di risultati, organizzati nelle seguenti categorie:
InfoType
Likelihood
Offset
(dove nella stringa è stato trovato il potenzialeInfoType
)
Un esempio di output è riportato nella tabella seguente.
InfoType |
Likelihood |
Offset |
---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
Oscuramento automatico del testo
L'oscuramento automatico produce un output con le corrispondenze dei dati sensibili rimosse invece di fornire un elenco di risultati.
Esempio di input di oscuramento dell'automazione:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
Esempio di output che utilizza un segnaposto "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
Classificazione delle immagini
La funzionalità Protezione dei dati sensibili utilizza la tecnologia di riconoscimento ottico dei caratteri (OCR) per riconoscere il testo prima della classificazione. Analogamente alla classificazione del testo, restituisce i risultati, ma aggiunge anche una riquadro di delimitazione dove è stato trovato il testo.
Classificazione dello spazio di archiviazione
La classificazione dello spazio di archiviazione esegue la scansione dei dati archiviati in Cloud Storage, Firestore in modalità Datastore (Datastore) e BigQuery. Anziché eseguire lo streaming dei dati in Protezione dati sensibili, specifica nella richiesta la posizione di archiviazione del bucket Cloud Storage, del tipo di Datastore o della tabella BigQuery che vuoi che Protezione dati sensibili esamini.
Durante la scansione dei file nelle posizioni di Cloud Storage, la funzionalità Protezione dei dati sensibili supporta la scansione di file di tipo binario, di testo, immagine, Microsoft Word, Microsoft Excel, Microsoft PowerPoint, PDF e Apache Avro. Un elenco delle estensioni dei file per i tipi di file in Cloud Storage
che Sensitive Data Protection può analizzare è disponibile nella pagina di riferimento dell'API per
FileType
.
I file di tipi non riconosciuti vengono analizzati come file binari.
I risultati della scansione possono essere salvati in una nuova tabella BigQuery o pubblicati in un argomento Pub/Sub. Da qui, puoi utilizzare gli strumenti BigQuery integrati per eseguire analisi SQL avanzate o strumenti come Looker Studio per generare report.
Per ulteriori informazioni sulla scansione dei repository di archiviazione per rilevare dati sensibili utilizzando la Protezione dei dati sensibili, consulta Ispezione dello spazio di archiviazione e dei database per l'individuazione di dati sensibili.
Per ulteriori informazioni sulla visualizzazione dei risultati della scansione utilizzando altri strumenti Google Cloud, consulta Analisi e generazione di report sui risultati di Sensitive Data Protection.
Passaggi successivi
- Scopri di più su ispezione e oscuramento delle immagini.
- Scopri i metodi di trasformazione che puoi utilizzare con Sensitive Data Protection.
- Completa il codelab Oscurare i dati sensibili con Sensitive Data Protection.
- Scopri di più sulla creazione di una copia anonimizzata dei dati nello stoccaggio.