L'analisi del rischio di reidentificazione, o semplicemente analisi del rischio, è il processo di analisi dei dati sensibili per trovare proprietà che potrebbero aumentare il rischio di identificazione dei soggetti. Puoi utilizzare i metodi di analisi del rischio prima dell'anonimizzazione per determinare una strategia efficace o dopo l'anonimizzazione per monitorare eventuali modifiche o valori anomali.
k Se non hai familiarità con l'analisi del rischio o con queste metriche, consulta l'argomento sull'analisi del rischio prima di continuare.
Questa sezione fornisce panoramiche su come utilizzare Sensitive Data Protection per l'analisi del rischio dei dati strutturati utilizzando una qualsiasi di queste metriche, oltre ad altri argomenti correlati.
Calcolare il rischio di reidentificazione
Sensitive Data Protection può analizzare i dati strutturati archiviati nelle tabelle BigQuery e calcolare le seguenti metriche del rischio di reidentificazione. Fai clic sul link della metrica che vuoi calcolare per saperne di più.
Metrica | Descrizione |
---|---|
k-anonimato | Una proprietà di un set di dati che indica la reidentificabilità dei suoi record. Un set di dati è k-anonymous se i quasi-identificatori per ogni persona nel set di dati sono identici ad almeno k – 1 altre persone nel set di dati. |
l-diversity | Un'estensione di k-anonymity che misura anche la diversità dei valori sensibili per ogni colonna in cui si presentano. Un set di dati ha l-diversity se, per ogni insieme di righe con quasi-identificatori identici, esistono almeno l valori distinti per ciascun attributo sensibile. |
k-map | Calcola il rischio di reidentificazione confrontando un determinato set di dati anonimizzati di soggetti con un set di dati di reidentificazione o "attacco" più ampio. |
δ-presence | Stima la probabilità che un determinato utente in una popolazione più ampia sia presente nel set di dati. Questo viene utilizzato quando l'appartenenza al set di dati è di per sé un'informazioni sensibili. |
Calcolare altre statistiche
Sensitive Data Protection può anche calcolare statistiche numeriche e categoriche
per i dati archiviati nelle tabelle BigQuery utilizzando la stessa risorsa
DlpJob
delle
API di analisi del rischio.
Metrica | Descrizione |
---|---|
Statistiche numeriche | Determina i valori minimo, massimo e quantile per una singola colonna BigQuery. |
Statistiche numeriche categoriche | Calcola le statistiche numeriche categoriche per i singoli bucket dell'istogramma all'interno di una colonna BigQuery. |
Per maggiori informazioni, vedi Calcolo delle statistiche numeriche e di classificazione.
Visualizzare il rischio di reidentificazione
Puoi visualizzare le metriche di rischio calcolate da Sensitive Data Protection direttamente nella Google Cloud console utilizzando Sensitive Data Protection (k-anonimizzazione o l-diversity) o utilizzando altri prodottiGoogle Cloud .
Prodotto | Descrizione |
---|---|
Looker Studio | Dopo aver calcolato i valori di k-anonimato per un set di dati utilizzando Sensitive Data Protection, puoi visualizzare i risultati in Looker Studio. In questo modo, potrai anche comprendere meglio il rischio di reidentificazione e valutare i compromessi in termini di utilità che potresti fare se oscuri o deidentifichi i dati. |