Utilizzo di Sensitive Data Protection per eseguire la scansione dei dati di BigQuery
Spesso, conoscere la posizione dei dati sensibili è il primo passo per garantire che siano protetti e gestiti correttamente. Queste informazioni possono contribuire a ridurre il rischio di esporre dettagli sensibili come numeri di carte di credito, informazioni mediche, codici fiscali, numeri di patente di guida, indirizzi, nomi e cognomi e segreti specifici dell'azienda. La scansione periodica dei dati può essere utile anche per adempiere ai requisiti di conformità e garantire il rispetto delle best practice man mano che i dati crescono e cambiano con l'uso. Per contribuire a soddisfare i requisiti di conformità, utilizza Sensitive Data Protection per ispezionare le tabelle BigQuery e contribuire a proteggere i tuoi dati sensibili.
Esistono due modi per eseguire la scansione dei dati BigQuery:
Profilazione dei dati sensibili. Sensitive Data Protection può generare profili dei dati di BigQuery in un'organizzazione, una cartella o un progetto. I profili di dati contengono metriche e metadati sulle tabelle e ti aiutano a determinare dove si trovano i dati sensibili e ad alto rischio. Sensitive Data Protection registra queste metriche a livello di progetto, tabella e colonna. Per ulteriori informazioni, consulta Profili di dati per i dati BigQuery.
Ispezione on demand. Sensitive Data Protection può eseguire un'ispezione approfondita su una singola tabella o su un sottoinsieme di colonne e segnalare i risultati fino a livello di cella. Questo tipo di ispezione può aiutarti a identificare singole istanze di tipi di dati specifici, ad esempio la collocazione esatta di un numero di carta di credito all'interno di una cella di tabella. Puoi eseguire un'ispezione on demand tramite la pagina Sensitive Data Protection nella console Google Cloud, la pagina BigQuery nella console Google Cloud o tramite programmazione tramite l'API DLP.
Questa pagina descrive come eseguire un'ispezione on demand tramite la pagina BigQuery nella console Google Cloud.
Sensitive Data Protection è un servizio completamente gestito che consente ai clienti Google Cloud di identificare e proteggere i dati sensibili su larga scala. La funzionalità Protezione dei dati sensibili utilizza più di 150 rilevatori predefiniti per identificare pattern, formati e checksum. Sensitive Data Protection fornisce anche un insieme di strumenti per anonimizzare i dati, tra cui mascheramento, tokenizzazione, pseudonimizzazione, spostamento della data e altro ancora, il tutto senza replicare i dati dei clienti.
Per scoprire di più su Sensitive Data Protection, consulta la documentazione di Sensitive Data Protection.
Prima di iniziare
- Acquisisci familiarità con i prezzi di Sensitive Data Protection e su come tenere sotto controllo i costi di Sensitive Data Protection.
Assicurati che all'utente che crea i job Sensitive Data Protection sia stato assegnato un ruolo IAM Sensitive Data Protection predefinito appropriato o autorizzazioni sufficienti per eseguire i job Sensitive Data Protection.
Eseguire la scansione dei dati BigQuery utilizzando la console Google Cloud
Per eseguire la scansione dei dati BigQuery, crea un job Sensitive Data Protection che analizza una tabella. Puoi eseguire rapidamente la scansione di una tabella BigQuery utilizzando l'opzione Scan with Sensitive Data Protection (Esegui scansione con Sensitive Data Protection) nella console Google Cloud BigQuery.
Per eseguire la scansione di una tabella BigQuery utilizzando Sensitive Data Protection:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e il set di dati, quindi seleziona la tabella.
Fai clic su Esporta > Analizza con Sensitive Data Protection. La pagina di creazione del job di protezione dei dati sensibili si apre in una nuova scheda.
Per il passaggio 1: scegli i dati di input, inserisci un ID job. I valori nella sezione Posizione vengono generati automaticamente. Inoltre, la sezione Campionamento è configurata automaticamente per eseguire una scansione di esempio sui tuoi dati, ma puoi modificare le impostazioni in base alle tue esigenze.
Fai clic su Continua.
(Facoltativo) Per il passaggio 2: configura il rilevamento, puoi configurare i tipi di dati da cercare, denominati
infoTypes
.Esegui una di queste operazioni:
- Per selezionare un valore dall'elenco di
infoTypes
predefiniti, fai clic su Gestisci infoTypes. Quindi, seleziona gli infoType che vuoi cercare. - Per utilizzare un modello di ispezione esistente, nel campo Nome modello inserisci il nome risorsa completo del modello.
Per ulteriori informazioni su
infoTypes
, consulta InfoType e rilevatori di infoType nella documentazione di Sensitive Data Protection.- Per selezionare un valore dall'elenco di
Fai clic su Continua.
(Facoltativo) Per il passaggio 3: aggiungi azioni, attiva Salva in BigQuery per pubblicare i risultati di Sensitive Data Protection in una tabella BigQuery. Se non memorizzi i risultati, il job completato contiene solo le statistiche sul numero di risultati e sul relativo
infoTypes
. Se salvi i risultati in BigQuery, vengono salvati i dettagli sulla posizione esatta e sull'affidabilità di ogni singolo risultato.(Facoltativo) Se hai attivato Salva in BigQuery, nella sezione Salva in BigQuery, inserisci le seguenti informazioni:
- ID progetto: l'ID progetto in cui sono archiviati i risultati.
- ID set di dati: il nome del set di dati in cui vengono archiviati i risultati.
- (Facoltativo) ID tabella: il nome della tabella che memorizza i risultati. Se non viene specificato alcun ID tabella, a una nuova tabella viene assegnato un nome predefinito simile al seguente:
dlp_googleapis_date_1234567890
. Se specifichi una tabella esistente, i risultati vengono aggiunti a questa.
Per includere i contenuti effettivi rilevati, attiva Includi citazione.
Fai clic su Continua.
(Facoltativo) Per il passaggio 4: Pianifica, configura un intervallo di tempo o una pianificazione selezionando Specifica intervallo di tempo o Crea un trigger per eseguire il job su base periodica.
Fai clic su Continua.
(Facoltativo) Nella pagina Revisione, esamina i dettagli del tuo lavoro. Se necessario, modifica le impostazioni precedenti.
Fai clic su Crea.
Al termine del job Sensitive Data Protection, viene visualizzata la pagina dei dettagli del job e ricevi una notifica via email. Puoi visualizzare i risultati della scansione nella pagina dei dettagli del job oppure fare clic sul link alla pagina dei dettagli del job di protezione dei dati sensibili nell'email di completamento del job.
Se hai scelto di pubblicare i risultati di Sensitive Data Protection in BigQuery, nella pagina Dettagli job, fai clic su Visualizza risultati in BigQuery per aprire la tabella nella console Google Cloud. A questo punto, puoi eseguire query sulla tabella e analizzare i risultati. Per ulteriori informazioni sull'esecuzione di query sui risultati in BigQuery, consulta Eseguire query sui risultati di Sensitive Data Protection in BigQuery nella documentazione di Sensitive Data Protection.
Passaggi successivi
Scopri di più su come controllare la presenza di dati sensibili in BigQuery e in altri repository di archiviazione utilizzando la Protezione dei dati sensibili.
Scopri di più sulla profilazione dei dati in un'organizzazione, una cartella o un progetto.
Leggi il post del blog Identity & Security (Identità e sicurezza) Prendere il controllo dei dati: utilizzare la Protezione dei dati sensibili per anonimizzare e offuscare le informazioni sensibili.
Se vuoi oscurare o anonimizzare i dati sensibili rilevati dalla scansione della Protezione dei dati sensibili, consulta quanto segue:
- Ispezionare il testo per anonimizzare le informazioni sensibili
- Anonimizzazione dei dati sensibili nella documentazione di Sensitive Data Protection
- Concetti di crittografia AEAD in GoogleSQL per informazioni sulla crittografia dei singoli valori all'interno di una tabella
- Protezione dei dati con le chiavi Cloud KMS per informazioni su come creare e gestire le tue chiavi di crittografia in Cloud KMS per criptare le tabelle BigQuery