Questa pagina elenca e descrive tutte le metriche raccolte nei profili dei dati.
Esistono tre tipi di profili di dati: profili di dati di progetto, profili di dati di tabella e profili di dati di colonna.
Profili di dati di progetto
Ogni profilo dei dati del progetto contiene i seguenti campi. I valori di questi campi vengono aggregati in base alle risorse profilate all'interno del progetto.
Approfondimenti
I profili dei dati di progetto forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo progetto. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.
Metadati
I profili dati di progetto forniscono i seguenti metadati:
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- ID progetto
- ID del progetto di cui è stato creato il profilo.
- Nome risorsa
- Nome completo del profilo dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
Profili dati tabella
Ogni profilo dati della tabella contiene i seguenti campi:
Approfondimenti
I profili dati tabella forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questa tabella. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.
Metadati
I profili dei dati delle tabelle forniscono i seguenti metadati:
- Database
- Il database contenente la tabella di cui è stato eseguito il profilo. Questo campo si applica solo alla ricerca di Cloud SQL.
- ID set di dati
- ID del set di dati che contiene questa tabella.
- Crittografia
- Indica se la crittografia di questa tabella è gestita da Google o dalla tua organizzazione.
- Scadenza
- Facoltativo. L'ora di scadenza della tabella.
- Conteggio colonne in errore
- Il numero di colonne ignorate in questa tabella a causa di un errore.
- Ispeziona snapshot configurazione
- Istantanea del modello di ispezione utilizzato durante la generazione del profilo. Per ulteriori informazioni, consulta Snapshot dei profili dei dati.
- Istanza
- L'istanza contenente la tabella di cui è stato eseguito il profiling. Questo campo si applica solo alla ricerca di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Ultimo aggiornamento in BigQuery
- Data e ora dell'ultima modifica della tabella.
- ID progetto
- ID del progetto che contiene questa tabella.
- Pubblico
Indica se questa tabella è disponibile per tutti gli utenti o limitata a determinati utenti.
- Etichette risorse
Etichette della tabella al momento della generazione del profilo.
- Tag di risorse
Tag della tabella al momento della generazione del profilo.
- Nome risorsa
Nome completo del profilo dei dati.
- Conteggio delle righe
Numero di righe in questa tabella al momento della generazione del profilo.
- Conteggio colonne scansionate
Il numero di colonne profilate in questa tabella.
- Service account
Numero di account di servizio con autorizzazioni IAM per accedere a questa tabella.
- Stato
Indica se la generazione del profilo è riuscita.
- ID tabella
ID di questa tabella.
- Ora di creazione della tabella
Data e ora di creazione della tabella.
- Dimensione tabella
Le dimensioni di questa tabella al momento della generazione del profilo.
- Tipo
Il tipo di rilevamento eseguito.
Profili dei dati delle colonne
Ogni profilo dei dati delle colonne contiene i seguenti campi:
Approfondimenti
I profili dei dati delle colonne forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questa colonna. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- infoType previsto
Se un singolo infoType integrato o personalizzato ha una chiara prevalenza rispetto agli altri nella colonna, Sensitive Data Protection imposta questo campo su quel infoType. In caso contrario, questo campo non ha valore.
Per visualizzare un elenco di tutti gli infoType rilevati nella colonna, consulta il campo Altri infoType.
Sensitive Data Protection cerca solo gli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo InfoType previsto. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non contieneEMAIL_ADDRESS
.Se i dati della colonna corrispondono prevalentemente a diversi infoType strettamente correlati che appartengono alla stessa categoria generale, la funzionalità Protezione dei dati sensibili imposta questo campo sull'infoType più generale. Ad esempio, se la colonna contiene prevalentemente una combinazione di infoType
PASSPORT
,AUSTRALIA_PASSPORT
eCANADA_PASSPORT
, il campo InfoType previsto è impostato suPASSPORT
. Il campo Altri infoType mostra gli infoType più specifici e la loro prevalenza stimata.- Altri infoType
Gli infoType rilevati nella colonna che non hanno un indicatore sufficientemente forte per essere considerati infoType previsti della colonna. In questo documento, consulta infoType previsto.
Per i profili di dati generati dopo il 13 ottobre 2022, ogni infoType elencato in questo campo ha una prevalenza stimata. La prevalenza stimata è una percentuale approssimativa di righe con valore non null in cui è stato rilevato l'infoType.
Ad esempio, supponiamo di avere una colonna con le seguenti metriche:
- infoType previsto:
FDA_CODE
- Altri infoType:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
In questo esempio, è molto probabile che la colonna contenga codici FDA. La protezione dei dati sensibili ha inoltre stabilito che circa il 2% delle righe non nulle della colonna potrebbe contenere nomi di persone e l'1% potrebbe contenere indirizzi.
Sensitive Data Protection cerca solo gli infoType specificati nel modello di ispezione. Pertanto, solo questi infoType possono essere visualizzati nel campo Altri infoType. Ad esempio, se la colonna contiene indirizzi email, ma non hai incluso il rilevatore infoType
EMAIL_ADDRESS
nel modello di ispezione, questo campo non contieneEMAIL_ADDRESS
.- infoType previsto:
- Proporzione di valori null stimata
Proporzione approssimativa di valori null in questa colonna, classificata come alta, media, bassa o molto bassa. Questo valore è elevato se una grande proporzione di voci in questa colonna è null.
- Unicità stimata
Una stima della quantità di dati univoci in questa colonna, classificata come elevata, media o bassa. Un livello di univocità elevato indica che la colonna contiene valori distinti. Un'elevata presenza di valori univoci può indicare che la colonna contiene identificatori.
Un livello di univocità basso suggerisce che la colonna contiene molti valori comuni, come enumerazioni o valori booleani.
Se la funzionalità Protezione dei dati sensibili determina che non ci sono righe sufficienti nella tabella per calcolare questa metrica, questo valore è vuoto.
- Punteggio testo libero
La probabilità che questa colonna contenga testo in formato libero. Un valore vicino a 1 indica che la colonna è probabile che contenga testo in formato libero o in linguaggio naturale. I valori possibili vanno da 0 a 1.
Un punteggio elevato per il testo libero può aumentare i livelli di rischio e sensibilità dei dati di una colonna.
Metadati
I profili dati delle colonne forniscono i seguenti metadati:
- Database
- Il database contenente la colonna della tabella di cui è stato eseguito il profiling. Questo campo si applica solo al ricerca di Cloud SQL.
- Tipo di dati
- Il tipo di dati dei contenuti di questa colonna.
- ID set di dati
- ID del set di dati che contiene questa colonna della tabella.
- ID campo
- Nome della colonna.
- Istanza
- L'istanza contenente la colonna della tabella di cui è stato eseguito il profiling. Questo campo si applica solo al ricerca di Cloud SQL.
- Località istanza
- Posizione dell'istanza contenente la colonna della tabella di cui è stato eseguito il profiling. Questo campo si applica solo al rilevamento di Cloud SQL.
- Ultimo profilo generato
- Data e ora dell'ultima generazione del profilo.
- Tag di criteri
- Indica se alla colonna è applicato un tag di criteri. Per informazioni sulle best practice per l'utilizzo dei tag di criteri, consulta Utilizzare i tag di criteri in BigQuery.
- ID progetto
- ID del progetto contenente questa colonna della tabella.
- Nome risorsa
- Nome completo del profilo dati.
- Stato
- Icona che indica lo stato dell'operazione di profilazione.
- ID tabella
- ID della tabella contenente questa colonna.
Profili dati dell'archivio file
Sensitive Data Protection utilizza il termine file store per fare riferimento a un bucket di archiviazione file.
Ogni profilo dati dell'archivio file contiene i seguenti campi.
Approfondimenti
I profili dati dell'archivio file forniscono le seguenti informazioni:
- Rischio dei dati
- Livello di rischio associato ai dati nel loro stato attuale. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Cluster di file
- Fornisce un riepilogo per ogni cluster di file rilevato durante il profiling di questo repository. Per ulteriori informazioni su ogni riepilogo, consulta la sezione Riepiloghi dei cluster di file in questa pagina.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo spazio di archiviazione file. Per ulteriori informazioni, consulta Livelli di rischio dei dati e sensibilità.
Metadati
I profili dati dell'archivio file forniscono i seguenti metadati:
- Località di archiviazione dei dati
Se hai creato il profilo di un bucket Cloud Storage a due regioni, questo campo elenca le due regioni.
Se hai generato il profilo di un bucket Amazon S3, questo valore è la regione AWS in cui è archiviato il bucket.
- Crittografia
Se la crittografia di questo repository è gestita da Google o dalla tua organizzazione.
- Tipo di archivio file
Il tipo di dati di cui è stato creato il profilo: dati Cloud Storage o dati Amazon S3.
- Percorso archivio file
Il nome dell'archivio file.
- Ispeziona snapshot configurazione
Istantanea del modello di ispezione utilizzato per generare il profilo. Per ulteriori informazioni, consulta Snapshot dei profili dei dati.
- Tipo di posizione
Tipo di posizione in cui è archiviato il repository di file:
region
,dual-region
omulti-region
.- Data/ora creazione profilo
Data e ora in cui il profilo è stato creato per la prima volta.
- Ultima generazione del profilo
Data e ora dell'ultima generazione del profilo.
- ID principale
La risorsa proprietaria dei dati sottoposti a profilazione.
- Se il profilo dei dati è per una risorsa Google Cloud, si tratta dell'ID del progetto che contiene i dati.
- Se il profilo di dati è per un bucket Amazon S3, si tratta dell'ID dell'account AWS che contiene il bucket.
- Pubblico
Indica se questo archivio file è disponibile per tutti gli utenti o limitato a determinati utenti.
- Etichette risorse
Etichette dell'archivio file al momento della generazione del profilo.
- Tag di risorse
Tag dell'archivio file al momento della generazione del profilo.
- Località della risorsa
Regione o più regioni che contengono l'archivio file.
Se hai creato il profilo di un bucket Cloud Storage con doppia regione, questo valore dipende dal fatto che il bucket sia archiviato in una doppia regione predefinita:
- Per le regioni doppie predefinite, Sensitive Data Protection imposta questo valore sul nome della regione doppia predefinita.
- Per le regioni doppie standard, Sensitive Data Protection imposta questo valore sulla regione multipla che contiene le regioni doppie. Per informazioni su come le regioni vengono associate alle regioni multiple, consulta Regioni doppie.
- Nome risorsa
Nome completo del profilo dei dati.
- Stato
Indica se la generazione del profilo è riuscita.
Riepiloghi dei cluster di file
Quando viene generato un profilo dati dell'archivio file, i file vengono raggruppati in cluster. Sensitive Data Protection fornisce un riepilogo per ogni cluster di file.
Ogni riepilogo del cluster di file contiene i seguenti campi:
- Rischio dei dati
- Livello di rischio associato ai dati in questo cluster di file. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Errori
- Eventuali errori rilevati durante la generazione del profilo dati del file store.
- Estensioni dei file analizzate
- Elenco dei tipi di file rilevati e analizzati per generare il profilo dei dati dell'archivio file.
- Estensioni dei file rilevate
- Elenco dei tipi di file rilevati, ma non necessariamente analizzati.
- InfoType
- Elenco di infoType integrati e personalizzati che sono stati rilevati in questo cluster di file.
- Sensibilità
- Punteggio che indica il livello di sensibilità per questo cluster di file. Per ulteriori informazioni, consulta la sezione Livelli di rischio dei dati e sensibilità.
- Tipo
- Indica la categoria dei file in questo cluster. Per ulteriori informazioni su tutti i cluster di file supportati, consulta Cluster di file.