Un rilevatore personalizzato di tipo di informazioni (infoType) con espressione regolare (regex) ti consente di creare i tuoi rilevatori che consentono a Sensitive Data Protection di rilevare le corrispondenze in base a un pattern regex. Ad esempio, supponiamo che tu abbia i numeri delle cartelle cliniche nel
modulo ###-#-#####
. Puoi definire un pattern regex come il seguente:
[0-9]{3}-[0-9]{1}-[0-9]{5}
Sensitive Data Protection assocerebbe quindi elementi come i seguenti:
012-4-56789
Anatomia di un rilevatore di infoType personalizzato regex
Come descritto nella Panoramica dell'API, per creare un rilevatore di tipo di infoType regex personalizzato, definisci un oggetto CustomInfoType
che contiene quanto segue:
- Il nome che vuoi assegnare al rilevatore di InfoType personalizzato all'interno di un oggetto
InfoType
. - Un valore
Likelihood
facoltativo. Se ometti questo campo, le corrispondenze regex restituiranno una probabilità predefinita diVERY_LIKELY
. Se noti che un rilevatore di infoType personalizzato regex restituisce troppi falsi positivi, prova a ridurre la probabilità di base e a utilizzare le regole di rilevamento per aumentarla utilizzando le informazioni contestuali. Per scoprire di più, consulta la sezione Personalizzare la probabilità di rilevamento. DetectionRule
facoltativi o regole hotword. Queste regole regolano la probabilità di risultati all'interno di una determinata vicinanza alle parole chiave specifiche. Scopri di più sulle regole per hotword in Personalizzare la probabilità di trovare.Un valore
SensitivityScore
facoltativo. Se ometti questo campo, le corrispondenze all'espressione regolare restituiranno un livello di sensibilità predefinito diHIGH
.I punteggi di sensibilità vengono utilizzati nei profili dei dati. Quando esegue il profilo dei tuoi dati, Sensitive Data Protection utilizza i punteggi di sensibilità degli infoType per calcolare il livello di sensibilità.
Un oggetto
Regex
costituito da un singolo pattern che definisce l'espressione regolare.
Come oggetto JSON, un rilevatore di infoType personalizzato con regex che include tutti i componenti facoltativi ha il seguente aspetto:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
Esempio di regex: corrispondenza dei numeri di cartelle cliniche
Il seguente snippet JSON e codice in diversi linguaggi mostrano un rilevatore di infoType personalizzato con espressioni regolari che indica a Sensitive Data Protection di associare un numero di record medico (MRN) nel testo di input "MRN del paziente 444-5-22222" e assegna a ogni corrispondenza una probabilità di POSSIBLE
.
C#
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Go
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
PHP
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Sensitive Data Protection, consulta Librerie client di Sensitive Data Protection.
Per autenticarti a Sensitive Data Protection, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
REST
Per ulteriori informazioni sull'utilizzo dell'API DLP con JSON, consulta la guida introduttiva JSON.
Input JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
Output JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
L'output mostra che, utilizzando il rilevatore di infoType personalizzato a cui abbiamo assegnato il nome
C_MRN
e la relativa regex personalizzata, Sensitive Data Protection ha correttamente
identificato il numero di record medico e gli ha assegnato un'affidabilità di POSSIBLE
,
come abbiamo specificato.
La personalizzazione della probabilità di corrispondenza si basa su questo esempio per includere le parole di contesto.