Anonimizzazione dei dati

L'anonimizzazione è il processo di rimozione delle informazioni identificative dai dati. L'API Cloud Healthcare rileva i dati sensibili nelle istanze DICOM e nelle risorse FHIR, ad esempio le informazioni sanitarie protette (PHI), quindi utilizza una trasformazione di anonimizzazione per mascherare, eliminare o nascondere in altro modo i dati. L'anonimizzazione ha diversi casi d'uso, tra cui:

  • Quando si condividono informazioni sanitarie con parti non autorizzate
  • Quando si creano set di dati da diverse fonti e li si analizzano
  • Quando è necessario anonimizzare i dati per utilizzarli in modelli di machine learning

Panoramica dell'anonimizzazione

L'anonimizzazione funziona ai seguenti livelli:

  • A livello di set di dati. L'anonimizzazione viene applicata a tutti i dati degli archivi DICOM e FHIR nel set di dati. Se un set di dati contiene sia istanze DICOM sia risorse FHIR, puoi anonimizzare tutte le istanze e le risorse contemporaneamente.

    Per anonimizzare i dati sensibili a livello di set di dati, chiama il metodo datasets.deidentify dell'API Cloud Healthcare.
  • A livello di datastore FHIR. L'anonimizzazione viene applicata a tutti i dati di un archivio FHIR specifico in un set di dati.

    Per anonimizzare i dati sensibili a livello di archivio FHIR, chiama il metodo fhirStores.deidentify dell'API Cloud Healthcare.
  • A livello di archivio DICOM. L'anonimizzazione viene applicata a tutti i dati di un determinato archivio DICOM in un set di dati.

    Per anonimizzare i dati sensibili a livello di archivio DICOM, chiama il metodo dicomStores.deidentify dell'API Cloud Healthcare.

L'anonimizzazione non influisce sul set di dati originale, sull'archivio FHIR, sull'archivio DICOM o sui dati originali. A seconda di come configuri l'anonimizzazione, l'operazione si comporta nel seguente modo:

  • Se anonimizzi i dati a livello di set di dati, le copie anonimizzate dei dati originali vengono scritte in un nuovo set di dati chiamato set di dati di destinazione.
  • Se anonimizzi i dati a livello di archivio DICOM o FHIR, le copie anonimizzate dei dati originali vengono scritte in un archivio DICOM o FHIR esistente in un set di dati esistente. L'archivio DICOM e l'archivio FHIR di output sono chiamati rispettivamente archivio DICOM di destinazione e archivio FHIR di destinazione.

Il set di dati di origine, l'archivio FHIR o l'archivio DICOM e il set di dati di destinazione, l'archivio FHIR o l'archivio DICOM devono trovarsi nella stessa posizione di Google Cloud. L'anonimizzazione dei dati su più località Google Cloud non è supportata.

Posizione dell'anonimizzazione

Quando l'API Cloud Healthcare anonimizza i dati, questi potrebbero essere elaborati in una posizione diversa da quella in cui si trovano i datastore FHIR o DICOM di origine e di destinazione. Al termine dell'anonimizzazione, i dati vengono archiviati nella stessa posizione di Google Cloud dell'archivio FHIR o DICOM di origine.

Anonimizzazione dei dati nella console Google Cloud

Puoi anonimizzare i dati di un set di dati, di un archivio FHIR o di un archivio DICOM dalla console Google Cloud. Per ulteriori informazioni, consulta Anonimizzazione dei dati nella console Google Cloud (DICOM) e Anonimizzazione dei dati nella console Google Cloud (FHIR).

Anonimizzazione DICOM

Un'istanza DICOM contiene un insieme di elementi di metadati chiave-valore (chiamati tag) e una o più immagini. L'operazione deidentify può rimuovere tag specifici che contengono dati sensibili, nonché utilizzare la funzione automatica di riconoscimento ottico dei caratteri (OCR) per oscurare il testo integrato delle immagini contenute nelle istanze DICOM.

Per esempi su come anonimizzare i dati DICOM, consulta Anonimizzazione dei dati DICOM.

Anonimizzazione FHIR

Ogni risorsa FHIR è un oggetto di tipo JSON che contiene elementi chiave-valore. Alcuni elementi sono standardizzati, mentre altri sono in testo libero. Puoi utilizzare l'operazione deidentify per ottenere uno dei seguenti risultati:

  • Rimuovere valori specifici nella risorsa

  • Elaborare parti di testo arbitrarie modo da rimuovere solo le sezioni sensibili, lasciando il resto dei dati così come è

Per esempi su come anonimizzare i dati FHIR, consulta Anonimizzazione dei dati FHIR.