Menghitung δ-kehadiran untuk set data

Kehadiran delta (δ-presence) adalah metrik yang mengukur probabilitas bahwa seseorang termasuk dalam set data yang dianalisis. Seperti peta k, Anda dapat memperkirakan nilai kehadiran δ menggunakan Perlindungan Data Sensitif, yang menggunakan model statistik untuk memperkirakan set data serangan.

Kehadiran δ berbeda dengan metode analisis risiko lainnya, yang dataset serangannya diketahui secara eksplisit. Bergantung pada jenis data, Perlindungan Data Sensitif menggunakan set data yang tersedia secara publik (misalnya, dari Sensus AS) atau model statistik kustom (misalnya, satu atau beberapa tabel BigQuery yang Anda tentukan), atau mengekstrapolasi dari distribusi nilai dalam set data input Anda.

Topik ini menunjukkan cara menghitung nilai kehadiran δ untuk set data menggunakan Sensitive Data Protection. Untuk mengetahui informasi selengkapnya tentang analisis risiko atau kehadiran δ secara umum, lihat topik konsep analisis risiko sebelum melanjutkan.

Sebelum memulai

Sebelum melanjutkan, pastikan Anda telah melakukan hal berikut:

  1. Login ke Akun Google Anda.
  2. Di konsol Google Cloud , pada halaman pemilih project, pilih atau buat Google Cloud project.
  3. Buka pemilih project
  4. Pastikan penagihan diaktifkan untuk Google Cloud project Anda. Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda.
  5. Aktifkan Sensitive Data Protection.
  6. Mengaktifkan Sensitive Data Protection

  7. Pilih set data BigQuery yang akan dianalisis. Sensitive Data Protection memperkirakan metrik kehadiran δ dengan memindai tabel BigQuery.
  8. Tentukan jenis set data yang ingin Anda gunakan untuk memodelkan set data serangan. Untuk mengetahui informasi selengkapnya, lihat halaman referensi untuk objek DeltaPresenceEstimationConfig, serta Istilah dan teknik analisis risiko.

Menghitung metrik kehadiran δ

Untuk menghitung estimasi kehadiran δ menggunakan Perlindungan Data Sensitif, kirim permintaan ke URL berikut, dengan PROJECT_ID menunjukkan project ID Anda:

https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs

Permintaan berisi objek RiskAnalysisJobConfig, yang terdiri dari berikut ini:

  • Objek PrivacyMetric. Di sinilah Anda menentukan bahwa Anda ingin menghitung kehadiran δ dengan menentukan objek DeltaPresenceEstimationConfig yang berisi hal berikut:

    • quasiIds[]: Wajib diisi. Kolom (objek QuasiId) yang dianggap sebagai kuasi-pengidentifikasi untuk dipindai dan digunakan untuk menghitung kehadiran δ. Tidak ada dua kolom yang dapat memiliki tag yang sama. Nilainya dapat berupa salah satu dari berikut:

      • infoType: Hal ini menyebabkan Sensitive Data Protection menggunakan set data publik yang relevan sebagai model statistik populasi, termasuk kode ZIP AS, kode wilayah, usia, dan gender.
      • infoType kustom: Tag kustom tempat Anda menunjukkan tabel tambahan (objek AuxiliaryTable) yang berisi informasi statistik tentang kemungkinan nilai kolom ini.
      • Tag inferred: Jika tidak ada tag semantik yang ditunjukkan, tentukan inferred. Perlindungan Data Sensitif menyimpulkan model statistik dari distribusi nilai dalam data input.
    • regionCode: Kode wilayah alpha-2 ISO 3166-1 yang akan digunakan Sensitive Data Protection dalam pemodelan statistik. Nilai ini wajib diisi jika tidak ada kolom yang diberi tag dengan infoType khusus wilayah (misalnya, kode pos AS) atau kode wilayah.

    • auxiliaryTables[]: Tabel tambahan (objek StatisticalTable) yang akan digunakan dalam analisis. Setiap tag kustom yang digunakan untuk memberi tag pada kolom kuasi-ID (dari quasiIds[]) harus muncul di tepat satu kolom dari satu tabel tambahan.

  • Objek BigQueryTable. Tentukan tabel BigQuery yang akan dipindai dengan menyertakan semua hal berikut:

    • projectId: Project ID project yang berisi tabel.
    • datasetId: ID set data tabel.
    • tableId: Nama tabel.
  • Kumpulan satu atau beberapa objek Action, yang merepresentasikan tindakan yang akan dijalankan, dalam urutan yang diberikan, setelah penyelesaian tugas. Setiap objek Action dapat berisi salah satu tindakan berikut:

Melihat hasil tugas deteksi kehadiran δ

Untuk mengambil hasil tugas analisis risiko kehadiran δ menggunakan REST API, kirim permintaan GET berikut ke resource projects.dlpJobs. Ganti PROJECT_ID dengan project ID Anda dan JOB_ID dengan ID tugas yang ingin Anda peroleh hasilnya. ID pekerjaan ditampilkan saat Anda memulai pekerjaan, dan juga dapat diambil dengan mencantumkan semua pekerjaan.

GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID

Permintaan menampilkan objek JSON yang berisi instance tugas. Hasil analisis berada di dalam kunci "riskDetails", dalam objek AnalyzeDataSourceRiskDetails. Untuk informasi selengkapnya, lihat referensi API untuk resource DlpJob.

Langkah berikutnya

  • Pelajari cara menghitung nilai k-anonymity untuk set data.
  • Pelajari cara menghitung nilai l-diversity untuk set data.
  • Pelajari cara menghitung nilai k-map untuk set data.