Kehadiran delta (kehadiran δ) adalah metrik yang mengukur probabilitas bahwa seseorang termasuk dalam set data yang dianalisis. Seperti peta-k, Anda dapat memperkirakan nilai kehadiran δ menggunakan Perlindungan Data Sensitif, yang menggunakan model statistik untuk memperkirakan set data serangan.
Kehadiran δ kontras dengan metode analisis risiko lainnya, yang set data serangannya diketahui secara eksplisit. Bergantung pada jenis data, Perlindungan Data Sensitif menggunakan set data yang tersedia secara publik (misalnya, dari sensus AS) atau model statistik kustom (misalnya, satu atau beberapa tabel BigQuery yang Anda tentukan), atau diekstrapolasi dari distribusi nilai dalam set data input Anda.
Topik ini menunjukkan cara menghitung nilai kehadiran δ untuk set data menggunakan Perlindungan Data Sensitif. Untuk mengetahui informasi selengkapnya tentang kehadiran δ atau analisis risiko secara umum, lihat topik konsep analisis risiko sebelum melanjutkan.
Sebelum memulai
Sebelum melanjutkan, pastikan Anda telah melakukan hal berikut:
- Login ke Akun Google Anda.
- Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud. Buka pemilih project
- Pastikan penagihan diaktifkan untuk project Google Cloud Anda. Pelajari cara mengonfirmasi bahwa penagihan diaktifkan untuk project Anda.
- Aktifkan Perlindungan Data Sensitif. Mengaktifkan Perlindungan Data Sensitif
- Pilih set data BigQuery yang akan dianalisis. Perlindungan Data Sensitif memperkirakan metrik kehadiran δ dengan memindai tabel BigQuery.
- Tentukan jenis set data yang ingin Anda gunakan untuk membuat model set data
serangan. Untuk informasi selengkapnya, lihat halaman referensi untuk objek
DeltaPresenceEstimationConfig
, serta Istilah dan teknik analisis risiko.
Menghitung metrik kehadiran δ
Untuk menghitung estimasi kehadiran δ menggunakan Perlindungan Data Sensitif, kirim permintaan ke URL berikut, dengan PROJECT_ID menunjukkan ID project Anda:
https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs
Permintaan berisi objek
RiskAnalysisJobConfig
, yang terdiri dari hal berikut:
Objek
PrivacyMetric
. Di sinilah Anda menentukan bahwa Anda ingin menghitung kehadiran δ dengan menentukan objekDeltaPresenceEstimationConfig
yang berisi hal berikut:quasiIds[]
: Wajib diisi. Kolom (objekQuasiId
) yang dianggap sebagai quasi-ID untuk dipindai dan digunakan untuk menghitung kehadiran δ. Tidak ada dua kolom yang dapat memiliki tag yang sama. Hal ini dapat berupa salah satu dari hal berikut:- infoType: Hal ini menyebabkan Sensitive Data Protection menggunakan set data publik yang relevan sebagai model statistik populasi, termasuk kode ZIP AS, kode wilayah, usia, dan gender.
- infoType kustom: Tag kustom tempat Anda menunjukkan tabel tambahan
(objek
AuxiliaryTable
) yang berisi informasi statistik tentang kemungkinan nilai kolom ini. - Tag
inferred
: Jika tidak ada tag semantik yang ditunjukkan, tentukaninferred
. Perlindungan Data Sensitif menyimpulkan model statistik dari distribusi nilai dalam data input.
regionCode
: Kode wilayah ISO 3166-1 alpha-2 untuk Perlindungan Data Sensitif yang akan digunakan dalam pemodelan statistik. Nilai ini wajib diisi jika tidak ada kolom yang diberi tag dengan infoType khusus wilayah (misalnya, kode pos AS) atau kode wilayah.auxiliaryTables[]
: Tabel tambahan (objekStatisticalTable
) yang akan digunakan dalam analisis. Setiap tag kustom yang digunakan untuk memberi tag pada kolom quasi-ID (dariquasiIds[]
) harus muncul di tepat satu kolom dari satu tabel tambahan.
Objek
BigQueryTable
. Tentukan tabel BigQuery yang akan dipindai dengan menyertakan semua hal berikut:projectId
: Project ID project yang berisi tabel.datasetId
: ID set data tabel.tableId
: Nama tabel.
Kumpulan satu atau beberapa objek
Action
, yang mewakili tindakan yang akan dijalankan, dalam urutan yang diberikan, pada penyelesaian tugas. Setiap objekAction
dapat berisi salah satu tindakan berikut:- Objek
SaveFindings
: Menyimpan hasil pemindaian analisis risiko ke tabel BigQuery. - Objek
PublishToPubSub
: Memublikasikan notifikasi ke topik Pub/Sub.
- Objek
PublishSummaryToCscc
: Menyimpan ringkasan hasil ke Security Command Center. - Objek
PublishFindingsToCloudDataCatalog
: Menyimpan hasil ke Data Catalog. - Objek
JobNotificationEmails
: Mengirimi Anda email berisi hasil. - Objek
PublishToStackdriver
: Menyimpan hasil ke Google Cloud Observability.
- Objek
Melihat hasil tugas kehadiran δ
Untuk mengambil hasil tugas analisis risiko kehadiran δ menggunakan REST API, kirim permintaan GET berikut ke resource projects.dlpJobs
. Ganti PROJECT_ID dengan project ID Anda dan
JOB_ID dengan ID tugas yang ingin Anda dapatkan hasilnya.
ID tugas ditampilkan saat Anda memulai tugas, dan juga dapat diambil dengan
mencantumkan semua tugas.
GET https://dlp.googleapis.com/v2/projects/PROJECT_ID/dlpJobs/JOB_ID
Permintaan menampilkan objek JSON yang berisi instance tugas. Hasil
analisis berada di dalam kunci "riskDetails"
, dalam
objek
AnalyzeDataSourceRiskDetails
. Untuk informasi selengkapnya, lihat referensi API untuk resource
DlpJob
.
Langkah selanjutnya
- Pelajari cara menghitung nilai k-anonymity untuk set data.
- Pelajari cara menghitung nilai l-diversity untuk set data.
- Pelajari cara menghitung nilai k-map untuk set data.