Dokumen ini memberikan contoh yang menunjukkan cara menerima dan mengurai pemberitahuan tentang perubahan pada profil data Anda. Sensitive Data Protection mengirimkan update ini dalam bentuk pesan Pub/Sub.
Ringkasan
Anda dapat mengonfigurasi Perlindungan Data Sensitif untuk otomatis membuat profil tentang data di seluruh organisasi, folder, atau project. Profil data berisi metrik dan metadata tentang data Anda serta membantu menentukan lokasi data sensitif dan berisiko tinggi. Perlindungan Data Sensitif melaporkan metrik ini di berbagai tingkat detail. Untuk mengetahui informasi tentang jenis data yang dapat Anda buat profilnya, lihat Referensi yang didukung.
Saat mengonfigurasi profiler data, Anda dapat mengaktifkan opsi untuk memublikasikan pesan Pub/Sub setiap kali terjadi perubahan signifikan dalam profil data Anda. Pesan ini membantu Anda mengambil tindakan langsung sebagai respons terhadap perubahan tersebut. Berikut adalah peristiwa yang dapat Anda proses:
- Aset data dibuat profilnya untuk pertama kalinya.
- Profil diperbarui.
- Skor risiko atau sensitivitas profil meningkat.
- Ada error baru yang terkait dengan profil data Anda.
Pesan Pub/Sub yang dipublikasikan profiler data berisi objek DataProfilePubSubMessage
. Pesan ini selalu dikirim dalam format biner, sehingga Anda perlu menulis kode yang menerima dan mengurainya.
Harga
Saat menggunakan Pub/Sub, Anda akan ditagih sesuai dengan harga Pub/Sub.
Sebelum memulai
Halaman ini mengasumsikan hal berikut:
- Anda sudah memahami penggunaan Pub/Sub. Untuk pengantar, lihat panduan memulai Memublikasikan dan menerima pesan di Pub/Sub menggunakan konsol.
- Anda sudah memiliki konfigurasi pemindaian di tingkat organisasi, folder, atau project.
- Anda sudah memahami cara mengonfigurasi library klien Google Cloud .
Sebelum mulai mengerjakan contoh, ikuti langkah-langkah berikut:
Buat topik Pub/Sub dan tambahkan langganan untuk topik tersebut. Jangan tetapkan skema ke topik.
Untuk mempermudah, contoh di halaman ini hanya memproses satu langganan. Namun, dalam praktiknya, Anda dapat membuat topik dan langganan untuk setiap peristiwa yang didukung Perlindungan Data Sensitif.
Jika Anda belum melakukannya, konfigurasikan profiler data untuk memublikasikan pesan Pub/Sub:
Edit konfigurasi pemindaian Anda.
Di halaman Edit scan configuration, aktifkan opsi Publish to Pub/Sub dan pilih peristiwa yang ingin Anda dengarkan. Kemudian, konfigurasi setelan untuk setiap peristiwa.
Simpan konfigurasi pemindaian.
Berikan akses publikasi kepada agen layanan Perlindungan Data Sensitif di topik Pub/Sub. Contoh peran yang memiliki akses publikasi adalah peran Pub/Sub Publisher (
roles/pubsub.publisher
). Agen layanan Perlindungan Data Sensitif adalah alamat email dalam format:service-PROJECT_NUMBER@dlp-api.iam.gserviceaccount.com
Jika Anda menggunakan konfigurasi pemindaian tingkat organisasi atau folder, PROJECT_NUMBER adalah ID numerik dari penampung agen layanan. Jika Anda menggunakan konfigurasi pemindaian tingkat project, PROJECT_NUMBER adalah ID numerik project Anda.
Instal dan siapkan library klien Perlindungan Data Sensitif untuk Java atau Python.
Contoh
Contoh berikut menunjukkan cara menerima dan mengurai pesan Pub/Sub yang dipublikasikan profiler data. Anda dapat mengubah fungsi ini dan men-deploynya sebagai fungsi Cloud Run yang dipicu oleh peristiwa Pub/Sub. Untuk informasi selengkapnya, lihat Tutorial Pub/Sub (generasi ke-2).
Pada contoh berikut, ganti kode berikut:
- PROJECT_ID: ID project yang berisi langganan Pub/Sub.
- SUBSCRIPTION_ID: ID langganan Pub/Sub.
Java
import com.google.api.core.ApiService;
import com.google.cloud.pubsub.v1.AckReplyConsumer;
import com.google.cloud.pubsub.v1.MessageReceiver;
import com.google.cloud.pubsub.v1.Subscriber;
import com.google.privacy.dlp.v2.DataProfilePubSubMessage;
import com.google.protobuf.InvalidProtocolBufferException;
import com.google.pubsub.v1.ProjectSubscriptionName;
import com.google.pubsub.v1.PubsubMessage;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.TimeoutException;
public class DataProfilePubSubMessageParser {
public static void main(String... args) throws Exception {
String projectId = "PROJECT_ID";
String subscriptionId = "SUBSCRIPTION_ID";
int timeoutSeconds = 5;
// The `ProjectSubscriptionName.of` method creates a fully qualified identifier
// in the form `projects/{projectId}/subscriptions/{subscriptionId}`.
ProjectSubscriptionName subscriptionName =
ProjectSubscriptionName.of(projectId, subscriptionId);
MessageReceiver receiver =
(PubsubMessage pubsubMessage, AckReplyConsumer consumer) -> {
try {
DataProfilePubSubMessage message = DataProfilePubSubMessage.parseFrom(
pubsubMessage.getData());
System.out.println(
"PubsubMessage with ID: " + pubsubMessage.getMessageId()
+ "; message size: " + pubsubMessage.getData().size()
+ "; event: " + message.getEvent()
+ "; profile name: " + message.getProfile().getName()
+ "; full resource: " + message.getProfile().getFullResource());
consumer.ack();
} catch (InvalidProtocolBufferException e) {
e.printStackTrace();
}
};
// Create subscriber client.
Subscriber subscriber = Subscriber.newBuilder(subscriptionName, receiver).build();
try {
ApiService apiService = subscriber.startAsync();
apiService.awaitRunning();
System.out.printf("Listening for messages on %s for %d seconds.%n", subscriptionName,
timeoutSeconds);
subscriber.awaitTerminated(timeoutSeconds, TimeUnit.SECONDS);
} catch (TimeoutException ignored) {
} finally {
subscriber.stopAsync();
}
}
}
Python
from google.cloud import pubsub_v1
from concurrent.futures import TimeoutError
from google.cloud import dlp_v2
project_id = "PROJECT_ID"
subscription_id = "SUBSCRIPTION_ID"
timeout = 5.0
subscriber = pubsub_v1.SubscriberClient()
# The `subscription_path` method creates a fully qualified identifier
# in the form `projects/{project_id}/subscriptions/{subscription_id}`
subscription_path = subscriber.subscription_path(project_id, subscription_id)
def callback(message: pubsub_v1.subscriber.message.Message) -> None:
print(f"Received {message.data}.")
dlp_msg = dlp_v2.DataProfilePubSubMessage()
dlp_msg._pb.ParseFromString(message.data)
print("Parsed message: ", dlp_msg)
print("--------")
message.ack()
streaming_pull_future = subscriber.subscribe(subscription_path, callback=callback)
print(f"Listening for messages on {subscription_path} for {timeout} seconds...")
# Wrap subscriber in a 'with' block to automatically call close() when done.
with subscriber:
try:
# When `timeout` is not set, result() will block indefinitely,
# unless an exception is encountered first.
streaming_pull_future.result(timeout=timeout)
except TimeoutError:
streaming_pull_future.cancel() # Trigger the shutdown.
streaming_pull_future.result() # Block until the shutdown is complete.
print("Done waiting.")
Langkah selanjutnya
- Pelajari profil data lebih lanjut.
- Pelajari cara membuat konfigurasi pemindaian di tingkat organisasi, folder, atau project.
- Ikuti tutorial yang menunjukkan cara menulis, men-deploy, dan memicu fungsi Cloud Run sederhana yang dipicu peristiwa dengan pemicu Pub/Sub.