Menggunakan Dataplex Universal Catalog Attribute Store

Dokumen ini menjelaskan cara menggunakan Dataplex Universal Catalog Attribute Store.

Bermigrasi dari Attribute Store ke tag dan kondisi IAM

Untuk bermigrasi dari Attribute Store, Anda mengganti fungsi Attribute Store dengan tag, tag kebijakan, dan kondisi IAM.

Ringkasan Attribute Store

Attribute Store Katalog Universal Dataplex adalah infrastruktur yang dapat di-extend yang memungkinkan Anda menentukan perilaku terkait kebijakan pada resource terkait. Administrator Dataplex Universal Catalog dapat menggunakan Attribute Store untuk menentukan cara memperlakukan data tertentu, dengan mengaitkan data dengan atribut.

Dengan menggunakan Attribute Store, Anda dapat menambahkan beberapa atribut ke objek, seperti kolom. Attribute Store menggabungkan perilaku semua atribut yang terkait dengan objek dan menampilkannya sebagai satu kebijakan pada resource pokok.

Anda dapat menyetel atribut ke set data yang dipublikasikan. Set data yang dipublikasikan merujuk pada set data yang dibuat oleh Dataplex Universal Catalog dari tabel yang ditemukan dalam aset bucket.

Perilaku kebijakan berikut didukung:

  • Spesifikasi resource: menentukan akses ke resource, seperti tabel
  • Spesifikasi kolom: menentukan akses ke kolom dalam tabel BigQuery

Anda dapat menggunakan Penyimpanan Atribut untuk menentukan hierarki atribut yang disebut taksonomi. Dalam taksonomi, atribut turunan mewarisi spesifikasi dari hierarki atribut induk. Spesifikasi dari induk dan turunan digabungkan ke dalam daftar terpadu, yang disebarkan ke resource.

Anda dapat menggunakan Penyimpanan Atribut Katalog Universal Dataplex untuk melakukan hal berikut:

  • Buat taksonomi.
  • Buat atribut dan atur dalam hierarki.
  • Mengaitkan satu atau beberapa atribut ke tabel.
  • Kaitkan satu atau beberapa atribut ke kolom.

Terminologi

Bagian ini menjelaskan terminologi yang digunakan dalam dokumen ini.

Taksonomi atribut

Taksonomi data adalah hierarki atribut. Dalam taksonomi, atribut di node induk memungkinkan atribut di bawahnya (atribut turunan) mewarisi dan menambahkan spesifikasi perilaku atribut induk ke atributnya sendiri.

Misalnya: Jika atribut bernama PII memiliki spesifikasi resource group-a@company.com dan atribut turunan PII bernama Social Security numbers memiliki spesifikasi resource group-b@company.com, maka spesifikasi resource yang diterapkan ke kebijakan tempat atribut Social Security numbers dikaitkan, akan menjadi group-a@company.com dan group-b@company.com.

Saat menentukan atribut, Anda dapat memilih apakah atribut tersebut merupakan atribut induk atau turunan. Saat menentukan atribut turunan, Anda harus menentukan atribut induknya.

Spesifikasi kolom

Spesifikasi perilaku untuk kolom. Menentukan orang atau grup yang memiliki akses pembaca ke kolom. Jika Anda mengaitkan atribut yang berisi spesifikasi kolom dengan kolom tabel, atribut tersebut akan menambahkan tag kebijakan kolom BigQuery ke kolom tersebut.

Spesifikasi resource

Izin bagi orang atau grup untuk mengakses resource (tabel). Jika Anda mengaitkan atribut dengan spesifikasi resource, Dataplex Universal Catalog akan menyebarkan peran IAM kepada pengguna yang ditentukan untuk mengakses tabel yang terkait dengan atribut tersebut.

Sebelum memulai

Batasan

Dataplex Universal Catalog menyebarkan kebijakan spesifikasi kolom sebagai tag kebijakan BigQuery. BigQuery memiliki batasan satu tag kebijakan per kolom. Jika tag kebijakan sudah ada di kolom, Dataplex Universal Catalog akan menampilkan error di log Tata Kelola pada tab Kelola.

Kuota

Berikut adalah kuota dan batas yang berlaku untuk Attribute Store Katalog Universal Dataplex:

Batas Default
Jumlah maksimum taksonomi dalam suatu wilayah 100
Jumlah maksimum atribut di semua taksonomi dalam suatu wilayah 10.000
Jumlah maksimum atribut yang dapat dikaitkan dengan resource (tabel) 50
Jumlah maksimum atribut yang dapat dikaitkan dengan kolom 100
Kedalaman maksimum per pohon atribut data dalam taksonomi atribut 4

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk menggunakan penyimpanan atribut Katalog Universal Dataplex, minta administrator untuk memberi Anda peran IAM berikut pada project:

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk menggunakan penyimpanan atribut Katalog Universal Dataplex. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk menggunakan penyimpanan atribut Dataplex Universal Catalog:

  • Mengelola taksonomi dan atribut:
    • dataplex.datataxonomies.*
    • dataplex.dataattributes.* (except dataplex.dataattributes.configureResourceAccess and dataplex.dataattributes.configureDataAccess)
  • Melihat binding yang terkait dengan resource dan atribut:
    • dataplex.datataxonomies.get
    • dataplex.datataxonomies.list
    • dataplex.dataattributes.get
    • dataplex.dataattributes.list
    • dataplex.dataattributebindings.get
    • dataplex.dataattributebindings.list
  • Membuat dan mengelola resource binding dalam project: dataplex.dataattributebindings.*
  • Mengelola spesifikasi akses data dan resource:
    • dataplex.datataxonomies.configureResourceAccess
    • dataplex.datataxonomies.configureDataAccess

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Contoh kasus penggunaan

Pertimbangkan perusahaan bernama ACME yang memiliki tiga jenis data:

  • Red data yang sensitif
  • Green data yang dibatasi, tetapi kurang sensitif
  • Data yang tidak dikategorikan

Administrator Dataplex Universal Catalog ACME membuat kumpulan atribut berikut:

  • Atribut: Red

    • Spesifikasi kolom: secrets_team@acme dengan izin baca
    • Spesifikasi resource: secrets_team@acme dan tenured_employees@acme dengan izin baca
  • Atribut: Green

    • Spesifikasi kolom: full_time_employees@acme dengan izin baca
    • Spesifikasi resource: full_time_employees@acme dengan izin edit

Gambar ini berisi spesifikasi kolom dan resource untuk atribut Merah dan Hijau.

Atribut Red dan Green mengontrol perilaku akses ke resource (tabel) bergantung pada atribut yang terkait dengan tabel dan kolomnya.

Pertimbangkan tabel dengan kolom berikut:

  • ID
  • Kode pos
  • Nama
  • Alamat
  • $Nilai

Kasus penggunaan 1: Mengaitkan atribut yang sama dengan tabel dan kolom

Gambar ini menunjukkan atribut Merah yang dikaitkan dengan tabel dan kolom Nama.

Jika Anda mengaitkan atribut Red dengan tabel dan kolom Name, Dataplex Universal Catalog akan menyebarkan kebijakan berikut:

  • Karyawan di secrets_team@acme dan tenured_employees@acme dapat membaca tabel, melihat metadatanya, dan membuat kueri.
  • Hanya karyawan di secrets_team@acme yang dapat membuat kueri kolom Name, karena kolom tersebut dilindungi lebih lanjut oleh spesifikasi kolom.

Kasus penggunaan 2: Menggabungkan atribut

Pertimbangkan asosiasi berikut:

  • Kaitkan atribut Red dan Green dengan tabel.
  • Kaitkan atribut Red dan Green dengan kolom Nama.
  • Kaitkan atribut Red dengan kolom $Value.

Gambar ini menunjukkan atribut Merah dan Hijau yang dikaitkan dengan tabel dan kolom Nama, serta atribut Merah yang dikaitkan dengan kolom $value

Dalam hal ini, Katalog Universal Dataplex menyebarluaskan kebijakan berikut:

  • Karyawan di secrets_team@acme, tenured_employees@acme, dan full_time_employees@acme dapat mengakses tabel. Hal ini karena Dataplex Universal Catalog menggabungkan spesifikasi resource atribut Red dan Green.
  • Karyawan di secrets_team@acme dan full_time_employees@acme dapat mengakses kolom Nama. Hal ini karena Dataplex Universal Catalog menggabungkan spesifikasi kolom atribut Red dan Green.
  • Hanya karyawan di secrets_team@acme yang dapat membuat kueri kolom $Value.

Kasus penggunaan 3: Mengatur atribut dalam hierarki

Anda dapat mengatur atribut dalam hierarki dengan menentukan subtipe atribut. Pertimbangkan kumpulan atribut berikut:

Atribut induk 1:
Atribut: PII

  • Spesifikasi kolom: secrets_team@acme
  • Spesifikasi resource: secrets_team@acme dan tenured_employees@acme

Atribut turunan dari PII:
Atribut: Email

  • Spesifikasi kolom: email_comm@acme
  • Spesifikasi resource: email_comm@acme

Atribut induk 2:
Atribut: Financial

  • Spesifikasi kolom: full_time_employees@acme
  • Spesifikasi resource: full_time_employees@acme

Gambar ini menunjukkan contoh hierarki atribut.

Pertimbangkan asosiasi berikut:

  • Kaitkan atribut Email dan Financial dengan tabel.
  • Kaitkan atribut Email dan Financial dengan kolom Nama.
  • Kaitkan atribut PII dengan kolom $Value.

Gambar ini menunjukkan cara atribut dalam hierarki dapat dikaitkan dengan tabel dan kolom.

Dalam hal ini, Katalog Universal Dataplex menyebarluaskan kebijakan berikut:

  • Karyawan di secrets_team@acme, tenured_employees@acme, full_time_employees@acme, dan email_comm@acme dapat mengakses tabel. Hal ini terjadi karena Dataplex Universal Catalog menggabungkan spesifikasi resource dari atribut Financial dan Email, dan atribut Email mewarisi spesifikasi dari atribut PII.
  • Karyawan di secrets_team@acme, email_comm@acme, full_time_employees@acme dapat mengakses kolom Nama. Hal ini karena Katalog Universal Dataplex menggabungkan spesifikasi kolom atribut Financial dan Email.
  • Hanya karyawan di secrets_team@acme yang dapat membuat kueri kolom $Value.

Menyiapkan atribut

Untuk membuat atribut, Anda harus membuat taksonomi terlebih dahulu, lalu membuat atribut data induk dan turunan.

Membuat taksonomi atribut data

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Klik Buat Taksonomi.

  3. Masukkan Nama taksonomi, ID, dan Deskripsi.

  4. Pilih wilayah.

  5. Klik Kirim.

    Taksonomi baru akan muncul di halaman Taksonomi Data.

Membuat atribut induk

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Di halaman Taksonomi Data, klik taksonomi tempat Anda ingin membuat atribut induk.

  3. Di halaman Detail taksonomi, klik Tambahkan atribut data.

  4. Pilih Buat atribut data induk.

  5. Masukkan nama, ID, dan deskripsi untuk atribut induk.

  6. Opsional: Siapkan spesifikasi atribut.

    1. Menyiapkan spesifikasi resource:

      1. Klik Kelola Izin untuk Sumber Daya.
      2. Klik Tambahkan.
      3. Di kolom New principals, masukkan alamat email orang atau grup yang memerlukan akses ke resource.
      4. Pilih Peran yang diperlukan, lalu klik Simpan.
      5. Klik Simpan.
    2. Menyiapkan spesifikasi kolom:

      1. Klik Kelola Izin untuk Kolom.
      2. Klik Tambahkan.
      3. Di kolom New principals, masukkan alamat email orang atau grup yang memerlukan akses ke kolom.
      4. Pilih Peran yang diperlukan, lalu klik Simpan.
      5. Klik Simpan.
  7. Klik Buat.

Membuat atribut anak

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Di halaman Taksonomi Data, klik taksonomi tempat Anda ingin membuat atribut turunan.

  3. Di halaman Detail taksonomi, klik Tambahkan atribut data.

  4. Pilih Buat atribut data turunan.

  5. Pilih Atribut data induk untuk atribut anak yang Anda buat.

  6. Masukkan nama, ID, dan deskripsi untuk atribut turunan.

  7. Opsional: Siapkan spesifikasi atribut.

    1. Menyiapkan spesifikasi resource:

      1. Klik Kelola Izin untuk Sumber Daya.
      2. Klik Tambahkan.
      3. Di kolom New principals, masukkan alamat email orang atau grup yang memerlukan akses ke resource.
      4. Pilih Peran yang diperlukan, lalu klik Simpan.
      5. Klik Simpan.
    2. Menyiapkan spesifikasi kolom:

      1. Klik Kelola Izin untuk Kolom.
      2. Klik Tambahkan.
      3. Di kolom New principals, masukkan alamat email orang atau grup yang memerlukan akses ke kolom.
      4. Pilih Peran yang diperlukan, lalu klik Simpan.
      5. Klik Simpan.
  8. Klik Buat.

Memperbarui resource Attribute Store

Memperbarui detail taksonomi

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Klik taksonomi yang ingin Anda perbarui.

  3. Klik Edit.

  4. Edit nama taksonomi dan deskripsinya sesuai kebutuhan.

  5. Klik Kirim.

Memperbarui detail atribut

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Klik taksonomi yang berisi atribut yang ingin Anda perbarui.

  3. Klik atribut yang ingin Anda perbarui.

  4. Untuk memperbarui nama dan deskripsi atribut, klik Edit.

    1. Jika Anda memperbarui atribut induk, Anda memiliki opsi untuk memperbaruinya ke atribut turunan, dan sebaliknya. Pilih opsi yang sesuai.
    2. Edit nama atribut dan deskripsinya sesuai kebutuhan.
    3. Klik Perbarui.
  5. Untuk memperbarui spesifikasi resource untuk atribut, klik Edit untuk Spesifikasi resource.

    1. Untuk menambahkan prinsipal baru, ikuti langkah-langkah berikut:

      1. Klik Tambahkan.
      2. Di kolom New Principals, masukkan alamat email orang atau grup yang memerlukan akses ke resource.
      3. Pilih Peran yang diperlukan.
      4. Klik Simpan.
    2. Untuk memperbarui prinsipal yang ada, ikuti langkah-langkah berikut:

      1. Untuk prinsipal yang ingin Anda perbarui, klik Edit.
      2. Pilih Peran yang diperlukan.
      3. Klik Simpan.
    3. Untuk menghapus principal yang ada, ikuti langkah-langkah berikut:

      1. Pilih akun utama yang ingin Anda hapus.
      2. Klik Hapus.
  6. Untuk memperbarui spesifikasi kolom untuk atribut, klik Edit untuk Spesifikasi kolom.

    1. Untuk menambahkan prinsipal baru, ikuti langkah-langkah berikut:

      1. Klik Tambahkan.
      2. Di kolom New Principals, masukkan alamat email orang atau grup yang memerlukan akses ke kolom.
      3. Pilih Peran yang diperlukan.
      4. Klik Simpan.
    2. Untuk memperbarui prinsipal yang ada, ikuti langkah-langkah berikut:

      1. Untuk prinsipal yang ingin Anda perbarui, klik Edit.
      2. Pilih Peran yang diperlukan.
      3. Klik Simpan.
    3. Untuk menghapus principal yang ada, ikuti langkah-langkah berikut:

      1. Pilih akun utama yang ingin Anda hapus.
      2. Klik Hapus.

Mengaitkan atribut dengan resource

Mengaitkan atribut dengan tabel

  1. Di konsol Google Cloud , buka halaman Attribute Store Dataplex Universal Catalog.

    Buka Toko Atribut

  2. Klik taksonomi yang berisi atribut.

  3. Klik atribut yang ingin Anda kaitkan dengan tabel.

  4. Klik tab Resources.

  5. Klik Tambahkan Fasilitas.

  6. Pilih tabel dari daftar.

  7. Klik Pilih.

Mengaitkan atribut dengan kolom

  1. Di konsol Google Cloud , buka halaman Penelusuran Data Catalog.

    Buka Penelusuran

  2. Telusuri dan pilih tabel yang ingin Anda kaitkan atributnya dengan kolom.

  3. Klik tab Schema and Column Tags.

  4. Untuk kolom yang ingin Anda kaitkan dengan atribut, di Tag Kebijakan, klik Tambahkan.

  5. Pilih taksonomi yang berisi atribut.

  6. Pilih atribut.

  7. Klik Lampirkan.

Langkah berikutnya