Transisi dari Data Catalog ke katalog universal (Dataplex Catalog)

Jika menggunakan Data Catalog, Anda dapat mentransisikan konten dan penggunaan Data Catalog ke katalog universal BigQuery dengan mengikuti langkah-langkah yang dijelaskan dalam dokumen ini.

Jika Anda baru menggunakan katalog, mulailah dengan katalog universal dengan mengonfigurasinya sebagai pengalaman katalog default Anda.

Dokumen ini ditujukan untuk administrator data dan pengelola data.

Katalog universal memiliki antarmuka web dan API baru. Dengan beralih ke katalog universal, beban kerja dan pengguna Anda saat ini dan di masa mendatang dapat memanfaatkan fitur dan kemampuannya yang ditingkatkan. Untuk mengetahui informasi selengkapnya, lihat Ringkasan katalog universal.

Untuk perbandingan katalog universal dan Data Catalog, lihat Katalog universal versus Data Catalog.

Sebelum memulai transisi, tinjau fitur yang tidak didukung di katalog universal.

Ringkasan transisi

Halaman Kelola transisi ke Dataplex di Google Cloud konsol menyediakan satu titik akses untuk mengelola transisi.

Bagian ini menjelaskan berbagai skenario transisi dan menguraikan proses transisi untuk setiap skenario.

Jika Anda tidak memiliki metadata kustom di Data Catalog atau jika Anda belum pernah menggunakan Data Catalog

Jika Anda menggunakan Katalog Data dan tidak memiliki metadata kustom, seperti tag, template tag, entri kustom, atau grup entri, atau jika Anda belum pernah menggunakan Katalog Data, selesaikan transisi dengan menetapkan pengalaman UI katalog default ke katalog universal.

Jika Anda memiliki metadata kustom Data Catalog atau beban kerja terprogram

Jika Anda menggunakan Data Catalog dengan metadata kustom (seperti tag, template tag, entri kustom, atau grup entri), Dataplex dapat otomatis mengimpor metadata kustom ini ke katalog universal sebagai read-only. Untuk mengaktifkan kemampuan ini, perubahan konfigurasi diperlukan seperti yang diuraikan dalam fase persiapan.

Fase kedua adalah fase transfer, saat status aktif (read-write) metadata kustom Anda dipindahkan ke katalog universal. Selama fase ini, Anda juga harus mengupdate workload terprogram (seperti API, library klien, modul Terraform, dan perintah Google Cloud CLI) untuk berinteraksi dengan katalog universal.

Berikut adalah detail lebih lanjut tentang setiap fase proses transisi:

  1. Fase persiapan: lakukan tugas konfigurasi yang diperlukan agar konten Data Catalog tersedia secara bersamaan di katalog universal sebagai read-only. Selama fase ini, Data Catalog tetap menjadi sumber tepercaya untuk konten metadata Anda.

    Fase persiapan mencakup tugas-tugas berikut:

    1. Perbarui template tag pribadi Data Catalog menjadi publik.
    2. Ikut serta dalam template tag dan tag untuk ketersediaan metadata secara bersamaan di katalog universal.
    3. Konfigurasikan izin IAM Dataplex untuk metadata kustom Anda.

    Untuk mengetahui informasi selengkapnya, lihat Fase persiapan.

  2. Fase transfer: pindahkan penggunaan katalog dan status aktif (read-write) metadata kustom Anda ke katalog universal.

    Fase transfer mencakup tugas-tugas berikut:

    1. Menetapkan pengalaman UI katalog default ke katalog universal.
    2. Transfer metadata kustom Data Catalog ke katalog universal.

      Anda harus menunggu minimal 48 jam setelah mengaktifkan template tag dan tag sebelum dapat mentransfer metadata kustom. Waktu ini diperlukan untuk pemrosesan internal.

    3. Memperbarui beban kerja terprogram.

    Setelah menyelesaikan fase transfer, katalog universal menjadi sumber tepercaya untuk semua metadata dan Anda tidak perlu menggunakan Data Catalog.

    Untuk mengetahui informasi selengkapnya, lihat Fase transfer.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk bertransisi dari Data Catalog ke katalog universal, berikan peran IAM berikut pada resource:

  • Memperbarui template tag pribadi menjadi publik: Data Catalog TagTemplate Owner (roles/datacatalog.tagTemplateOwner)

    Peran yang telah ditentukan ini berisi izin datacatalog.tagTemplates.update, yang diperlukan untuk memperbarui template tag pribadi menjadi publik.

  • Mengaktifkan template tag dan tag publik untuk ketersediaan metadata secara bersamaan di katalog universal: DataCatalog Migration Config Admin (roles/datacatalog.migrationConfigAdmin)

    Peran yang telah ditentukan ini berisi izin datacatalog.migrationConfig.set, yang diperlukan untuk mengaktifkan template tag dan tag.

  • Menetapkan pengalaman UI katalog default ke katalog universal: DataCatalog Migration Config Admin (roles/datacatalog.migrationConfigAdmin)

    Peran yang telah ditentukan ini berisi izin datacatalog.migrationConfig.set, yang diperlukan untuk menetapkan pengalaman UI katalog default.

  • Mentransfer template tag publik Data Catalog ke katalog universal: Data Catalog TagTemplate Owner (roles/datacatalog.tagTemplateOwner)

    Peran yang telah ditentukan ini berisi izin datacatalog.tagTemplates.update, yang diperlukan untuk mentransfer template tag publik.

  • Mentransfer grup entri Katalog Data ke katalog universal: DataCatalog EntryGroup Owner (roles/datacatalog.entryGroupOwner)

    Peran bawaan ini berisi izin datacatalog.entryGroups.update, yang diperlukan untuk mentransfer grup entri.

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan dengan peran khusus atau peran bawaan lainnya.

Fase persiapan

Fase ini melibatkan tugas untuk membuat konten metadata Data Catalog tersedia secara bersamaan di katalog universal, dalam mode read-only.

Berikut adalah poin-poin penting yang perlu diingat selama fase persiapan:

  • Data Catalog tetap menjadi sumber tepercaya untuk metadata kustom Anda.
  • Halaman Penelusuran Dataplex mengarah ke penelusuran Data Catalog secara default, yang hanya menyertakan metadata Data Catalog dan bukan metadata katalog universal.
  • Penelusuran katalog universal mungkin tidak menyertakan semua template dan tag publik Data Catalog hingga Anda menyelesaikan fase persiapan.

Grup entri kustom Data Catalog dan entrinya sudah tersedia secara bersamaan di katalog universal sebagai read-only. Saat Anda mengaktifkan template dan tag publik pada fase persiapan, kontennya akan tersedia secara bersamaan di katalog universal sebagai read-only.

Tabel berikut menunjukkan pemetaan antara resource Data Catalog dan katalog universal saat resource Data Catalog tersedia secara bersamaan di katalog universal:

Pemetaan antara Katalog Data dan katalog universal
Referensi Data Catalog Resource katalog universal yang sesuai Deskripsi
Template tag Jenis aspek (global)

Template tag di Data Catalog adalah resource regional. Saat Anda mengaktifkan template tag, kontennya akan tersedia secara bersamaan sebagai jenis aspek global di katalog universal. Hal ini dilakukan untuk mempertahankan referensi lintas regional antara tag dan template tag. Definisi jenis aspek global direplikasi ke semua Google Cloud region.

Konsep standar seperti Schema direpresentasikan oleh jenis aspek sistem, yang disediakan oleh Dataplex. Untuk mengetahui informasi selengkapnya, lihat Kategori jenis aspek.

Tag Aspek opsional Saat Anda mengaktifkan template tag, tagnya akan tersedia secara bersamaan sebagai aspek opsional di katalog universal. Untuk mengetahui informasi selengkapnya, lihat Kategori aspek.
Grup entri Grup entri Grup entri untuk entri sistem dibuat per project per region di katalog universal. Grup entri yang dibuat di Data Catalog akan tersedia secara bersamaan di katalog universal.
Entri kustom Entri kustom Semua entri kustom di Data Catalog tersedia secara bersamaan sebagai entri GenericEntryType di katalog universal. Untuk informasi selengkapnya, lihat Kategori jenis entri.
Entri sistem (Google Cloud) Aspek yang diperlukan entri sistem Metadata yang menjelaskan entri sistem, seperti Schema untuk tabel BigQuery, diambil dalam aspek yang diperlukan dari jenis aspek yang ditentukan sistem.

Memperbarui template tag pribadi Data Catalog menjadi publik

Katalog universal tidak mendukung konsep aspek pribadi (padanan dengan tag pribadi). Oleh karena itu, template tag dan tag pribadi tidak tersedia secara bersamaan di katalog universal. Untuk memperluas template tag dan tag pribadi di katalog universal, Anda harus memperbaruinya menjadi publik.

Sebelum melanjutkan, tinjau struktur template tag pribadi untuk memastikan bahwa struktur dan metadatanya konsisten dengan visibilitas tag publik.

Untuk memperbarui template tag dan tag pribadi menjadi publik, ikuti langkah-langkah berikut:

Konsol

  1. Di Google Cloud console, buka halaman Katalog Dataplex.

    Buka Katalog

  2. Klik Kelola transisi ke Dataplex.

  3. Klik tab Template tag pribadi.

  4. Klik Kelola template tag.

  5. Di halaman Tag templates, klik template tag pribadi yang ingin Anda perbarui.

  6. Di halaman Detail template, klik Edit.

  7. Di bagian Visibilitas, pilih Publik.

  8. Klik Perbarui.

REST

Untuk memperbarui template tag pribadi menjadi publik, gunakan metode tagTemplates.patch.

Mengaktifkan template tag dan tag publik untuk ketersediaan metadata secara bersamaan di katalog universal

Saat Anda memberikan keikutsertaan, konten template dan tag tag publik Data Catalog akan otomatis dan terus-menerus disebarkan ke katalog universal BigQuery di seluruh Google Cloud organisasi atau project Anda. Template dan tag publik Data Catalog di-propagate ke katalog universal BigQuery sebagai jenis dan aspek aspek publik. Definisi jenis aspek global direplikasi ke semua region Google Cloud .

Untuk mengaktifkan template dan tag publik, ikuti langkah-langkah berikut:

Konsol

  1. Di Google Cloud console, buka halaman Katalog Dataplex.

    Buka Katalog

  2. Klik Kelola transisi ke Dataplex.

  3. Klik tab Ikut serta.

  4. Klik Berikan keikutsertaan.

  5. Pada dialog konfirmasi, masukkan teks yang ditampilkan, lalu klik Konfirmasi.

REST

Untuk memilih ikut serta dalam template tag dan tag, gunakan metode setConfig.

Untuk Google Cloud organisasi dan project, Anda dapat mencabut keikutsertaan yang awalnya diberikan, dengan mengklik Cabut keikutsertaan. Saat Anda mencabut keikutsertaan, proses penyebaran template tag dan tag Data Catalog ke katalog universal BigQuery akan berhenti. Jenis aspek dan aspek katalog universal BigQuery yang dibuat oleh proses keikutsertaan, tetapi tidak ditransfer ke katalog universal BigQuery, akan dihapus. Proses penghapusan mungkin memerlukan waktu hingga 12 jam.

Mengonfigurasi izin IAM katalog universal BigQuery untuk metadata kustom Anda

Jenis aspek katalog universal dan grup entri kustom yang mewakili template tag dan grup entri dari Data Catalog tidak mewarisi izin IAM Data Catalog asli. Anda harus mengonfigurasi izin IAM Dataplex secara manual untuk jenis aspek dan grup entri kustom tersebut.

Misalnya, jika ingin membuat aspek menggunakan jenis aspek yang di-propagate (yang mewakili template tag Data Catalog), Anda harus mengonfigurasi izin IAM yang diperlukan untuk jenis aspek tersebut. Demikian pula, saat menyerap metadata kustom, untuk membuat entri kustom dalam grup entri kustom yang di-propagate, Anda harus mengonfigurasi izin IAM yang diperlukan untuk grup entri tersebut.

Untuk mengetahui informasi selengkapnya tentang cara izin IAM di Data Catalog sesuai dengan izin di katalog universal, lihat Pemetaan izin IAM antara Data Catalog dan katalog universal.

Untuk mengonfigurasi izin IAM Dataplex yang diperlukan untuk jenis aspek dan grup entri kustom, ikuti langkah-langkah berikut:

Konsol

  1. Di Google Cloud console, buka halaman Katalog Dataplex.

    Buka Katalog

  2. Klik Kelola transisi ke Dataplex.

  3. Klik tab Dataplex IAM permissions.

  4. Untuk mengonfigurasi izin IAM Dataplex untuk jenis aspek, klik Jenis aspek dan template tag.

    1. Untuk template tag yang di-push dari Data Catalog, klik > Permissions.

    2. Klik Add principals.

    3. Tambahkan akun utama baru, lalu tetapkan peran yang diperlukan.

    4. Klik Simpan.

  5. Untuk mengonfigurasi izin IAM Dataplex untuk grup entri, klik Grup entri.

    1. Untuk grup entri yang di-propagate dari Katalog Data, klik > Permissions.

    2. Klik Add principals.

    3. Tambahkan akun utama baru, lalu tetapkan peran yang diperlukan.

    4. Klik Simpan.

REST

Untuk mengonfigurasi izin IAM Dataplex untuk jenis aspek, gunakan metode aspectTypes.setIamPolicy.

Untuk mengonfigurasi izin IAM Dataplex untuk grup entri, gunakan metode entryGroups.setIamPolicy.

Fase transfer

Fase ini melibatkan tugas untuk memindahkan status aktif (read-write) metadata kustom Data Catalog Anda ke katalog universal.

Berikut adalah poin-poin penting yang perlu diingat selama fase transfer:

  • Halaman Telusuri Dataplex mengarah ke penelusuran katalog universal secara default.
  • Anda dapat menemukan dan membaca metadata Data Catalog dan katalog universal di katalog universal.
  • Untuk memperbarui metadata di Google Cloud konsol, Anda akan dialihkan ke sumbernya. Misalnya, jika Anda memperbarui template tag Data Catalog, Anda akan dialihkan ke halaman template tag di Data Catalog.

Menetapkan pengalaman UI katalog default ke katalog universal

Menetapkan pengalaman UI katalog default ke katalog universal berarti hal berikut:

  • Saat Anda membuka halaman Penelusuran Dataplex di konsolGoogle Cloud , penelusuran katalog universal (Dataplex Catalog) akan ditampilkan secara default. Penelusuran katalog universal beroperasi di katalog universal dan menemukan semua konten metadata Anda, termasuk konten yang dibuat di katalog universal dan konten yang diambil dari Data Catalog.

    Penelusuran Data Catalog hanya menemukan konten Data Catalog, bukan konten katalog universal. Oleh karena itu, sebaiknya gunakan penelusuran katalog universal.

  • Antarmuka web mendorong Anda untuk membuat resource baru di katalog universal (Dataplex Catalog). Misalnya, setelan defaultnya adalah Create Aspect Types, bukan Create Tag Templates, dan Create Entry Group (Dataplex Catalog), bukan Create Entry Group (Data Catalog).

  • Menetapkan pengalaman UI katalog default ke katalog universal biasanya merupakan operasi satu arah. Namun, Dataplex memungkinkan Anda mengembalikan perubahan dalam kasus luar biasa, misalnya, saat Anda ingin mengalihkan pengalaman UI Katalog default kembali ke Data Catalog. Jika Anda mengembalikan perubahan, Anda tidak dapat mengakses konten apa pun yang dibuat di katalog universal, di antarmuka web Data Catalog.

Untuk menetapkan pengalaman UI katalog default ke katalog universal, ikuti langkah-langkah berikut:

Konsol

  1. Di Google Cloud console, buka halaman Katalog Dataplex.

    Buka Katalog

  2. Klik Kelola transisi ke Dataplex.

  3. Klik tab Pengalaman UI katalog default.

  4. Klik Set the default catalog UI experience to Dataplex Catalog.

REST

Untuk menetapkan pengalaman UI katalog default ke katalog universal, gunakan metode setConfig.

Mentransfer metadata kustom Data Catalog ke katalog universal

Anda dapat mentransfer template tag publik Data Catalog (yang Anda ikut serta) dan grup entri kustom ke katalog universal. Pastikan Anda mentransfer setiap template tag dan grup entri kustom secara terpisah.

Berikut ringkasan proses transfer:

  • Efek

    • Mentransfer status aktif untuk resource dari Data Catalog ke katalog universal. Setelah transfer, untuk mengubah resource atau mengakses statusnya saat ini, Anda harus menggunakan katalog universal.
  • Perubahan pada konten dan alur data

    • Menandai resource sebagai read-only di Data Catalog.
    • Menandai resource sebagai read-write di katalog universal.
    • Menghentikan ketersediaan serentak resource ini.
  • Dependensi

    • Mentransfer template tag juga akan mentransfer semua tag yang menggunakan template tersebut.
    • Mentransfer grup entri juga akan mentransfer semua entri dalam grup tersebut.
    • Mentransfer entri tidak memengaruhi status transfer tag dan template tagnya masing-masing.

Sebelum transfer, untuk mengubah konteks bisnis entri (misalnya, overview, contacts), Anda dapat menggunakan Data Catalog dan Dataplex API. Setelah transfer, Anda hanya boleh menggunakan Dataplex API.

Berikut ini menjelaskan operasi yang diizinkan untuk entri Data Catalog kustom yang diberi tag, bergantung pada status transfer grup entri kustom dan template tag terkait:

  • Saat template tag aktif di Data Catalog, Anda dapat menggunakan template tag tersebut untuk membuat tag. Setelah mentransfer template tag ke katalog universal, Anda tidak dapat menggunakannya untuk membuat tag di Data Catalog.
  • Anda dapat membuat aspek menggunakan jenis aspek yang di-propagasi dari template tag Data Catalog, hanya setelah Anda mentransfer template tag.

Untuk mentransfer template tag Data Catalog dan grup entri kustom ke katalog universal, ikuti langkah-langkah berikut:

Konsol

  1. Pastikan setidaknya 48 jam telah berlalu setelah ikut serta sebelum mentransfer template tag Data Catalog ke katalog universal. Waktu ini diperlukan untuk pemrosesan internal.

  2. Di Google Cloud console, buka halaman Katalog Dataplex.

    Buka Katalog

  3. Klik Kelola transisi ke Dataplex.

  4. Klik tab Transfer to Dataplex.

  5. Untuk mentransfer template tag Data Catalog ke katalog universal, klik Lihat jenis aspek dan template tag.

    1. Pilih template tag yang ingin Anda transfer.

    2. Klik Transfer.

    3. Pada dialog konfirmasi, klik Confirm.

  6. Untuk mentransfer grup entri kustom Data Catalog ke katalog universal, klik Lihat grup entri.

    1. Pilih grup entri yang ingin Anda transfer.

    2. Klik Transfer.

    3. Pada dialog konfirmasi, klik Confirm.

REST

Pastikan setidaknya 48 jam telah berlalu setelah ikut serta sebelum mentransfer template tag Data Catalog ke katalog universal. Waktu ini diperlukan untuk pemrosesan internal.

Kemudian, untuk mentransfer template tag Data Catalog dan grup entri kustom ke katalog universal, gunakan metode tagTemplates.patch.

Saat Anda menyelesaikan fase transfer, katalog universal menjadi sumber tepercaya untuk semua metadata, dan Anda tidak perlu menggunakan Data Catalog.

Memperbarui workload terprogram

Katalog universal dilengkapi dengan API, library klien, modul Terraform, dan perintah Google Cloud CLI baru. Oleh karena itu, Anda harus mengupdate workload yang ada dengan penggunaan terprogram Katalog Data ke katalog universal. Lihat contoh kode untuk Dataplex.

Pastikan Anda menyelaraskan pembaruan beban kerja terprogram dengan mentransfer resource dependen, seperti template tag dan grup entri kustom. Hal ini diperlukan karena mentransfer akan memindahkan status aktif (read-write) resource dari Katalog Data ke katalog universal.

Berikut adalah contoh urutan pembaruan beban kerja terprogram untuk berinteraksi dengan katalog universal, yang dikoordinasikan dengan mentransfer resource dependen:

  1. Jika workload Anda dapat menoleransi konsistensi akhir, pindahkan operasi read workload ke katalog universal.

  2. Pindahkan beban kerja yang melakukan operasi write pemberian tag ke katalog universal yang dikoordinasikan dengan mentransfer template tag yang sesuai.

  3. Pindahkan beban kerja yang melakukan operasi write penyerapan kustom ke katalog universal yang dikoordinasikan dengan mentransfer grup entri kustom masing-masing.

Jika Anda perlu memisahkan beban kerja pembaruan dan mentransfer resource yang sesuai, pertimbangkan untuk menerapkan logika dalam beban kerja untuk merutekan read-write ke Katalog Data atau katalog universal pada status transfer resource. Dengan demikian, workload akan beroperasi secara independen dari status transfer resource terkait.

Langkah berikutnya