Ringkasan Katalog Universal Dataplex

Dataplex Universal Catalog adalah solusi tata kelola cerdas dan terpadu untuk aset data dan AI di Google Cloud. Melalui Dataplex Universal Catalog, Anda dapat menggunakan AI untuk menyederhanakan kueri data, penjaminan kualitas, dan insight bisnis.

Dataplex Universal Catalog melakukan tata kelola dalam skala besar. Misalnya, perusahaan retail global yang menghasilkan data penjualan, inventaris, dan pelanggan dalam jumlah besar yang disimpan di Cloud Storage, Spanner, dan Pub/Sub. Dengan data yang didistribusikan di seluruh sistem, mengelola tata kelola, memastikan kualitas, dan mempertahankan kepatuhan menjadi rumit dan memakan waktu. Dataplex Universal Catalog menyederhanakan proses ini dengan memberikan tampilan terpusat untuk menemukan, membuat profil, memvalidasi, melacak silsilah, dan mengontrol akses ke aset data organisasi.

Mengapa menggunakan Katalog Universal Dataplex?

Dataplex Universal Catalog mengatur data melalui fitur berikut:

  • Pembuatan katalog metadata. Ambil metadata untuk Google Cloud resource (di BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore), dan resource pihak ketiga yang Anda bawa ke Katalog Universal Dataplex, untuk mendapatkan ringkasan aset data Anda.
  • Penemuan data. Memindai data terstruktur dan tidak terstruktur di bucket Cloud Storage untuk mengekstrak dan membuat katalog metadatanya.
  • Insight data. Gunakan AI untuk membuat pertanyaan dalam bahasa alami tentang data Anda, untuk mengungkap pola, menilai kualitas data, dan melakukan analisis statistik.
  • Pembuatan profil data. Identifikasi karakteristik umum data kolom dalam tabel BigQuery Anda, misalnya, nilai data umum, distribusi data, dan jumlah nilai null, yang dapat menginformasikan klasifikasi data dan jaminan kualitas.
  • Kualitas data. Tentukan dan ukur kualitas data di tabel BigQuery Anda, dengan memvalidasi data terhadap kebijakan organisasi dan mencatat pemberitahuan jika data tidak memenuhi kriteria kualitas.
  • Glosarium bisnis. Kelola terminologi dan definisi terkait bisnis di seluruh organisasi Anda, dan lampirkan istilah ke kolom tabel untuk meningkatkan pemahaman yang konsisten tentang penggunaan data.
  • Urutan data. Lacak cara data berpindah melalui sistem Anda- dari mana data berasal, ke mana data diteruskan, dan transformasi apa yang diterapkan pada data.

Dataplex Universal Catalog mendukung siklus proses data secara menyeluruh, mulai dari penemuan terdistribusi hingga insight bisnis. Fitur tata kelola juga tersedia melalui BigQuery.

Langkah berikutnya