Ringkasan Dataplex

Dataplex adalah data fabric cerdas yang menyatukan data terdistribusi dan mengotomatiskan pengelolaan serta tata kelola data. Melalui Dataplex, Anda dapat menggunakan AI untuk memudahkan kueri data, jaminan kualitas, dan insight bisnis.

Dataplex menjalankan tata kelola dalam skala besar. Misalnya, perusahaan retail global yang menghasilkan data penjualan, inventaris, dan pelanggan dalam jumlah besar yang disimpan di Cloud Storage, Spanner, dan Pub/Sub. Dengan data yang didistribusikan di seluruh sistem, mengelola tata kelola, memastikan kualitas, dan mempertahankan kepatuhan menjadi kompleks dan memakan waktu. Dataplex menyederhanakan proses ini dengan menyediakan tampilan terpusat untuk menemukan, membuat profil, memvalidasi, melacak silsilah, dan mengontrol akses ke aset data organisasi.

Mengapa menggunakan Dataplex?

Dataplex mengatur data melalui fitur berikut:

  • Pembuatan katalog metadata. Ambil metadata untuk resource Google Cloud (di BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore), dan resource pihak ketiga yang Anda bawa ke Dataplex, untuk mendapatkan ringkasan aset data Anda.
  • Penemuan data. Memindai data terstruktur dan tidak terstruktur di bucket Cloud Storage untuk mengekstrak dan membuat katalog metadata-nya.
  • Insight data. Gunakan AI untuk membuat pertanyaan bahasa alami tentang data Anda, untuk mengungkap pola, menilai kualitas data, dan melakukan analisis statistik.
  • Pembuatan profil data. Identifikasi karakteristik umum data kolom di tabel BigQuery Anda, misalnya, nilai data umum, distribusi data, dan jumlah null, yang dapat menginformasikan klasifikasi data dan jaminan kualitas.
  • Kualitas data. Tentukan dan ukur kualitas data di tabel BigQuery Anda, dengan memvalidasi data terhadap kebijakan organisasi dan mencatat pemberitahuan jika data tidak memenuhi kriteria kualitas.
  • Glosarium bisnis. Kelola terminologi dan definisi terkait bisnis di seluruh organisasi Anda, dan lampirkan istilah ke kolom tabel untuk mendorong pemahaman yang konsisten tentang penggunaan data.
  • Lini masa data. Lacak cara data bergerak melalui sistem Anda-tempat asalnya, tempat data diteruskan, dan transformasi yang diterapkan pada data.

Dataplex mendukung siklus proses data secara menyeluruh, mulai dari penemuan terdistribusi hingga insight bisnis. Fitur tata kelola juga tersedia melalui BigQuery.

Langkah berikutnya