Insight data menawarkan cara otomatis untuk menjelajahi dan memahami data Anda. Dengan insight data, Gemini menggunakan metadata untuk membuat pertanyaan bahasa alami tentang tabel Anda dan kueri untuk menjawabnya. Hal ini membantu Anda mengungkap pola, menilai kualitas data, dan melakukan analisis statistik.
Dokumen ini menjelaskan fitur utama insight data dan cara melihatnya untuk eksplorasi data yang penuh insight.
Sebelum memulai
Insight data dibuat menggunakan
Gemini di BigQuery
dan hanya dapat dibuat di BigQuery Studio.
Pertama, siapkan Gemini di BigQuery, lalu buat insight di BigQuery.
Gemini memproses metadata Anda untuk mendapatkan insight secara eksklusif di region us-central1
. Untuk mengetahui informasi selengkapnya, lihat
Lokasi penayangan Gemini.
Setelah membuat insight, Anda dapat melihatnya di Dataplex Universal Catalog.
Peran yang diperlukan
Untuk mendapatkan akses hanya baca ke insight yang dihasilkan, minta administrator Anda untuk memberi Anda peran IAM berikut:
- Dataplex DataScan DataViewer (
roles/dataplex.dataScanDataViewer
) di project yang berisi tabel BigQuery yang ingin Anda gunakan untuk melihat insight.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya. Untuk melihat izin persis yang diperlukan untuk membuat insight, luaskan bagian Izin yang diperlukan:
Izin yang diperlukan
dataplex.datascans.get
dataplex.datascans.getData
Mengaktifkan API
Untuk menggunakan insight data, aktifkan API berikut di project Anda:
Untuk mengetahui informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di project Google Cloud .
Tentang insight data
Saat menjelajahi tabel baru yang tidak dikenal, analis data sering kali menghadapi masalah cold start. Masalah ini sering kali melibatkan ketidakpastian tentang struktur data, pola utama, dan insight yang relevan dalam data, sehingga sulit untuk mulai menulis kueri.
Insight data mengatasi masalah mulai dingin dengan otomatis membuat kueri natural language dan padanan SQL-nya berdasarkan metadata tabel. Daripada memulai dengan editor kueri kosong, Anda dapat dengan cepat memulai eksplorasi data dengan kueri yang bermakna dan menawarkan insight berharga. Untuk menyelidiki lebih lanjut, Anda dapat mengajukan pertanyaan lanjutan di kanvas data.
Contoh menjalankan insight
Pertimbangkan tabel bernama telco_churn
dengan metadata berikut:
Nama kolom | Jenis |
---|---|
CustomerID | STRING |
Gender | STRING |
Masa bakti | INT64 |
InternetService | STRING |
StreamingTV | STRING |
OnlineBackup | STRING |
Kontrak | STRING |
TechSupport | STRING |
PaymentMethod | STRING |
MonthlyCharges | FLOAT |
Churn | BOOLEAN |
Berikut adalah beberapa contoh kueri yang dihasilkan insight data untuk tabel ini:
Identifikasi pelanggan yang telah berlangganan semua layanan premium dan telah menjadi pelanggan selama lebih dari 50 bulan.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;
Identifikasi layanan internet mana yang memiliki pelanggan yang berhenti berlangganan paling banyak.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;
Identifikasi rasio churn menurut segmen di antara pelanggan bernilai tinggi.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Lihat analisis
Untuk melihat insight tabel BigQuery, akses entri tabel di Dataplex Universal Catalog menggunakan Penelusuran Dataplex Universal Catalog.
Di konsol Google Cloud , buka halaman Penelusuran Dataplex Universal Catalog.
Telusuri entri tabel di Dataplex Universal Catalog.
Klik tab Insight. Jika tab kosong, berarti insight untuk tabel ini belum dibuat. Anda dapat menghasilkan insight data di BigQuery Studio.
Harga
Untuk mengetahui detail tentang harga fitur ini, lihat Ringkasan harga Gemini in BigQuery.
Kuota dan batas
Untuk mengetahui informasi tentang kuota dan batas untuk fitur ini, lihat Kuota untuk Gemini di BigQuery.
Lokasi
Gemini beroperasi secara global, jadi Anda tidak dapat membatasi pemrosesan data ke wilayah tertentu. Untuk mempelajari lebih lanjut lokasi tempat Gemini in BigQuery memproses data, lihat Lokasi penayangan Gemini.
Batasan
- Insight data tersedia untuk tabel BigQuery, tabel BigLake, tabel eksternal, dan tampilan.
- Untuk pelanggan multicloud, data dari cloud lain tidak tersedia.
- Insight data tidak mendukung jenis kolom
Geo
atauJSON
. - Eksekusi insight tidak menjamin presentasi kueri setiap saat. Untuk meningkatkan kemungkinan menghasilkan kueri yang lebih menarik, buat ulang insight di BigQuery Studio.
Langkah berikutnya
- Pelajari cara menghasilkan insight di BigQuery.
- Pelajari cara membuat pemindaian pembuatan profil data.
- Pelajari cara menulis kueri dengan bantuan Gemini di BigQuery.