Ringkasan analisis kontribusi
Anda dapat menggunakan analisis kontribusi, yang juga disebut analisis pendorong utama, untuk menghasilkan insight tentang perubahan pada metrik utama dalam data multidimensi. Misalnya, Anda dapat menggunakan analisis kontribusi untuk melihat perubahan jumlah pendapatan
di dua kuartal, atau membandingkan dua set data pelatihan untuk memahami
perubahan performa model ML. Anda dapat menggunakan pernyataan CREATE MODEL
untuk membuat model analisis kontribusi di BigQuery.
Analisis kontribusi adalah bentuk analisis augmented, yaitu penggunaan kecerdasan buatan (AI) untuk meningkatkan dan mengotomatiskan analisis dan pemahaman data. Analisis kontribusi mencapai salah satu tujuan utama analisis augmented, yaitu membantu pengguna menemukan pola dalam data mereka.
Model analisis kontribusi mendeteksi segmen data yang menunjukkan perubahan dalam metrik dengan membandingkan set data pengujian dengan set data kontrol. Misalnya, Anda dapat menggunakan ringkasan tabel data penjualan yang diambil pada akhir tahun 2023 sebagai data pengujian dan ringkasan tabel yang diambil pada akhir tahun 2022 sebagai data kontrol untuk melihat perubahan penjualan dari waktu ke waktu. Model analisis kontribusi dapat menunjukkan segmen data mana, seperti pelanggan online di wilayah tertentu, yang mendorong perubahan terbesar dalam penjualan dari satu tahun ke tahun berikutnya.
Metrik ini adalah nilai numerik yang digunakan model analisis kontribusi untuk mengukur dan membandingkan perubahan antara data pengujian dan kontrol. Anda dapat menentukan metrik yang dapat dijumlahkan, metrik rasio yang dapat dijumlahkan, atau metrik yang dapat dijumlahkan menurut kategori dengan model analisis kontribusi.
Segmen adalah bagian data yang diidentifikasi oleh kombinasi nilai dimensi tertentu. Misalnya, untuk model analisis kontribusi berdasarkan dimensi store_number
, customer_id
, dan day
, setiap kombinasi unik nilai dimensi tersebut mewakili segmen. Dalam tabel berikut, setiap baris mewakili segmen yang berbeda:
store_number |
customer_id |
day |
toko 1 | ||
toko 1 | pelanggan 1 | |
toko 1 | pelanggan 1 | Senin |
toko 1 | pelanggan 1 | Selasa |
toko 1 | customer 2 | |
toko 2 |
Untuk mengurangi waktu pembuatan model dan hanya membuat model segmen terbesar dan paling relevan, tentukan nilai minimum dukungan apriori, yang memungkinkan Anda memangkas segmen kecil agar tidak digunakan oleh model.
Setelah membuat model analisis kontribusi, Anda dapat menggunakan
fungsi ML.GET_INSIGHTS
untuk mengambil informasi metrik yang dihitung oleh model. Output model
terdiri dari baris insight, dengan setiap insight memberikan segmen dan
metrik yang sesuai.