Ringkasan analisis kontribusi

Anda dapat menggunakan analisis kontribusi, yang juga disebut analisis pendorong utama, untuk menghasilkan insight tentang perubahan pada metrik utama dalam data multidimensi. Misalnya, Anda dapat menggunakan analisis kontribusi untuk melihat perubahan jumlah pendapatan di dua kuartal, atau membandingkan dua set data pelatihan untuk memahami perubahan performa model ML. Anda dapat menggunakan pernyataan CREATE MODEL untuk membuat model analisis kontribusi di BigQuery.

Analisis kontribusi adalah bentuk analisis augmented, yaitu penggunaan kecerdasan buatan (AI) untuk meningkatkan dan mengotomatiskan analisis dan pemahaman data. Analisis kontribusi mencapai salah satu tujuan utama analisis augmented, yaitu membantu pengguna menemukan pola dalam data mereka.

Model analisis kontribusi mendeteksi segmen data yang menunjukkan perubahan dalam metrik dengan membandingkan set data pengujian dengan set data kontrol. Misalnya, Anda dapat menggunakan ringkasan tabel data penjualan yang diambil pada akhir tahun 2023 sebagai data pengujian dan ringkasan tabel yang diambil pada akhir tahun 2022 sebagai data kontrol untuk melihat perubahan penjualan dari waktu ke waktu. Model analisis kontribusi dapat menunjukkan segmen data mana, seperti pelanggan online di wilayah tertentu, yang mendorong perubahan terbesar dalam penjualan dari satu tahun ke tahun berikutnya.

Metrik ini adalah nilai numerik yang digunakan model analisis kontribusi untuk mengukur dan membandingkan perubahan antara data pengujian dan kontrol. Anda dapat menentukan metrik yang dapat dijumlahkan, metrik rasio yang dapat dijumlahkan, atau metrik yang dapat dijumlahkan menurut kategori dengan model analisis kontribusi.

Segmen adalah bagian data yang diidentifikasi oleh kombinasi nilai dimensi tertentu. Misalnya, untuk model analisis kontribusi berdasarkan dimensi store_number, customer_id, dan day, setiap kombinasi unik nilai dimensi tersebut mewakili segmen. Dalam tabel berikut, setiap baris mewakili segmen yang berbeda:

store_number customer_id day
toko 1
toko 1 pelanggan 1
toko 1 pelanggan 1 Senin
toko 1 pelanggan 1 Selasa
toko 1 customer 2
toko 2

Untuk mengurangi waktu pembuatan model dan hanya membuat model segmen terbesar dan paling relevan, tentukan nilai minimum dukungan apriori, yang memungkinkan Anda memangkas segmen kecil agar tidak digunakan oleh model.

Setelah membuat model analisis kontribusi, Anda dapat menggunakan fungsi ML.GET_INSIGHTS untuk mengambil informasi metrik yang dihitung oleh model. Output model terdiri dari baris insight, dengan setiap insight memberikan segmen dan metrik yang sesuai.

Langkah berikutnya