Panoramica dell'analisi del contributo
Puoi utilizzare l'analisi del contributo, chiamata anche analisi dei fattori chiave, per generare informazioni sulle variazioni delle metriche chiave nei dati multidimensionali. Ad esempio, puoi utilizzare l'analisi del contributo per vedere la variazione dei dati sulle entrate in due trimestri o per confrontare due insiemi di dati di addestramento per comprendere le variazioni nel rendimento di un modello di ML. Puoi utilizzare un
istruzione CREATE MODEL
per creare un modello di analisi del contributo in BigQuery.
L'analisi dei contributi è una forma di analisi avanzata, ovvero l'utilizzo dell'intelligenza artificiale (IA) per migliorare e automatizzare l'analisi e la comprensione dei dati. L'analisi del contributo consente di raggiungere uno degli scopi principali dell'analisi aumentata, ovvero aiutare gli utenti a trovare pattern nei loro dati.
Un modello di analisi del contributo rileva i segmenti di dati che mostrano variazioni in una metrica confrontando un insieme di dati di test con un insieme di dati di controllo. Ad esempio, potresti utilizzare un istantanea della tabella dei dati sulle vendite acquisita alla fine del 2023 come dati di test e un'istantanea della tabella acquisita alla fine del 2022 come dati di controllo per vedere come sono cambiate le vendite nel tempo. Un modello di analisi del contributo potrebbe mostrare quale segmento di dati, ad esempio i clienti online di una determinata regione, ha generato la variazione più significativa delle vendite da un anno all'altro.
La metrica è il valore numerico utilizzato dai modelli di analisi del contributo per misurare e confrontare le variazioni tra i dati di test e di controllo. Puoi specificare una metrica sommabile, una metrica del rapporto sommabile o una metrica sommabile per categoria con un modello di analisi del contributo.
Un segmento è una sezione dei dati identificata da una determinata combinazione di valori
delle dimensioni. Ad esempio, per un modello di analisi del contributo basato sulle dimensioni store_number
, customer_id
e day
, ogni combinazione univoca di questi valori rappresenta un segmento. Nella tabella seguente, ogni riga rappresenta un segmento diverso:
store_number |
customer_id |
day |
negozio 1 | ||
negozio 1 | cliente 1 | |
negozio 1 | cliente 1 | Lunedì |
negozio 1 | cliente 1 | Martedì |
negozio 1 | cliente 2 | |
negozio 2 |
Per ridurre il tempo di creazione del modello e modellare solo i segmenti più grandi e pertinenti, specifica una soglia di supporto a priori, che ti consente di eliminare i segmenti di piccole dimensioni dall'utilizzo da parte del modello.
Dopo aver creato un modello di analisi del contributo, puoi utilizzare la
funzione ML.GET_INSIGHTS
per recuperare le informazioni sulle metriche calcolate dal modello. L'output del modello
consiste in righe di approfondimenti, in cui ogni approfondimento fornisce un segmento e le relative
metriche.
Passaggi successivi
- Creare un modello di analisi del contributo
- Ottenere approfondimenti sui dati da un modello di analisi dei contributi