貢献度の分析の概要
貢献度分析(主な要因分析)を使用すると、多次元データの主な指標の変化に関する分析情報を生成できます。たとえば、貢献度分析を使用して、2 つの四半期の収益数の変化を確認したり、2 つのトレーニング データセットを比較して ML モデルのパフォーマンスの変化を把握したりできます。CREATE MODEL
ステートメントを使用して、BigQuery で貢献度分析モデルを作成できます。
貢献度分析は、拡張分析の一種です。拡張分析とは、人工知能(AI)を使用してデータの分析と理解を強化し、自動化することです。貢献度の分析は、ユーザーがデータ内のパターンを見つけるのを支援するという、拡張アナリティクスの主要な目標の 1 つを達成します。
貢献度分析モデルは、テストデータセットとコントロール データセットを比較することで、時間の経過に伴う指標の統計的に有意な変化を示すデータのセグメントを検出します。これにより、時間、場所、顧客セグメント、その他の重要な指標に応じてデータがどのように変化するかを確認できます。たとえば、2023 年末に取得したテーブル スナップショットと 2022 年末に取得したテーブル スナップショットを比較して、2 年間のデータの違いを確認できます。
指標は、貢献度分析モデルがテストデータとコントロール データの変化を測定して比較するために使用する数値です。貢献度分析モデルでは、合計可能指標または合計可能比率指標のいずれかを指定できます。
セグメントは、ディメンション値の特定の組み合わせで識別されるデータのスライスです。たとえば、store_number
、customer_id
、day
ディメンションに基づく貢献分析モデルの場合、これらのディメンション値の一意の組み合わせはすべてセグメントを表します。次の表の各行は、異なるセグメントを表しています。
store_number |
customer_id |
day |
店舗 1 | ||
店舗 1 | お客様 1 | |
店舗 1 | お客様 1 | 月曜日 |
店舗 1 | お客様 1 | 火曜日 |
店舗 1 | お客様 2 | |
店舗 2 |
最も大きいセグメント(最も関連性の高いセグメント)のみをモデル化する場合は、小さなセグメントをモデルで使用しないようにする事前サポート しきい値を指定します。これにより、モデルの作成時間も短縮されます。
貢献度分析モデルを作成したら、ML.GET_INSIGHTS
関数を使用して、モデルによって計算された指標情報を取得できます。