與 Google Analytics 4 整合

本頁面說明必要設定,可將 Google Analytics 4 (GA4) 的資料做為 Cortex Framework Data Foundation 行銷工作負載的資料來源。

GA4 是最新版的 Google Analytics。提供使用者行為的全面檢視,著重於以事件為準的追蹤和機器學習,提供更深入的洞察資料。Cortex Framework 可讓您從 GA4 擷取資料,並整合至 BigQuery,以進行進一步分析和報表製作。取得實用洞察資料,進而提升業務成果。

下圖說明如何透過 Cortex Framework Data Foundation 的行銷工作負載取得 GA4 資料:

GA4 資料來源

圖 1:GA4 資料來源。

設定檔

config.json 檔案會設定連線至資料來源所需的設定,以便從各種工作負載轉移資料。這個檔案包含下列 Google Analytics 4 參數:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

下表說明各個行銷參數的值:

參數 意義 預設值 說明
marketing.deployGA4 部署 GA4 true 執行 GA4 資料來源的部署作業。
marketing.GA4.datasets.cdc GA4 的 BigQuery 匯出資料集 [{"property_id": 0, "name": ""}] Google Analytics 4 BigQuery Export 資料集陣列。每個元素都會指定 Property IDINT,以及對應的 BigQuery Export 資料集名稱。
marketing.GA4.datasets.reporting GA4 的報表資料集 REPORTING_GA4 GA4 的報表資料集。

資料模型

本節將使用實體關係圖 (ERD) 說明 GA4 資料模型。

GA4 的實體關係圖

圖 2:GA4:實體關係圖。

基本檢視畫面

這些是 ERD 中的藍色物件,也是 CDC 資料表的檢視區塊,可透過最少的轉換來解壓縮複雜的資料結構。請參閱src/marketing/src/GA4/src/reporting/ddls中的指令碼。

報表資料檢視

這些是 ERD 中的綠色物件,也是包含匯總指標的報表檢視畫面。請參閱src/marketing/src/GA4/src/reporting/ddls中的指令碼。

設定 GA4 整合

Cortex Framework 資料基礎會整合 GA4,方法是在 GA4 的 BigQuery 匯出資料集 (在 Cortex Framework 架構中視為 CDC 資料集) 上方建立報表層。視報表設定而定,這項作業的完成方式是在 CDC 資料表上建立執行階段檢視區塊,或執行 Cloud Composer DAG,以取得 BigQuery 資料表中的具體化資料。

設定 GA4 BigQuery Export

Cortex Framework 會使用 Google Analytics 4 的 BigQuery 匯出功能,將來源系統的資料載入 BigQuery。請按照這篇 GA4 說明文章中的操作說明,為每個 GA4 資源設定 BigQuery Export:GA4 - 設定 BigQuery Export

已知問題、限制和其他考量重點

設定 GA4 BigQuery Export 時,請注意下列事項:

  • 回填:GA4 BigQuery Export 會從設定當天開始匯出資料,不會回填資料。
  • Google Analytics 4 使用者介面與 Cortex Framework 報表中的數字差異: 取樣、資料收集延遲和高基數報表等多種因素,可能會導致 Google Analytics 使用者介面與 Cortex Framework 之間出現些微差異。這是 Google Analytics 的已知限制,詳情請參閱「消除 Google Analytics 使用者介面與 BigQuery Export 之間的差距 」一文。
  • 事件匯出量限制:視 Google Analytics 版本而定,您每天的 BigQuery 匯出量可能會受到不同程度的限制。詳情請參閱「Google Analytics 4 - 設定 BigQuery Export」一文。
  • 時區:在 BigQuery 匯出中,event_date資源報表時區,而 event_timestamp 則是世界標準時間 (以微秒為單位)。因此,如果使用 event_timestamp,請務必調整為正確的報表時區,再與使用者介面中的數字進行比較。
  • 每日與串流 (即時) 事件匯出:如要匯出事件,Cortex 架構僅支援完整每日匯出功能建立的 events_YYYYMMDD 表格。詳情請參閱「Google Analytics 4 - BigQuery Export」一文。
  • BigQuery Export 的 GA4 360 服務水準協議: Cortex Framework 不支援events_fresh_資料表, 這些資料表是由每日更新匯出 建立,做為個別來源資料表,但您可以按照##CORTEX-CUSTOMER 「報表」檢視畫面中的自訂註解,將來源 資料表替換成這些資料表,藉此享有這項功能提供的服務水準協議。Events這項替代作業完成後,所有報表檢視畫面仍可正常運作。

資料更新間隔和延遲

一般來說,Cortex Framework 資料來源的資料更新頻率取決於上游連線允許的頻率,以及 DAG 的執行頻率。調整 DAG 執行頻率,以配合上游頻率、資源限制和業務需求。

使用 Google Analytics 4 時,BigQuery 匯出資料最多可能會延遲一天,具體時間取決於時區,除非您使用每日更新匯出

設定

本節說明資料處理的設定。

Cloud Composer 連線

在 Cloud Composer 中建立下列連線。詳情請參閱「管理 Airflow 連線」說明文件。

連線名稱 目的
dv360_cdc_bq 原始資料集 > CDC 資料集移轉。
dv360_reporting_bq 將 CDC 資料集轉移至報表資料集。

報表設定

您可以使用報表設定檔 src/GA4/config/reporting_settings.yaml,設定及控管 Cortex Framework 為 GA4 最終報表層產生資料的方式。這個檔案會控管報表層 BigQuery 物件 (資料表、檢視區塊、函式或預存程序) 的產生方式。

詳情請參閱「自訂報表設定檔」。

後續步驟