與 Google Analytics 4 整合
本頁面說明必要設定,可將 Google Analytics 4 (GA4) 的資料做為 Cortex Framework Data Foundation 行銷工作負載的資料來源。
GA4 是最新版的 Google Analytics。提供使用者行為的全面檢視,著重於以事件為準的追蹤和機器學習,提供更深入的洞察資料。Cortex Framework 可讓您從 GA4 擷取資料,並整合至 BigQuery,以進行進一步分析和報表製作。取得實用洞察資料,進而提升業務成果。
下圖說明如何透過 Cortex Framework Data Foundation 的行銷工作負載取得 GA4 資料:
設定檔
config.json
檔案會設定連線至資料來源所需的設定,以便從各種工作負載轉移資料。這個檔案包含下列 Google Analytics 4 參數:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
下表說明各個行銷參數的值:
參數 | 意義 | 預設值 | 說明 |
marketing.deployGA4
|
部署 GA4 | true
|
執行 GA4 資料來源的部署作業。 |
marketing.GA4.datasets.cdc
|
GA4 的 BigQuery 匯出資料集 | [{"property_id": 0, "name": ""}]
|
Google Analytics 4 BigQuery Export 資料集陣列。每個元素都會指定 Property ID 為 INT ,以及對應的 BigQuery Export 資料集名稱。 |
marketing.GA4.datasets.reporting
|
GA4 的報表資料集 | REPORTING_GA4
|
GA4 的報表資料集。 |
資料模型
本節將使用實體關係圖 (ERD) 說明 GA4 資料模型。
基本檢視畫面
這些是 ERD 中的藍色物件,也是 CDC 資料表的檢視區塊,可透過最少的轉換來解壓縮複雜的資料結構。請參閱src/marketing/src/GA4/src/reporting/ddls
中的指令碼。
報表資料檢視
這些是 ERD 中的綠色物件,也是包含匯總指標的報表檢視畫面。請參閱src/marketing/src/GA4/src/reporting/ddls
中的指令碼。
設定 GA4 整合
Cortex Framework 資料基礎會整合 GA4,方法是在 GA4 的 BigQuery 匯出資料集 (在 Cortex Framework 架構中視為 CDC 資料集) 上方建立報表層。視報表設定而定,這項作業的完成方式是在 CDC 資料表上建立執行階段檢視區塊,或執行 Cloud Composer DAG,以取得 BigQuery 資料表中的具體化資料。
設定 GA4 BigQuery Export
Cortex Framework 會使用 Google Analytics 4 的 BigQuery 匯出功能,將來源系統的資料載入 BigQuery。請按照這篇 GA4 說明文章中的操作說明,為每個 GA4 資源設定 BigQuery Export:GA4 - 設定 BigQuery Export。
已知問題、限制和其他考量重點
設定 GA4 BigQuery Export 時,請注意下列事項:
- 回填:GA4 BigQuery Export 會從設定當天開始匯出資料,不會回填資料。
- Google Analytics 4 使用者介面與 Cortex Framework 報表中的數字差異: 取樣、資料收集延遲和高基數報表等多種因素,可能會導致 Google Analytics 使用者介面與 Cortex Framework 之間出現些微差異。這是 Google Analytics 的已知限制,詳情請參閱「消除 Google Analytics 使用者介面與 BigQuery Export 之間的差距 」一文。
- 事件匯出量限制:視 Google Analytics 版本而定,您每天的 BigQuery 匯出量可能會受到不同程度的限制。詳情請參閱「Google Analytics 4 - 設定 BigQuery Export」一文。
- 時區:在 BigQuery 匯出中,
event_date
是資源報表時區,而event_timestamp
則是世界標準時間 (以微秒為單位)。因此,如果使用event_timestamp
,請務必調整為正確的報表時區,再與使用者介面中的數字進行比較。 - 每日與串流 (即時) 事件匯出:如要匯出事件,Cortex 架構僅支援完整每日匯出功能建立的
events_YYYYMMDD
表格。詳情請參閱「Google Analytics 4 - BigQuery Export」一文。 - BigQuery Export 的 GA4 360 服務水準協議:
Cortex Framework 不支援
events_fresh_
資料表, 這些資料表是由每日更新匯出 建立,做為個別來源資料表,但您可以按照##CORTEX-CUSTOMER
「報表」檢視畫面中的自訂註解,將來源 資料表替換成這些資料表,藉此享有這項功能提供的服務水準協議。Events
這項替代作業完成後,所有報表檢視畫面仍可正常運作。
資料更新間隔和延遲
一般來說,Cortex Framework 資料來源的資料更新頻率取決於上游連線允許的頻率,以及 DAG 的執行頻率。調整 DAG 執行頻率,以配合上游頻率、資源限制和業務需求。
使用 Google Analytics 4 時,BigQuery 匯出資料最多可能會延遲一天,具體時間取決於時區,除非您使用每日更新匯出。
設定
本節說明資料處理的設定。
Cloud Composer 連線
在 Cloud Composer 中建立下列連線。詳情請參閱「管理 Airflow 連線」說明文件。
連線名稱 | 目的 |
dv360_cdc_bq
|
原始資料集 > CDC 資料集移轉。 |
dv360_reporting_bq
|
將 CDC 資料集轉移至報表資料集。 |
報表設定
您可以使用報表設定檔 src/GA4/config/reporting_settings.yaml
,設定及控管 Cortex Framework 為 GA4 最終報表層產生資料的方式。這個檔案會控管報表層 BigQuery 物件 (資料表、檢視區塊、函式或預存程序) 的產生方式。
詳情請參閱「自訂報表設定檔」。
後續步驟
- 如要進一步瞭解其他資料來源和工作負載,請參閱「資料來源和工作負載」一文。
- 如要進一步瞭解在正式環境中部署的步驟,請參閱 Cortex Framework Data Foundation 部署作業的必要條件。