收集 Cloud Composer 設定
本頁面說明如何收集 Cloud Composer 設定,在 Cortex Framework 中自動處理資料。
如果可以使用 Cloud Composer,您需要在 Cloud Composer 中建立連線,指向資料所在的來源專案,並根據要部署的工作負載,使用下列名稱。如要瞭解工作負載的詳細資訊,請參閱「資料來源和工作負載」。如果您要在「報表」層中建立表格,請務必為「報表」DAG 建立個別的連線。
部署工作負載 | 建立原始檔 | 為 CDC 建立 | 建立報表 |
SAP | 不適用 | sap_cdc_bq
|
sap_reporting_bq
|
SFDC | sfdc_cdc_bq
|
sfdc_cdc_bq
|
sfdc_reporting_bq
|
Google Ads | googleads_raw_dataflow
|
googleads_cdc_bq
|
googleads_reporting_bq
|
CM360 | cm360_raw_dataflow
|
cm360_cdc_bq
|
cm360_reporting_bq
|
Meta | meta_raw_dataflow
|
meta_cdc_bq
|
meta_reporting_bq
|
TikTok | tiktok_raw_dataflow
|
tiktok_cdc_bq
|
tiktok_reporting_bq
|
LiveRamp | 不適用 | liveramp_cdc_bq
|
不適用 |
SFMC | sfmc_raw_dataflow
|
sfmc_cdc_bq
|
sfmc_reporting_bq
|
DV360 | 不適用 | dv360_cdc_bq
|
dv360_reporting_bq
|
GA4 | 不適用 | 不適用 | ga4_reporting_bq
|
Oracle EBS | 不適用 | 不適用 | oracleebs_reporting_bq
|
永續發展 | 不適用 | 不適用 | k9_reporting_bq
|
常見尺寸 | 不適用 | 不適用 | k9_reporting
|
連線命名慣例
連線命名慣例應符合下列規格:
- 連線後置字串:連線名稱包含後置字串,指出連線的預期用途:
_bq
:用於存取 BigQuery 資料。_dataflow
:用於執行 Dataflow 工作。
- 原始資料連線:如果您使用 Cortex 提供的資料擷取模組,只需要為原始資料建立連線。
- 多個資料來源:如果您要部署多個資料來源 (例如 SAP 和 Salesforce),建議為每個資料來源建立個別連線,前提是安全限制適用於個別服務帳戶。或者,您也可以在範本中修改連線名稱,然後再部署,這樣就能使用同一個連線寫入 BigQuery。
安全性最佳做法
- 避免使用預設連線:不建議使用 Airflow 提供的預設連線和服務帳戶,尤其是在實際工作環境中。這符合最低權限原則,強調只授予必要的最低存取權限。
- Secret Manager 整合:如果已為 Airflow 啟用 Secret Manager,您可以在 Secret Manager 中使用相同名稱建立這些連線。儲存在 Secret Manager 中的連線優先於直接在 Airflow 中定義的連線。