Cloud Composer 설정 수집

이 페이지에서는 Cloud Composer 설정을 수집하여 Cortex 프레임워크 내에서 데이터를 자동화하는 방법을 설명합니다.

Cloud Composer를 사용할 수 있는 경우 데이터가 있는 소스 프로젝트를 가리키는 Cloud Composer 내에서 연결을 생성해야 하며, 배포에 대한 워크로드를 기반으로 다음 이름을 지정해야 합니다. 워크로드에 관한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요. 보고 레이어에서 테이블을 만드는 경우 보고 DAG에 별도의 연결을 만들어야 합니다.

워크로드 배포 Raw용으로 만들기 CDC용으로 만들기 보고용으로 만들기
SAP 해당 사항 없음 sap_cdc_bq sap_reporting_bq
SFDC sfdc_cdc_bq sfdc_cdc_bq sfdc_reporting_bq
Google Ads googleads_raw_dataflow googleads_cdc_bq googleads_reporting_bq
CM360 cm360_raw_dataflow cm360_cdc_bq cm360_reporting_bq
메타 meta_raw_dataflow meta_cdc_bq meta_reporting_bq
TikTok tiktok_raw_dataflow tiktok_cdc_bq tiktok_reporting_bq
LiveRamp 해당 사항 없음 liveramp_cdc_bq 해당 사항 없음
SFMC sfmc_raw_dataflow sfmc_cdc_bq sfmc_reporting_bq
DV360 해당 사항 없음 dv360_cdc_bq dv360_reporting_bq
GA4 해당 사항 없음 해당 사항 없음 ga4_reporting_bq
Oracle EBS 해당 사항 없음 해당 사항 없음 oracleebs_reporting_bq
지속 가능성 해당 사항 없음 해당 사항 없음 k9_reporting_bq
일반적인 측정기준 해당 사항 없음 해당 사항 없음 k9_reporting

연결 이름 지정 규칙

연결 이름 지정 규칙에 관한 다음 사양을 고려하세요.

  • 연결 접미사: 연결 이름에는 의도된 목적을 나타내는 접미사가 포함됩니다.
    • _bq: BigQuery 데이터에 액세스하는 데 사용됩니다.
    • _dataflow: Dataflow 작업 실행에 사용됩니다.
  • 원시 데이터 연결: Cortex에서 제공하는 데이터 처리 모듈을 사용하는 경우에만 원시 데이터 연결을 만들어야 합니다.
  • 여러 데이터 소스: 여러 데이터 소스 (예: SAP 및 Salesforce 모두)를 배포하는 경우 보안 제한사항이 개별 서비스 계정에 적용된다고 가정하면 각각에 대해 별도의 연결을 만드는 것이 좋습니다. 또는 배포하기 전에 템플릿에서 연결 이름을 수정하여 BigQuery에 쓰는 데 동일한 연결을 사용하도록 할 수 있습니다.

보안 권장사항

  • 기본 연결 피하기: 특히 프로덕션 환경에서는 Airflow에서 제공하는 기본 연결 및 서비스 계정을 사용하지 않는 것이 좋습니다. 이는 필요한 최소한의 액세스 권한만 부여하는 것을 강조하는 최소 권한의 원칙에 부합합니다.
  • Secret Manager 통합: Airflow에 Secret Manager를 사용 설정한 경우 동일한 이름을 사용하여 Secret Manager 내에서 이러한 연결을 만들 수 있습니다. Secret Manager에 저장된 연결은 Airflow에 직접 정의된 연결보다 우선 적용됩니다.