Integración con YouTube (DV360)
En esta página se describen las configuraciones necesarias para importar datos de YouTube a Display & Video 360 (DV360) como fuente de datos de la carga de trabajo de marketing de Data Foundation de Cortex Framework.
DV360 es una plataforma publicitaria de Google para gestionar la publicidad de YouTube junto con otros canales digitales, lo que ofrece a los anunciantes un mayor control y eficiencia en sus esfuerzos de marketing.
En el siguiente diagrama se describe cómo se puede acceder a los datos de DV360 a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:
Archivo de configuración
El archivo config.json
configura los ajustes necesarios para conectarse a fuentes de datos y transferir datos de varias cargas de trabajo. Este archivo contiene los siguientes parámetros de DV360:
"marketing": {
"deployDV360": true,
"DV360": {
"deployCDC": true,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_DV360"
}
}
}
En la siguiente tabla se describe el valor de cada parámetro de marketing:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployDV360
|
Implementar DV360 | true
|
Ejecute la implementación de la fuente de datos de DV360. |
marketing.DV360.deployCDC
|
Implementar secuencias de comandos de CDC para DV360 | true
|
Genera secuencias de comandos de procesamiento de CDC de DV360 para ejecutarlas como DAGs en Cloud Composer. |
marketing.DV360.datasets.cdc
|
Conjunto de datos de CDC para DV360 | - | Conjunto de datos de CDC para DV360. |
marketing.DV360.datasets.raw
|
Conjunto de datos sin procesar de DV360 | - | Conjunto de datos sin procesar de DV360. |
marketing.DV360.datasets.reporting
|
Conjunto de datos de informes de DV360 | REPORTING_DV360
|
Conjunto de datos de informes de DV360. |
Modelo de datos
En esta sección se describe el modelo de datos de YouTube (con DV360) mediante el diagrama de relaciones entre entidades (DRE).
Vistas de informes
Los objetos azules del diagrama ER representan vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/DV360/src/reporting/ddls
.
Configurar la extracción de datos sin procesar de DV360
Cortex Framework se integra con DV360 mediante su función de informes instantáneos. Informes instantáneos es una función fiable y económica de DV360 que permite guardar, programar y descargar informes más grandes y complejos en archivos y diferentes ubicaciones. Cada informe crea periódicamente tablas de datos de exportación en BigQuery con el mismo prefijo de nombre de tabla configurado, que contiene datos del periodo seleccionado, con la frecuencia seleccionada.
Permisos
Para exportar correctamente datos sin procesar de DV360 mediante Informes Instantáneos, se necesitan personas con los siguientes permisos:
- DV360:
- Acceso estándar para los partners o anunciantes seleccionados.
BigQuery User
asignado a la cuenta de servicio de DV360.BigQuery Data Editor
asignado a la cuenta de servicio de DV360.
Configurar
Sigue estos pasos para configurar la exportación de tablas sin procesar desde DV360.
- Identifique la cuenta de servicio que necesita el exportador de BigQuery de DV360 consultando la sección de detalles de permisos de la cuenta del exportador de BigQuery. Consulta la Figura 2 para obtener más información.
Imagen 2. Identificar la cuenta de servicio en la sección Vincular cuenta de BigQuery Exporter - Obtener Google Cloud permisos. Una persona con el rol
BigQuery Administrator
debe asignar los rolesBigQuery User
yBigQuery Data Editor
a la cuenta de servicio de DV360 identificada en el paso anterior. - Vincule BigQuery a DV360 y especifique el conjunto de datos sin procesar que quiera usar en el proceso. Siga las instrucciones de la sección Habilitar BigQuery del artículo Informes sin conexión.
Vaya a Informes instantáneos y cree un informe por cada fila de la tabla siguiente, con las columnas exactamente como se muestran. Para obtener más información sobre las definiciones detalladas del esquema de columnas de los archivos de
src/DV360/config/table_schema
, consulta la sección Esquema de la tabla de datos sin procesar a datos de CDC.- Añada al menos un filtro de Partner o de Anunciante. Asegúrate de que coincida con los permisos de tu vinculación de BigQuery del paso 3.
- Seleccione Zona horaria del anunciante como zona horaria del informe. Para obtener más información, consulta la sección Consideraciones adicionales.
Prefijo de tabla Campos que incluir lineitem_details
- Fecha
- ID de línea de pedido
- Línea de pedido
- Campaign ID
- Campaña
- Tipo de línea de pedido
- Fecha de inicio de línea de pedido
- Fecha de finalización de línea de pedido
- Impresiones
lineitem_insights
- Fecha
- ID de línea de pedido
- Tipo de dispositivo
- Navegador
- Entorno
- País
- ID de partner
- Partner
- Moneda del partner
- ID de anunciante
- Anunciante
- Moneda del anunciante
- Campaign ID
- Campaña
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Tipo de línea de pedido
- Fecha de inicio de línea de pedido
- Fecha de finalización de línea de pedido
- Impresiones
- Clics
- Ingresos (USD)
- Implicaciones
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
adgroup_insights_by_age_gender
- Fecha
- ID de grupo de anuncios de YouTube
- Edad (YouTube)
- Sexo
- ID de línea de pedido
- ID de partner
- Partner
- Moneda del partner
- AdvertiserID
- Anunciante
- Moneda del anunciante
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Grupo de anuncios de YouTube
- Ingresos (USD)
- Impresiones
- Clics
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
adgroup_insights_by_audience
- Fecha
- ID de grupo de anuncios de YouTube
- Segmento de audiencia
- Tipo de segmento de audiencia
- ID de línea de pedido
- ID de partner
- Partner
- PartnerCurrency
- ID de anunciante
- Anunciante
- Moneda del anunciante
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Impresiones
- Clics
- Grupo de anuncios de YouTube
- Ingresos (USD)
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
adgroup_insights_by_adformat
- Fecha
- ID de grupo de anuncios de YouTube
- Formato de anuncio de YouTube
- ID de línea de pedido
- ID de partner
- Partner
- Moneda del partner
- ID de anunciante
- Anunciante
- Moneda del anunciante
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Impresiones
- Clics
- Grupo de anuncios de YouTube
- Ingresos (USD)
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
adgroup_insights_by_placement
- Fecha
- ID de grupo de anuncios de YouTube
- Emplazamiento (todos los canales de YouTube)
- Nombre de emplazamiento (todos los canales de YouTube)
- ID de línea de pedido
- PartnerID
- Partner
- Moneda del partner
- ID de anunciante
- Anunciante
- Moneda del anunciante
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Impresiones
- Grupo de anuncios de YouTube
- Ingresos (USD)
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
adgroup_insights_by_adtype
- Fecha
- ID de grupo de anuncios de YouTube
- Tipo de anuncio de YouTube
- ID de línea de pedido
- ID de partner
- Partner
- Moneda del partner
- ID de anunciante
- Anunciante
- Moneda del anunciante
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- Impresiones
- Clics
- Grupo de anuncios de YouTube
- Ingresos (USD)
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
ad_insights
- Fecha
- ID de anuncio de YouTube
- ID de línea de pedido
- ID de partner
- Partner
- Moneda del partner
- ID de anunciante
- Anunciante
- AdvertiserCurrency
- ID de pedido de inserción
- Pedido de inserción
- Línea de pedido
- ID de grupo de anuncios de YouTube
- Grupo de anuncios de YouTube
- Anuncio de YouTube
- Impresiones
- Clics
- Ingresos (USD)
- Interacciones (YouTube)
- Ingresos (moneda del partner)
- Ingresos (moneda del anunciante)
- TrueView: visualizaciones
Configura la programación y rellena el historial de datos. Asegúrate de usar el mismo enlace de BigQuery que configuraste en el paso 1, así como el prefijo de tabla exactamente como se muestra en la tabla anterior. Para obtener más información, consulta la sección Consideraciones adicionales.
- Activa manualmente una ejecución de relleno o espera a que se inicie la exportación programada. De cualquier forma, tus datos se almacenarán automáticamente en el conjunto de datos Raw configurado para tu enlace de BigQuery.
Consideraciones adicionales
En cuanto a la selección de la zona horaria:
En algunos tipos de informes, puede elegir la zona horaria del anunciante o la zona horaria UTC para las fechas al configurar la exportación. Sin embargo, los informes relacionados con YouTube solo admiten la zona horaria del anunciante. Por lo tanto, asegúrese de seleccionar la opción de zona horaria del anunciante al configurar las exportaciones.
Como la exportación de informes se agrega previamente a nivel diario, Cortex Framework usa la fecha proporcionada directamente sin conversiones de zona horaria. Eres responsable de interpretar la información de la zona horaria registrada.
Acerca de la programación y la reposición de datos históricos:
Le recomendamos que seleccione Últimos 7 días como periodo de exportación y Diaria como frecuencia de exportación. Es necesario seleccionar un periodo y una frecuencia de exportación para encontrar el equilibrio entre la precisión de los datos y el coste de almacenamiento, aunque cualquier configuración funcionará con nuestro proceso de CDC.
Informes instantáneos permite exportar hasta 14 días de datos a BigQuery, aunque DV360 puede hacer pequeñas actualizaciones de los datos hasta 31 días después de la fecha del informe. Si configura la exportación para varios anunciantes, la fecha de cada anunciante se mostrará en su propia zona horaria.
Si se necesitan datos históricos de forma puntual, la función de informes instantáneos permite exportar directamente a tablas de BigQuery hasta dos años de datos. Asegúrate de hacerlo al menos una vez de forma manual desde la interfaz de usuario de DV360.
Actualización y latencia de los datos
Por lo general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión ascendente, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se ajuste a la frecuencia de los elementos anteriores, las restricciones de recursos y las necesidades de tu empresa.
Con Informes instantáneos de DV360, la actualización de los datos depende de la frecuencia de exportación que se haya definido al configurar BigQuery Export, que puede ser diaria, semanal o mensual.
Configuraciones
En esta sección se describen las configuraciones del proceso de datos.
Conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Consulta más detalles en la documentación de Cloud Composer.
Nombre de la conexión | Purpose |
dv360_cdc_bq
|
En Conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC. |
dv360_reporting_bq
|
Para el conjunto de datos de CDC > conjunto de datos de informes transferencia. |
Esquema de la tabla de datos sin procesar a CDC
El directorio src/DV360/config/table_schema
contiene un archivo de esquema por cada
conjunto de tablas (identificado por el mismo prefijo) que se exporta desde DV360.
Cada archivo de esquema contiene dos columnas: ColumnName
y ColumnDataType
.
Configuración de ingestión
El archivo src/DV360/config/ingestion_settings.yaml
contiene más ajustes que controlan las canalizaciones de datos de Fuente a CDC.
Fuente de las tablas de CDC
Esta sección contiene entradas que controlan cómo se ingieren las tablas exportadas de DV360 y el comportamiento del proceso de CDC correspondiente. Cada entrada se corresponde con un informe de Instant Reporting, identificado por el prefijo de exportación.
Los siguientes parámetros controlan los ajustes de Source to CDC
de cada entrada:
Parámetro | Descripción |
base_table
|
Tabla del conjunto de datos de CDC en la que se almacenan los datos sin procesar después de la transformación de CDC (por ejemplo, customer ).
|
load_frequency
|
Con qué frecuencia se ejecuta un DAG para esta entidad para rellenar la tabla de CDC. Para obtener más información sobre los valores posibles, consulta la documentación de Airflow. |
raw_table_prefix
|
Prefijo que usa el informe de generación de informes instantánea correspondiente para configurar esta exportación de BigQuery. |
row_identifiers
|
Columnas (separadas por comas) que forman un registro único para esta tabla. |
partition_details
|
Opcional: si quieres que esta tabla se particione por motivos de rendimiento. Para obtener más información, consulta Partición de tablas. |
cluster_details
|
Opcional: Si quieres que esta tabla se agrupe para mejorar el rendimiento, consulta más información en Configuración de clústeres. |
Configuración de informes
Puede configurar y controlar cómo genera datos Cortex Framework para la capa de informes final de DV360 mediante el archivo de configuración de informes src/DV360/config/reporting_settings.yaml
. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).
Para obtener más información, consulte Personalizar el archivo de configuración de informes.
Siguientes pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta el artículo Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.