El linaje de datos muestra las relaciones entre los recursos de tu proyecto y los procesos que los han creado.
Puede ver la información del linaje de datos en la Google Cloud consola de las siguientes formas:
- Gráfico de linaje: muestra el linaje que está antes o después de una sola entrada raíz. Para obtener más información, consulta Gráfico de linaje.
- Visualización de la ruta de linaje (Vista previa): muestra los enlaces de linaje entre dos recursos seleccionados. Para obtener más información, consulta Visualización de la ruta de linaje.
- Vista de lista de linaje (Vista previa): muestra información detallada del linaje de los recursos en una sola tabla que incluye información del linaje de los recursos con muchas conexiones. Para obtener más información, consulta Vista de lista de linaje.
También puede obtener información sobre el linaje de datos de la API Data Lineage en forma de datos JSON.
El linaje se captura en todos los proyectos. Cuando ve el linaje generado a partir de varios proyectos, puede ver la información de linaje agregada en cualquiera de los proyectos pertinentes.
En función del volumen de datos que se esté procesando, el linaje de datos tardará en mostrar un gráfico. La mayoría de los trabajos tardan tres horas, pero algunos pueden tardar hasta 24 horas.
Roles y permisos
Para ver la información del linaje, pide a tu administrador que te conceda roles de lector, tal como se describe en el artículo Roles predefinidos para el linaje de datos. Debes tener acceso tanto al proyecto en el que ves el linaje como a los proyectos en los que se registra el linaje.
Dataplex Universal Catalog registra automáticamente la información del linaje cuando habilitas la API Data Lineage. No necesita ningún rol de administrador o editor para registrar el linaje de sus recursos de datos.
Para obtener más información sobre cómo conceder roles, consulta el artículo sobre cómo gestionar el acceso. Puedes asignar un rol a un nivel de carpeta u organización superior (consulta Conceder o revocar un solo rol).
Habilitar el linaje de datos
Habilita el linaje de datos para empezar a hacer un seguimiento automático de la información de linaje de los sistemas admitidos. Debe habilitar la API Data Lineage tanto en el proyecto en el que vea el linaje como en los proyectos en los que se registre el linaje. Para obtener más información, consulta Tipos de proyectos.
Para obtener información sobre el linaje, haz lo siguiente:
-
En la Google Cloud consola, en la página Selector de proyectos, selecciona el proyecto en el que quieras registrar el linaje.
Habilita la API Data Lineage.
- Repite los pasos anteriores con cada proyecto en el que quieras registrar el linaje.
-
En el proyecto en el que quieras ver el linaje, habilita la API Data Lineage y la API Dataplex.
Ver el linaje en Dataplex Universal Catalog
Puede ver la información del linaje de datos en la interfaz web de Dataplex Universal Catalog.
Para ver el linaje, sigue estas instrucciones:
En la Google Cloud consola, ve a la página Búsqueda de Dataplex Universal Catalog.
Selecciona Dataplex Universal Catalog como modo de búsqueda.
Busca la entrada de la que quieras ver la información de linaje. Para obtener más información, consulta Buscar recursos en Dataplex Universal Catalog.
En la página de detalles de la entrada, seleccione la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Seleccione los botones de proceso o de fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Mostrar.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de procedencia, haga clic en Lista y, a continuación, seleccione el recurso de destino en la tabla de resultados. En el panel de detalles, haga clic en Destino y, a continuación, en Visualizar linaje.
Ver el linaje en BigQuery
Puede ver la información del linaje de datos en la interfaz web de BigQuery.
Para ver el linaje, sigue estas instrucciones:
- En la Google Cloud consola, ve a la página BigQuery.
Abre la tabla de la que quieras ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Seleccione los botones de proceso o de fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Mostrar.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de procedencia, haga clic en Lista y, a continuación, seleccione el recurso de destino en la tabla de resultados. En el panel de detalles, haga clic en Destino y, a continuación, en Visualizar linaje.
Ver el linaje en Vertex AI
Sistemas como Vertex AI Pipelines generan datos de linaje para modelos y conjuntos de datos de Vertex AI. Puedes ver la información del linaje de datos en la interfaz web de Vertex AI.
Ver el linaje de un conjunto de datos gestionado en Vertex AI
Para ver el linaje de un conjunto de datos, sigue estas instrucciones:
- En la Google Cloud consola, ve a la página Conjuntos de datos.
Haga clic en el conjunto de datos del que quiera ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Seleccione los botones de proceso o de fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Mostrar.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de procedencia, haga clic en Lista y, a continuación, seleccione el recurso de destino en la tabla de resultados. En el panel de detalles, haga clic en Destino y, a continuación, en Visualizar linaje.
Ver el linaje de un modelo en Vertex AI
Para ver el linaje de un modelo, sigue estas instrucciones:
En la Google Cloud consola, ve a la página Registro de modelos.
Haz clic en el modelo del que quieras ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Seleccione los botones de proceso o de fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Mostrar.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de procedencia, haga clic en Lista y, a continuación, seleccione el recurso de destino en la tabla de resultados. En el panel de detalles, haga clic en Destino y, a continuación, en Visualizar linaje.
Siguientes pasos
Monitorizar el linaje de datos de las copias y las tareas de consulta de una tabla de BigQuery.
Consulta información sobre el modelo de información de linaje de datos.