El linaje de datos muestra las relaciones entre los recursos de tu proyecto y los procesos que los crearon.
Puedes ver la información del linaje de datos en la consola de Google Cloud en las siguientes formas:
- Gráfico de linaje: Muestra el linaje que es upstream o downstream de una sola entrada raíz. Para obtener más información, consulta Gráfico de linaje.
- Visualización de rutas de linaje (Versión preliminar): Muestra los vínculos de linaje entre dos recursos seleccionados. Para obtener más información, consulta Visualización de la ruta de linaje.
- Vista de lista de linaje (vista previa): Muestra información detallada del linaje de los recursos en una sola tabla que incluye información del linaje de los recursos con muchas conexiones. Para obtener más información, consulta Vista de lista de linaje.
También puedes recuperar información del linaje desde la API de Data Lineage en forma de datos JSON.
El linaje se captura en todos los proyectos. Cuando ves el linaje generado a partir de varios proyectos, puedes ver la información de linaje agregada en cualquiera de los proyectos pertinentes.
Según el volumen de datos que se procesan, el linaje de datos tarda en mostrar un gráfico. La mayoría de los trabajos tardan tres horas, y algunos pueden tardar hasta 24 horas.
Funciones y permisos
Para ver la información de linaje, pídele a tu administrador que te otorgue roles de visualizador, como se describe en Roles predefinidos para el linaje de datos. Debes tener acceso al proyecto en el que ves el linaje y a los proyectos en los que se registra el linaje.
Dataplex Universal Catalog hace un seguimiento de la información de linaje automáticamente cuando habilitas la API de Data Lineage. No necesitas ningún rol de administrador o editor para capturar el linaje de tus activos de datos.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso. Puedes asignar un rol en un nivel superior de la organización o la carpeta (consulta Otorga o revoca un solo rol).
Habilita el linaje de datos
Habilita el linaje de datos para comenzar a hacer un seguimiento automático de la información de linaje de los sistemas compatibles. Debes habilitar la API de Data Lineage tanto en el proyecto en el que ves el linaje como en los proyectos en los que se registra el linaje. Para obtener más información, consulta Tipos de proyectos.
Para capturar información del linaje, haz lo siguiente:
-
En la consola de Google Cloud , en la página del selector de proyectos, selecciona el proyecto en el que deseas registrar el linaje.
Habilita la API de Data Lineage.
- Repite los pasos anteriores para cada proyecto en el que quieras registrar el linaje.
-
En el proyecto en el que ves el linaje, habilita la API de Data Lineage y la API de Dataplex.
Consulta el linaje en Dataplex Universal Catalog
Puedes ver la información del linaje de datos en la interfaz web de Dataplex Universal Catalog.
Para ver el linaje, sigue estas instrucciones:
En la consola de Google Cloud , ve a la página Búsqueda de Dataplex Universal Catalog.
Selecciona Dataplex Universal Catalog como el modo de búsqueda.
Busca la entrada para la que deseas ver la información del linaje. Para obtener más información, consulta Cómo buscar recursos en Dataplex Universal Catalog.
En la página de detalles de la entrada, selecciona la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Selecciona los botones de proceso o fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Expandir.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de linaje, haz clic en Lista y, luego, selecciona el recurso de destino en la tabla de resultados. En el panel de detalles, haz clic en Destino y, luego, en Visualizar linaje.
Cómo ver el linaje en BigQuery
Puedes ver la información del linaje de datos en la interfaz web de BigQuery.
Para ver el linaje, sigue estas instrucciones:
- En la consola de Google Cloud , ve a la página BigQuery.
Abre la tabla para la que deseas ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Selecciona los botones de proceso o fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Expandir.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de linaje, haz clic en Lista y, luego, selecciona el recurso de destino en la tabla de resultados. En el panel de detalles, haz clic en Destino y, luego, en Visualizar linaje.
Cómo ver el linaje en Vertex AI
Los sistemas como Vertex AI Pipelines generan datos de linaje para los modelos y conjuntos de datos de Vertex AI. Puedes ver la información del linaje de datos en la interfaz web de la IU de Vertex AI.
Cómo ver el linaje de un conjunto de datos administrado en Vertex AI
Para ver el linaje de un conjunto de datos, sigue estas instrucciones:
- En la consola de Google Cloud , ve a la página Conjuntos de datos.
Haz clic en el conjunto de datos para el que deseas ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Selecciona los botones de proceso o fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Expandir.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de linaje, haz clic en Lista y, luego, selecciona el recurso de destino en la tabla de resultados. En el panel de detalles, haz clic en Destino y, luego, en Visualizar linaje.
Consulta el linaje de un modelo en Vertex AI
Para ver el linaje de un modelo, sigue estas instrucciones:
En la consola de Google Cloud , ve a la página Model Registry.
Haz clic en el modelo para el que deseas ver el linaje de datos.
Haz clic en la pestaña Linaje.
Para ver el gráfico de linaje, haz clic en Gráfico.
Selecciona los botones de proceso o fuente de datos para mostrar el panel de detalles.
Para ver la información de linaje ascendente o descendente de un recurso, haz clic en
Expandir.
Para ver el linaje en la vista de lista, haz clic en Lista.
Para ver la visualización de la ruta de linaje, haz clic en Lista y, luego, selecciona el recurso de destino en la tabla de resultados. En el panel de detalles, haz clic en Destino y, luego, en Visualizar linaje.
¿Qué sigue?
Obtén información sobre el modelo de información del linaje de datos.