Se usó la API de Cloud Translation para traducir esta página.

Realizar un seguimiento del linaje de los artefactos de canalización

Cada ejecución de canalización creada con Vertex AI Pipelines tiene varios artefactos y parámetros asociados, como modelos, conjuntos de datos, plantillas de canalizaciones y componentes. El linaje de un artefacto de canalización incluye los factores que contribuyeron a su creación, así como los artefactos y los metadatos derivados de él. Por ejemplo, en el linaje del modelo se puede incluir lo siguiente:

Los datos de entrenamiento, prueba y evaluación que se usan para crear el modelo
Los hiperparámetros usados durante el entrenamiento del modelo
Los metadatos que se obtuvieron del proceso de entrenamiento y evaluación, como la exactitud del modelo
Los artefactos que descienden de este modelo, como los resultados de las predicciones por lotes

Puedes usar estos metadatos para responder preguntas como las siguientes:

¿Por qué una ejecución de canalización determinada produjo un modelo muy exacto?
¿Qué ejecución de canalización produjo el modelo más exacto y qué hiperparámetros se usaron para entrenar el modelo?
Según los pasos en la canalización, es posible que puedas responder preguntas sobre la administración del sistema. Por ejemplo, puedes usar los metadatos para determinar qué versión de tu modelo estuvo en producción en un momento determinado.

Para ver y analizar el linaje de los artefactos de canalización, puedes usar Vertex ML Metadata o Dataplex Universal Catalog.

En la siguiente tabla, se describen las diferencias entre Vertex ML Metadata y el catálogo universal de Dataplex:

Función	Vertex ML Metadata	Dataplex Universal Catalog
Tipos de metadatos de canalización capturados	Todos los artefactos de entrada y salida que produce una ejecución de canalización.	Son artefactos de entrada y salida que se pueden asignar a nombres completamente calificados (FQNs) compatibles con Dataplex Universal Catalog, generalmente con los Google Cloud componentes de canalización.
Datos geográficos	Lecturas de una sola región.	Lecturas globales, es decir, en varias regiones
Proyectos	Lecturas de un solo proyecto.	Lecturas en toda la organización en varios proyectos.
Servicios integrados	Se integra en Vertex AI Pipelines, Vertex AI Experiments, Vertex AI Model Registry y conjuntos de datos.	Está integrado en varios Google Cloud productos, como Vertex AI, BigQuery, Cloud Composer y Dataproc.
¿Habilitar?	No, siempre activado.	Habilita la API de Data Lineage para habilitar la opción por proyecto.

Asigna artefactos de Vertex ML Metadata a Dataplex Universal Catalog

Para asignar artefactos de Vertex ML Metadata a los FQDN en Dataplex Universal Catalog, debes hacer lo siguiente:

Usa Google Cloud componentes de canalización cuando crees modelos de Vertex AI y conjuntos de datos administrados.
Usa títulos de esquemas personalizados (google.VertexDataset o google.VertexModel) mientras especificas el nombre del recurso del modelo o del conjunto de datos administrado en el campo metadata, como se ilustra en el siguiente ejemplo:

{
  "name": "projects/example-project/locations/us-central1/metadataStores/default/artifacts/example-artifact",
  "displayName": "My dataset",
  "uri": "https://us-central1-aiplatform.googleapis.com/v1/projects/example-project/locations/us-central1/datasets/example-dataset",
   ...
  "schemaTitle": "google.VertexDataset",
  "schemaVersion": "0.0.1",
  "metadata": {
    "resourceName": "projects/example-project/locations/us-central1/datasets/example-dataset"
  }
}

Analiza el linaje de los artefactos de canalización con Vertex ML Metadata

Cuando ejecutas una canalización con Vertex AI Pipelines, los artefactos y parámetros de la ejecución de tu canalización se almacenan con Vertex ML Metadata. Vertex ML Metadata te permiten analizar el linaje de los artefactos de tu canalización con más facilidad, ya que evitan la dificultad de realizar un seguimiento de los metadatos de la canalización.

Si es la primera vez que usas los metadatos de AA de Vertex, lee la introducción a Vertex ML Metadata.

Sigue estas instrucciones para ver el gráfico de linaje de un artefacto de canalización con Vertex ML Metadata:

En la Google Cloud consola, en la sección Vertex AI, ve a la página Metadatos.

Ir a metadatos

En la página de metadatos, se enumeran los artefactos que se crearon en el almacén de metadatos predeterminado.
En la lista desplegable Región, selecciona la región en la que se creó la ejecución.
Haz clic en el Nombre visible de un artefacto para ver el gráfico de linaje.

Aparece un gráfico estático que muestra los artefactos y las ejecuciones que forman parte de este gráfico de linaje.
Haz clic en un artefacto o una ejecución para obtener más información.

Cómo analizar el linaje de los artefactos de canalización con Dataplex Universal Catalog

Dataplex Universal Catalog descubre los metadatos de los recursos deGoogle Cloud , que incluyen artefactos de Vertex AI Pipelines, como los modelos de Vertex AI, los conjuntos de datos administrados y otros recursos deGoogle Cloud detectables en Dataplex Universal Catalog. Puedes descubrir estos artefactos con la función de búsqueda de metadatos de Dataplex Universal Catalog y ver sus gráficos de linaje.

Para obtener más información sobre la función de búsqueda de metadatos de Dataplex Universal Catalog, consulta Cómo buscar recursos en Dataplex Universal Catalog.

Ten en cuenta que es posible que Dataplex Universal Catalog no esté disponible en todas las regiones en las que se admite Vertex AI Pipelines. Si Dataplex Universal Catalog no es compatible con tu región, usa Vertex ML Metadata. Consulta la lista de regiones compatibles con Dataplex Universal Catalog.

Sigue estas instrucciones para ver el gráfico de linaje de un artefacto de canalización en Dataplex Universal Catalog:

Para iniciar una búsqueda de Dataplex Universal Catalog en la consola de Google Cloud , ve a la página Búsqueda de Dataplex Universal Catalog.

Ir a Búsqueda
Selecciona Dataplex Universal Catalog como el modo de búsqueda.
Usa los filtros para buscar los artefactos. Por ejemplo, puedes usar el filtro Tipos de datos para especificar el tipo de artefacto, como modelo, conjunto de datos o tabla de BigQuery. Para obtener más información, consulta Cómo buscar recursos en Dataplex Universal Catalog.

También puedes definir tu consulta en el campo de búsqueda.
Para ver el linaje de un artefacto, haz clic en su nombre y, luego, en la pestaña Lineage.

En el gráfico de linaje, los procesos de Vertex AI están precedidos por . Estos incluyen artefactos, componentes y plantillas de canalización.
- Para ver los detalles de un proceso, haz clic en él en el gráfico de linaje.
  
  Nota: Los detalles del proceso solo están disponibles si el proceso se catalogó en Dataplex Universal Catalog con un nombre completamente calificado (FQN).
- En el caso de los procesos basados en tareas de canalización de ejecuciones de canalización, puedes hacer lo siguiente:
  - Para ver la ejecución de la canalización en Vertex AI, haz clic en Abrir en Vertex AI en la pestaña Detalles. Para ver los detalles del entorno de ejecución de una ejecución de canalización, como los estados, las marcas de tiempo y los atributos, haz clic en Más. Para ver la canalización que se ejecuta en Vertex AI, haz clic en Abrir en Vertex AI.
- En el caso de los procesos basados en una plantilla de canalización, puedes hacer lo siguiente:
  - Para ver los detalles de la plantilla en Vertex AI, haz clic en Abrir en Vertex AI en la pestaña Detalles.
  - Consulta la lista de tareas de canalización creadas en las ejecuciones de canalización en la pestaña Ejecuciones. Para ver los detalles de la plantilla de canalización en Vertex AI, haz clic en Más y, luego, en Abrir en Vertex AI.

¿Qué sigue?

Obtén información sobre cómo ejecutar una canalización.
Comienza a visualizar y analizar los resultados de las canalizaciones.
Obtén información sobre cómo compilar una canalización de aprendizaje automático.