Detalles de la ejecución

En esta página, se describe cómo usar la pestaña Detalles de la ejecución en la interfaz de supervisión de Dataflow.

Descripción general

Cuando Dataflow ejecuta un trabajo, convierte los pasos de la canalización en etapas. Mientras que cada paso representa una transformación individual, una etapa representa una sola unidad de trabajo que realiza Dataflow. Para optimizar la canalización, Dataflow puede fusionar varios pasos en una etapa.

La pestaña Detalles de la ejecución en la interfaz de supervisión de Dataflow muestra información sobre las etapas de un trabajo. Puedes usar la pestaña Detalles de la ejecución para solucionar problemas de rendimiento, como los siguientes:

  • Etapas lentas que causan cuellos de botella en el rendimiento
  • Etapas atascadas que no avanzan
  • VMs de trabajador que se retrasan con respecto a otros trabajadores

Cómo ver los detalles de la ejecución

Para ver los detalles de la ejecución de un trabajo, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página Dataflow > Trabajos.

    Ir a Trabajos

  2. Selecciona un trabajo.

  3. Haz clic en la pestaña Detalles de la ejecución.

  4. Selecciona una de las siguientes vistas:

    • Progreso de la etapa
    • Flujo de trabajo de la etapa
    • Progreso de los trabajadores (solo trabajos por lotes)

En las siguientes secciones, se describe cada una de estas vistas.

Vista del progreso de la etapa

La vista Progreso de la etapa te permite observar el progreso general del trabajo y comparar el progreso relativo entre las etapas. El diseño de la vista Progreso de la etapa difiere entre los trabajos por lotes y los trabajos de transmisión.

Progreso de la etapa para trabajos por lotes

En el caso de los trabajos por lotes, la vista Progreso de la etapa muestra las etapas del trabajo en orden de sus horas de inicio. Para cada etapa, se muestran los siguientes elementos:

  • Una barra que muestra las horas de parada y finalización.
  • Un gráfico de líneas que muestra el progreso de la etapa a lo largo del tiempo como un porcentaje del trabajo total de la etapa.
  • Es el tiempo total que se pasó en la etapa.

Ejemplo de la vista de progreso de etapa de un trabajo por lotes.

Para filtrar las etapas que se muestran, haz clic en Filtrar etapas. Para ver la ruta crítica, activa Ruta crítica. La ruta crítica es la secuencia de etapas que contribuyen al entorno de ejecución general del trabajo. Por ejemplo, excluye las ramas que finalizaron antes que el trabajo general y las entradas que no retrasaron el procesamiento descendente.

En el panel Información de la etapa, se muestra información más detallada sobre una etapa. Para ver los detalles de una etapa, haz clic en la barra de progreso de esa etapa. En el panel Información de la etapa, se muestra la siguiente información sobre una etapa:

  • Estado
  • Progreso como porcentaje
  • Hora de inicio y finalización
  • Los pasos de la canalización que abarca esta etapa
  • Los pasos más lentos según el tiempo
  • Detalles sobre los rezagados

Si el panel no está visible, haz clic en Activar panel "Información de la etapa".

Progreso de la etapa para trabajos de transmisión

En el caso de los trabajos de transmisión, la vista Progreso de la etapa tiene dos visualizaciones de la actualización de los datos. La actualidad de los datos es la diferencia entre la marca de tiempo de un elemento de datos y el momento en que se procesa. Los valores más grandes significan que la canalización tarda más en procesar los datos de entrada.

La primera visualización muestra la actualización de los datos por etapa como un gráfico de líneas. Para ver la actualización de los datos en un instante específico, mantén el puntero sobre el gráfico. Para seleccionar el intervalo de tiempo, usa el selector de hora o haz clic en el gráfico y arrástralo para seleccionar el intervalo. Para filtrar las etapas que se muestran, haz clic en Filtrar etapas.

El gráfico también destaca las anomalías en los datos:

  • Desaceleración potencial: La actualidad de los datos supera el percentil 95 para el período seleccionado.
  • Potencial bloqueo: La actualización de datos supera el percentil 99 para el período seleccionado.

La segunda visualización muestra las etapas como una serie de barras. Las etapas se ordenan de forma topológica. Las etapas sin descendientes se muestran primero, seguidas de sus descendientes. Las longitudes de las barras representan la actualidad de los datos. Para ver los valores de actualización de los datos en un punto específico, haz clic en el gráfico. Las barras se actualizan para mostrar la actualización de los datos en el momento seleccionado.

En la siguiente imagen, se muestra un trabajo con cuatro etapas. En la marca de tiempo seleccionada, la actualización de los datos varía de 9 a 13 segundos.

Vista del progreso de la etapa de un trabajo de transmisión, que muestra la actualización de datos entre 8 y 13 segundos.

En la siguiente imagen, se muestra el mismo trabajo con una marca de tiempo diferente seleccionada. En este punto, la actualización de los datos de todas las etapas supera los 4 minutos, lo que indica que la canalización podría estar bloqueada.

La vista de progreso de la etapa de un trabajo de transmisión, que muestra que la actualización de los datos supera los 4 minutos.

En el panel Información de la etapa, se muestra información más detallada sobre una etapa. Para ver los detalles de una etapa, haz clic en la barra de progreso de esa etapa. En el panel Información de la etapa, se muestra la siguiente información sobre una etapa:

  • Estado
  • Retraso del sistema: Es el tiempo máximo que un elemento de datos lleva en espera de procesamiento.
  • Marca de agua de datos: Es el tiempo estimado de finalización de la entrada de datos para esta etapa.
  • Detalles sobre los rezagados
  • Los pasos de la canalización que abarca esta etapa

Si el panel no está visible, haz clic en Activar panel "Información de la etapa".

Flujo de trabajo de la etapa

La vista Flujo de trabajo por etapas muestra las etapas del trabajo como un gráfico de flujo de trabajo. Para ver los detalles de una etapa, haz clic en el cuadro de esa etapa.

Vista de flujo de trabajo por etapas, que muestra la jerarquía de las etapas de ejecución de un trabajo.

En el caso de los trabajos por lotes, haz clic en Ruta crítica para ver solo las etapas que contribuyen directamente al entorno de ejecución general del trabajo.

Progreso de los trabajadores

En el caso de los trabajos por lotes, la vista Progreso del trabajador muestra los trabajadores de una etapa en particular. Esta vista no está disponible para los trabajos de transmisión. Para acceder a esta vista, selecciona Progreso del trabajador y selecciona la etapa en Filtrar trabajadores por etapa. Como alternativa, puedes activar esta vista desde la vista Progreso de la etapa de la siguiente manera:

  1. En la vista Progreso de la etapa, identifica la etapa que deseas ver.
  2. Mantén el puntero sobre la barra de esa etapa.
  3. En la tarjeta Etapa, haz clic en Ver trabajadores. La vista Progreso del trabajador se muestra con la etapa preseleccionada.

Cada barra se asigna a un elemento de trabajo programado para un trabajador. Hay un minigráfico que hace un seguimiento del uso de CPU en un trabajador ubicado con cada trabajador, lo que facilita detectar los problemas de uso insuficiente.

Vista de progreso del trabajador. Los trabajadores tienen barras y minigráficos que corresponden a la programación de elementos de trabajo y los usos de CPU.

¿Qué sigue?