Supervisar y optimizar los recursos del trabajo a través de la visualización de las métricas

Este documento describe cómo supervisar y tratar de optimizar los recursos para una Trabajo por lotes mediante la visualización de las métricas en Cloud Monitoring. Para obtener más información sobre los recursos en los que se ejecuta un trabajo, consulta Recursos de trabajo.

Para cualquier trabajo, Monitoring proporciona métricas básicas, como los la utilización y el tráfico de red. Sin embargo, algunas métricas, como el uso de memoria y procesos, solo se pueden recopilar si un trabajo instala el Agente de operaciones. Las métricas de los recursos de un trabajo te ayudan a evaluar el rendimiento y el uso de cada recurso. Esta información puede ayudarte a identificar mejoras para cualquier iteraciones futuras del trabajo. Por ejemplo, puedes quitar recursos que no se usaron para optimizar los costos, o bien podrías mejorar o aumentar los recursos ayudan a mejorar el rendimiento.

Antes de comenzar

  1. Si nunca usaste Batch, revisa Comienza a usar Batch y habilitar Batch completando el requisitos previos para los proyectos y usuarios.
  2. Opcional: Para recopilar métricas adicionales de un trabajo, crea y ejecuta un trabajo que instale automáticamente el Agente de operaciones.
  3. Si tu proyecto aún no lo ha hecho, habilita la API de Monitoring:

    Enable the API

  4. A fin de obtener los permisos que necesitas para ver las métricas de observabilidad, solicita a tu administrador que te otorgue el Rol de IAM de Visualizador de métricas de Monitoring (roles/monitoring.metricViewer) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Ver métricas de los recursos del trabajo

Observa y supervisa VMs en la documentación de Compute Engine brinda información conceptual relevante sobre las métricas de VM; sin embargo, se recomiendan diferentes métodos para visualizar Métricas de VM para trabajos por lotes. En concreto, la En la documentación de Compute Engine, se explica cómo ver las métricas con la paneles predefinidos de Monitoring para Compute Engine Páginas de Compute Engine en la consola de Google Cloud. Pero lo más importante es que esos métodos no muestran información sobre las VMs que tienen se borró. Por lo tanto, no uses esos métodos, a menos que solo quieras ver las métricas de los trabajos por lotes mientras se ejecutan.

Consulta las métricas de los trabajos por lotes en ejecución y terminados con los gráficos del Explorador de métricas, como se explica en esta sección. En particular, los gráficos son temporales, a menos que guardes paneles personalizados.

Si deseas crear un gráfico para ver una o más métricas, haz lo siguiente:

  1. Opcional: Si planeas guardar el gráfico, identificar o crear un panel personalizado para el gráfico.
  2. Crea un gráfico del Explorador de métricas para una o más métricas.

    Sin filtros, cada métrica de VM de un gráfico incluye datos de todas las VMs en tu proyecto. Opcionalmente, si quieres filtrar el gráfico para que solo incluya métricas de todos los trabajos por lotes o de trabajos específicos, agrega lo siguiente: filtro:

    group=RESOURCE_GROUP_NAME
    

    Reemplaza RESOURCE_GROUP_NAME por el nombre de un grupo de recursos para trabajos por lotes. Para obtener más información, consulta Crea grupos de recursos para filtrar las métricas en esta .

Crea grupos de recursos para filtrar métricas

Puedes usar los grupos de recursos como filtros personalizables para los gráficos del Explorador de métricas. Para crear un grupo de recursos para todas las tareas por lotes o tareas específicas en tu proyecto, haz lo siguiente:

  1. Selecciona una etiqueta para usarla como criterio de membresía según los trabajos que deseas incluir en el grupo:

    • Todos los trabajos por lotes: usa etiqueta batch-node predefinida, que se aplica automáticamente a todos los recursos para todos los trabajos por lotes y tiene un valor nulo.
    • Trabajos por lotes específicos: usa una etiqueta que se aplique a los recursos solo para trabajos específicos de Batch.

      Por ejemplo, si quieres crear un grupo basado en trabajos completos o parciales usa el nombre predefinido de la etiqueta batch-job-id con un valor específico. La etiqueta batch-job-id se aplica automáticamente a todos los recursos para todos los trabajos por lotes y se define con el nombre del trabajo.

      Como alternativa, si usas una etiqueta personalizada, debes aplicar etiqueta personalizada a todos los recursos de los trabajos por lotes que que quieres que se incluya en el grupo cuando crees los trabajos.

  2. Asegúrate de que tu proyecto tenga al menos un trabajo con la etiqueta y que este trabajo tiene el estado RUNNING. De lo contrario, esta etiqueta como opción cuando intentes crear el grupo de recursos.

  3. Crea un grupo de recursos. Cuando especifiques los criterios de membresía, haz lo siguiente:

    1. Configura el Tipo como Etiqueta.
    2. Establece el campo Etiqueta con el nombre de la etiqueta seleccionada. Luego, configura siguientes campos basados en los valores de etiqueta que quieres que el grupo incluir.

      Por ejemplo, si quieres que este grupo incluya trabajos, establece la Etiqueta en batch-node y el Operador como Exists. De manera alternativa, quieres que este grupo incluya trabajos por lotes con nombres que comienzan con test, establece Tag en batch-job-id Configura Operator (Operador) en Starts with (Comienza con) y Value (Valor) en test.

¿Qué sigue?