Monitora e ottimizza le risorse dei job visualizzando le metriche

Questo documento descrive come monitorare e tentare di ottimizzare le risorse per un job Batch visualizzando le metriche in Cloud Monitoring. Per scoprire di più sulle risorse su cui viene eseguito un job, consulta Risorse del job.

Per qualsiasi job, Monitoring fornisce metriche di base come l'utilizzo della CPU e il traffico di rete. Tuttavia, alcune metriche, come l'utilizzo della memoria e dei processi, possono essere raccolte solo se un job installa Ops Agent. Le metriche per le risorse di un job ti aiutano a valutare il rendimento e l'utilizzo di ciascuna risorsa. Queste informazioni possono aiutarti a identificare i miglioramenti per le iterazioni future del lavoro. Ad esempio, puoi rimuovere le risorse non utilizzate per ottimizzare i costi oppure puoi migliorare o aumentare le risorse sotto pressione per migliorare il rendimento.

Prima di iniziare

  1. Se non hai mai utilizzato Batch, consulta la sezione Guida introduttiva a Batch e attiva Batch completando i prerequisiti per progetti e utenti.
  2. (Facoltativo) Per raccogliere metriche aggiuntive per un job, crea ed esegui un job che installa automaticamente Ops Agent.
  3. Se non l'hai ancora fatto, abilita l'API Monitoring:

    Enable the API

  4. Per ottenere le autorizzazioni necessarie per visualizzare le metriche di osservabilità, chiedi all'amministratore di concederti il ruolo IAM Visualizzatore metriche Monitoring (roles/monitoring.metricViewer) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

    Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Visualizzare le metriche per le risorse di lavoro

Osserva e monitora le VM nella documentazione di Compute Engine fornisce informazioni concettuali pertinenti sulle metriche delle VM; tuttavia, per visualizzare le metriche delle VM per i job batch sono consigliati metodi diversi. In particolare, la documentazione di Compute Engine spiega come visualizzare le metriche utilizzando i dashboard di Monitoring predefiniti per Compute Engine o le pagine di Compute Engine nella console Google Cloud . Tuttavia, è importante sottolineare che questi metodi non mostrano informazioni sulle VM che sono state eliminate. Di conseguenza, non utilizzare questi metodi a meno che tu non voglia visualizzare le metriche per i job batch durante l'esecuzione.

Visualizza le metriche per i job Batch in esecuzione e completati utilizzando i grafici di Metrics Explorer, come spiegato in questa sezione. In particolare, i grafici sono temporanei, a meno che non li salvi in dashboard personalizzate.

Per creare un grafico per visualizzare una o più metriche:

  1. (Facoltativo) Se prevedi di salvare il grafico, identifica o crea una dashboard personalizzata per il grafico.
  2. Crea un grafico di Metrics Explorer per una o più metriche.

    Senza filtri, ogni metrica VM in un grafico include i dati di tutte le VM del tuo progetto. (Facoltativo) Se vuoi filtrare il grafico in modo da includere solo le metriche di tutti i job batch o di job batch specifici, aggiungi il seguente filtro:

    group=RESOURCE_GROUP_NAME
    

    Sostituisci RESOURCE_GROUP_NAME con il nome di un gruppo di risorse per i job batch. Per saperne di più, consulta Creare gruppi di risorse per filtrare le metriche in questo documento.

Creare gruppi di risorse per filtrare le metriche

Puoi utilizzare i gruppi di risorse come filtri personalizzabili per i grafici diMetrics Explorere. Per creare un gruppo di risorse per tutti i job Batch o per job Batch specifici nel tuo progetto:

  1. Seleziona un'etichetta da utilizzare come criterio di appartenenza in base ai job che vuoi includere nel gruppo:

    • Tutti i job Batch:utilizza l'etichetta batch-node predefinita, che viene applicata automaticamente a tutte le risorse per tutti i job Batch e ha un valore nullo.
    • Job batch specifici:utilizza un'etichetta applicata alle risorse solo per job batch specifici.

      Ad esempio, se vuoi creare un gruppo in base ai nomi di lavoro completi o parziali, utilizza il nome dell'etichetta batch-job-id predefinita con un valore specifico. L'etichetta batch-job-id viene applicata automaticamente a tutte le risorse per tutti i job Batch e definita con il nome del job.

      In alternativa, se utilizzi un'etichetta personalizzata, devi applicarla a tutte le risorse dei job batch che vuoi includere nel gruppo quando crei i job.

  2. Assicurati che il progetto abbia almeno un job con l'etichetta selezionata e che questo job sia nello stato RUNNING. In caso contrario, questa etichetta non verrà visualizzata come opzione quando tenti di creare il gruppo di risorse.

  3. Crea un gruppo di risorse. Quando specifichi i criteri di appartenenza, procedi nel seguente modo:

    1. Imposta Tipo su Tag.
    2. Imposta il campo Tag sul nome dell'etichetta selezionata. Poi imposta i seguenti campi in base ai valori delle etichette che vuoi includere nel gruppo.

      Ad esempio, se vuoi che questo gruppo includa tutti i job Batch, imposta Tag su batch-node e Operatore su Esiste. In alternativa, se vuoi che questo gruppo includa i job batch con nomi che iniziano con test, imposta Tag su batch-job-id, imposta Operatore su Inizia con e imposta Valore su test.

Passaggi successivi