Raccogli metriche aggiuntive sulle risorse utilizzando Ops Agent

Questo documento descrive come creare ed eseguire un job Batch che installa automaticamente Ops Agent. Installa Ops Agent per fornire metriche aggiuntive in Cloud Monitoring sulle prestazioni delle risorse di un job. Per scoprire di più sull'utilizzo delle metriche sul rendimento delle risorse per un job, consulta Monitorare e ottimizzare le risorse dei job visualizzando le metriche.

Prima di iniziare

  1. Se non hai mai utilizzato Batch, consulta la sezione Guida introduttiva a Batch e attiva Batch completando i prerequisiti per progetti e utenti.
  2. Se non l'hai ancora fatto, abilita le API Cloud Monitoring e Cloud Logging:

    Enable the APIs

  3. Per ottenere le autorizzazioni necessarie per creare un job, chiedi all'amministratore di concederti i seguenti ruoli IAM:

    Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

    Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

  4. A meno che tu non utilizzi la configurazione predefinita per il service account del job, assicurati che disponga delle autorizzazioni necessarie.

    Per assicurarti che il account di servizio del job disponga delle autorizzazioni necessarie per scrivere le metriche dell'Ops Agent in Monitoring, chiedi all'amministratore di concedere al account di servizio del job i seguenti ruoli IAM:

  5. Assicurati che la configurazione del job pianificato soddisfi i requisiti dell'agente operativo.

Requisiti dell'Ops Agent

Per creare ed eseguire un job che utilizza Ops Agent, il job deve soddisfare tutti i seguenti requisiti:

Per saperne di più sulle funzionalità e sui requisiti di Ops Agent, consulta la panoramica di Ops Agent nella documentazione di Google Cloud Observability.

Crea un job che installi automaticamente l'Ops Agent

Utilizza Google Cloud CLI o l'API REST per creare un job che includa il campo installOpsAgent impostato su true nel campo allocationPolicy.instances nel corpo principale del file JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Ad esempio, un job che installa automaticamente l'Ops Agent può avere un file di configurazione JSON simile al seguente:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Dopo l'avvio delle VM del job, puoi visualizzare le metriche dell'Ops Agent come qualsiasi altra metrica delle risorse. Per saperne di più, vedi Monitorare e ottimizzare le risorse dei job visualizzando le metriche.

Passaggi successivi