Coletar mais métricas de recursos usando o Agente de operações

Neste documento, descrevemos como criar e executar um job do Batch que instala automaticamente o Agente de operações. Instale o Agente de operações para fornecer métricas adicionais no Cloud Monitoring sobre o desempenho dos recursos de um job. Para saber mais sobre como usar métricas de desempenho de recursos em um job, consulte Monitorar e otimizar recursos de jobs visualizando métricas.

Antes de começar

  1. Se você nunca usou o Batch, leia Começar a usar o Batch e ative o serviço concluindo os pré-requisitos para projetos e usuários.
  2. Se ainda não tiver feito isso, ative as APIs Cloud Monitoring e Cloud Logging:

    Enable the APIs

  3. Para receber as permissões necessárias para criar um job, peça ao administrador para conceder a você os seguintes papéis do IAM:

    Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

    Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

  4. A menos que você esteja usando a configuração padrão para a conta de serviço do job, verifique se ela tem as permissões necessárias.

    Para garantir que a conta de serviço do job tenha as permissões necessárias para gravar métricas do agente de operações no Monitoring, peça ao administrador para conceder à conta de serviço do job os seguintes papéis do IAM:

  5. Verifique se a configuração planejada do job atende aos requisitos do Agente de operações.

Requisitos do agente de operações

Para criar e executar um job que usa o Agente de operações, ele precisa obedecer a todos os requisitos a seguir:

Para mais informações sobre os recursos e requisitos do agente de operações, consulte a visão geral do agente de operações na documentação do Google Cloud Observability.

Criar um job que instala automaticamente o agente de operações

Use a Google Cloud CLI ou a API REST para criar um job que inclua o campo installOpsAgent definido como true no campo allocationPolicy.instances no corpo principal do arquivo JSON:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Por exemplo, um job que instala automaticamente o Agente de operações pode ter um arquivo de configuração JSON semelhante a este:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Depois que as VMs do job começarem a ser executadas, você poderá ver as métricas do Agente de operações da mesma forma que qualquer outra métrica de recurso. Para mais informações, consulte Monitorar e otimizar recursos de jobs visualizando métricas.

A seguir