Collecter des métriques de ressources supplémentaires à l'aide de l'agent Ops

Ce document explique comment créer et exécuter un job Batch qui installe automatiquement l'agent Ops. Installez l'agent Ops pour fournir des métriques supplémentaires dans Cloud Monitoring sur les performances des ressources d'un job. Pour savoir comment utiliser les métriques de performances des ressources pour un job, consultez Surveiller et optimiser les ressources des jobs en affichant les métriques.

Avant de commencer

  1. Si vous n'avez jamais utilisé Batch, consultez Premiers pas avec Batch et activez Batch en remplissant les conditions préalables pour les projets et les utilisateurs.
  2. Si ce n'est pas déjà fait, activez les API Cloud Monitoring et Cloud Logging pour votre projet :

    Enable the APIs

  3. Pour obtenir les autorisations nécessaires pour créer un job, demandez à votre administrateur de vous accorder les rôles IAM suivants :

    Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

  4. À moins que vous n'utilisiez la configuration par défaut pour le compte de service du job, assurez-vous qu'il dispose des autorisations nécessaires.

    Pour vous assurer que le compte de service du job dispose des autorisations nécessaires pour écrire des métriques de l'agent Ops dans Monitoring, demandez à votre administrateur d'accorder au compte de service du job les rôles IAM suivants :

  5. Assurez-vous que la configuration de votre tâche planifiée répond aux exigences de l'agent Ops.

Exigences de l'agent Ops

Pour créer et exécuter un job qui utilise l'agent Ops, votre job doit répondre à toutes les exigences suivantes :

Pour en savoir plus sur les fonctionnalités et les exigences de l'agent Ops, consultez la présentation de l'agent Ops dans la documentation Google Cloud Observability.

Créer un job qui installe automatiquement l'agent Ops

Utilisez la Google Cloud CLI ou l'API REST pour créer un job qui inclut le champ installOpsAgent défini sur true dans le champ allocationPolicy.instances du corps principal du fichier JSON :

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Par exemple, un job qui installe automatiquement l'agent Ops peut avoir un fichier de configuration JSON semblable à ce qui suit :

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Une fois que les VM du job ont commencé à s'exécuter, vous pouvez afficher les métriques de l'agent Ops de la même manière que les métriques d'autres ressources. Pour en savoir plus, consultez Surveiller et optimiser les ressources des jobs en affichant les métriques.

Étapes suivantes