使用 Ops Agent 收集其他資源指標

本文說明如何建立及執行 Batch 工作,自動安裝 Ops Agent。安裝作業套件代理程式,在 Cloud Monitoring 中提供作業資源效能的額外指標。如要進一步瞭解如何使用工作資源的成效指標,請參閱「查看指標來監控及最佳化工作資源」。

事前準備

  1. 如果您從未使用過 Batch,請參閱「開始使用 Batch」,並完成專案和使用者的必要條件,啟用 Batch。
  2. 如果專案尚未啟用 Cloud Monitoring 和 Cloud Logging API,請按照下列步驟啟用:

    Enable the APIs

  3. 如要取得建立作業所需的權限,請要求管理員授予下列 IAM 角色:

    如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。

    您或許還可透過自訂角色或其他預先定義的角色取得必要權限。

  4. 除非您使用作業服務帳戶的預設設定,否則請確保該帳戶具備必要權限。

    為確保作業的服務帳戶具備必要權限,能將 Ops Agent 指標寫入 Monitoring,請要求管理員將下列 IAM 角色授予作業的服務帳戶:

    • 專案的「Monitoring 指標寫入者」 (roles/monitoring.metricWriter)
    • 專案的「記錄寫入者」 (roles/logging.logWriter)

  5. 請確認您規劃的工作設定符合作業套件代理程式需求

作業套件代理程式需求

如要建立及執行使用 Ops Agent 的工作,工作必須符合下列所有規定:

如要進一步瞭解作業套件代理程式的功能和需求,請參閱 Google Cloud Observability 說明文件中的「作業套件代理程式總覽」。

建立自動安裝作業套件代理程式的工作

使用 Google Cloud CLI 或 REST API 建立工作,其中包含設為 trueinstallOpsAgent 欄位,位於 JSON 檔案主體中的 allocationPolicy.instances 欄位:

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

舉例來說,自動安裝 Ops Agent 的工作可以有類似下列內容的 JSON 設定檔:

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

作業的 VM 開始執行後,您就能查看 Ops Agent 指標,與任何其他資源指標相同。詳情請參閱「查看指標,監控及最佳化工作資源」。

後續步驟