本文說明如何建立及執行 Batch 工作,自動安裝 Ops Agent。安裝作業套件代理程式,在 Cloud Monitoring 中提供作業資源效能的額外指標。如要進一步瞭解如何使用工作資源的成效指標,請參閱「查看指標來監控及最佳化工作資源」。
事前準備
- 如果您從未使用過 Batch,請參閱「開始使用 Batch」,並完成專案和使用者的必要條件,啟用 Batch。
- 如果專案尚未啟用 Cloud Monitoring 和 Cloud Logging API,請按照下列步驟啟用:
-
如要取得建立作業所需的權限,請要求管理員授予下列 IAM 角色:
-
如何建立工作:
-
批次工作編輯者 (
roles/batch.jobsEditor
) 專案 -
服務帳戶使用者 (
roles/iam.serviceAccountUser
) 在作業的服務帳戶上,預設為預設 Compute Engine 服務帳戶
-
批次工作編輯者 (
-
如要查看記錄,請按照下列步驟操作:
在專案中點選「記錄檢視器」 (
roles/logging.viewer
)
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。
-
如何建立工作:
除非您使用作業服務帳戶的預設設定,否則請確保該帳戶具備必要權限。
為確保作業的服務帳戶具備必要權限,能將 Ops Agent 指標寫入 Monitoring,請要求管理員將下列 IAM 角色授予作業的服務帳戶:
- 請確認您規劃的工作設定符合作業套件代理程式需求。
作業套件代理程式需求
如要建立及執行使用 Ops Agent 的工作,工作必須符合下列所有規定:
確認作業的 VM 使用Ops Agent 支援的作業系統 (OS)。如要進一步瞭解作業的 VM OS 映像檔,請參閱「作業 VM 的 OS 環境總覽」。
如果您的工作使用非預設的網路設定,或使用 VPC Service Controls,請確保工作符合 Ops Agent 的存取權需求。詳情請參閱 Google Cloud Observability 說明文件中的「沒有遠端套件存取權的 VM」。
請確認工作不會安裝舊版 Cloud Logging 代理程式或 Cloud Monitoring 代理程式,例如透過自訂映像檔或執行個體範本。
如要進一步瞭解作業套件代理程式的功能和需求,請參閱 Google Cloud Observability 說明文件中的「作業套件代理程式總覽」。
建立自動安裝作業套件代理程式的工作
使用 Google Cloud CLI 或 REST API 建立工作,其中包含設為 true
的 installOpsAgent
欄位,位於 JSON 檔案主體中的 allocationPolicy.instances
欄位:
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
}
舉例來說,自動安裝 Ops Agent 的工作可以有類似下列內容的 JSON 設定檔:
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello World! This is task $BATCH_TASK_INDEX."
}
}
]
},
"taskCount": 3,
}
],
"allocationPolicy": {
"instances": [
{
"installOpsAgent": true
}
]
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
作業的 VM 開始執行後,您就能查看 Ops Agent 指標,與任何其他資源指標相同。詳情請參閱「查看指標,監控及最佳化工作資源」。