自 2025 年 4 月 29 日起，Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案，包括新專案。詳情請參閱「模型版本和生命週期」。

本頁面由 Cloud Translation API 翻譯而成。

監控服務專員

本頁面說明如何使用內建指標、自訂指標和快訊，在 Vertex AI Agent Engine 中監控代理程式。

總覽

您可以使用 Cloud Monitoring 搭配 Vertex AI Agent Engine，無須額外設定或配置。內建代理程式指標會自動收集，並在Google Cloud 主控台的 Cloud Monitoring 頁面中以視覺化方式呈現。

支援的內建指標

系統支援下列代理程式指標，並與 Vertex AI Agent Engine 監控資源 aiplatform.googleapis.com/ReasoningEngine 相關聯：

要求數量
要求的延遲時間
容器 CPU 分配時間
容器記憶體分配時間

如要進一步瞭解指標類型、單位、標籤、延遲時間和取樣週期，請參閱 AI 平台指標完整清單。

查看代理程式指標

您可以使用 Metrics Explorer 在 Google Cloud 主控台中查看代理程式內建的指標：

如要取得在 Metrics Explorer 中查看指標的權限，請要求管理員為您授予專案的Monitoring Viewer 角色 (roles/monitoring.viewer)。
前往 Google Cloud 控制台的「Metrics Explorer」：

前往「Metrics Explorer」。
選取 Google Cloud 專案。
按一下「選取指標」，開啟搜尋列。
在搜尋列中輸入「Vertex AI Reasoning Engine」，然後按一下「Vertex AI Reasoning Engine」。
按一下「Reasoning_engine」指標類別，然後點選指標 (例如「Request count」)。
視需要設定其他標籤篩選器、匯總元素，並調整時間範圍。

根據預設，Metrics Explorer 中「要求數量」指標的圖表會將資料點與預設時間間隔對齊，並以每秒要求次數 (速率指標) 為單位繪製資料點。

查詢代理程式指標

您也可以使用Monitoring Query Language (MQL)、Prometheus Query Language (PromQL) 或 Cloud Monitoring v3 API 查詢指標。MQL 和 PromQL 提供更多指標篩選、匯總和轉換選項，而 Cloud Monitoring API 則可讓您以程式輔助方式列出及查詢所有原始資料點。

使用 MQL 或 PromQL 查詢指標

您可以使用 MQL 或 PromQL 對齊及匯總資料點，並以自訂時間間隔和轉換資料點繪製絕對要求次數 (而非每秒要求次數)：

MQL

fetch aiplatform.googleapis.com/ReasoningEngine
  | metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
  | filter
      (resource.reasoning_engine_id == 'RESOURCE_ID')
      && (metric.response_code == 'RESPONSE_CODE')
  | align delta(10m)
  | every 10m

PromQL

sum_over_time(
  increase(
      aiplatform_googleapis_com:reasoning_engine_request_count{
          monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
          reasoning_engine_id='RESOURCE_ID',
          response_code='RESPONSE_CODE'
      }
      [10m]
  )
  [10m:10m]
)

您可以查詢錯誤率，方法是計算標示為特定錯誤回應代碼 (例如 500) 的要求與要求總數 (失敗要求百分比) 的比率：

MQL

fetch aiplatform.googleapis.com/ReasoningEngine
  | metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
  | filter resource.reasoning_engine_id == 'RESOURCE_ID'
  | { filter metric.response_code == '500' ; ident }
  | align rate(10m)
  | every 10m
  | group_by [], [value_request_count_aggregate: aggregate(value.request_count)]
  | ratio

PromQL

sum_over_time(
  sum(
    rate(
      aiplatform_googleapis_com:reasoning_engine_request_count{
        monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
        reasoning_engine_id='RESOURCE_ID',
        response_code='500'
      }
      [10m]
    )
  )
  [10m:10m]
)
/
sum_over_time(
  sum(
    rate(
      aiplatform_googleapis_com:reasoning_engine_request_count{
        monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
        reasoning_engine_id='RESOURCE_ID',
      }
      [10m]
    )
  )
  [10m:10m]
)

如需比率指標的最佳做法和限制，請參閱「關於指標比率」。如要瞭解如何設定錯誤率指標的快訊，請參閱「JSON 格式的政策範例」。

使用 Cloud Monitoring API 查詢指標

您可以使用 Cloud Monitoring API 執行下列操作：

取得 Vertex AI Agent Engine 監控的資源定義
列出可用的代理程式指標定義
查詢 request_count 的時間序列資料

所有 Agent 指標都與 Agent Engine 監控的資源 aiplatform.googleapis.com/ReasoningEngine 相關聯。

您可以透過 API Explorer、語言專屬用戶端程式庫或指令列來叫用這些 API。如要透過 API Explorer 和用戶端程式庫讀取指標，請參閱說明文件。以下範例說明指令列的用法，具體來說是 curl 工具。

取得 Agent Engine 監控的資源定義

下列指令會使用 projects.monitoredResourceDescriptors 擷取受監控資源的定義，以及可用於篩選的所有標籤：

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/monitoredResourceDescriptors/aiplatform.googleapis.com/ReasoningEngine

標籤應包含 resource_container、location 和 reasoning_engine_id。

列出可用的代理程式指標定義

以下指令會使用 projects.metricDescriptors 擷取 Agent Engine 的所有指標和標籤篩選器：

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/metricDescriptors?filter='metric.type=starts_with("aiplatform.googleapis.com/reasoning_engine")'

結果應包含下列指標的定義，以及各自的特定標籤：

aiplatform.googleapis.com/reasoning_engine/request_count
aiplatform.googleapis.com/reasoning_engine/request_latencies
aiplatform.googleapis.com/reasoning_engine/cpu/allocation_time
aiplatform.googleapis.com/reasoning_engine/memory/allocation_time

查詢 `request_count` 的時間序列資料

您可以使用 projects.timeSeries.list 搭配 interval、filter 和 aggregation 等參數，查詢時序資料。

以下範例說明如何在特定時間範圍內，針對特定介面代理程式例項查詢 request_count 指標的原始資料點：

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/timeSeries?filter='metric.type="aiplatform.googleapis.com/reasoning_engine/request_count"%20AND%20resource.labels.reasoning_engine_id="RESOURCE_ID"&interval.endTime=2025-03-26T11:00:0.0-08:00&interval.startTime=2025-03-26T10:00:0.0-08:00'

更改下列內容：

PROJECT_ID：您的 Google Cloud 專案 ID。
RESOURCE_ID：Agent Engine 執行個體 ID。但這並非必要。您可以在同一個專案中，對多個 Agent Engine 例項執行查詢。
interval.startTime 和 interval.endTime：時間間隔的開始 (包含) 和結束 (不含) 時間，採用 RFC 3339 格式。例如，"2025-03-26T11:22:33Z" 代表世界標準時間 (UTC)，"2025-03-26T11:22:33-08:00" 代表太平洋標準時間 (PST)。如需完整定義和更多範例，請參閱 RFC 3339。

您應該會收到類似以下的回應：

{
  "timeSeries": [
    {
      "metric": {
        "labels": {
          "response_code": "200",
          "response_code_class": "2xx"
        },
        "type": "aiplatform.googleapis.com/reasoning_engine/request_count"
      },
      "resource": {
        "type": "aiplatform.googleapis.com/ReasoningEngine",
        "labels": {
          "reasoning_engine_id": "RESOURCE_ID",
          "location": "LOCATION",
          "project_id": "PROJECT_ID"
        }
      },
      "metricKind": "DELTA",
      "valueType": "INT64",
      "points": [
        {
          "interval": {
            "startTime": "2025-03-26T18:55:27.001Z",
            "endTime": "2025-03-26T18:56:27Z"
          },
          "value": {
            "int64Value": "25"
          }
        },
        {
          "interval": {
            "startTime": "2025-03-26T18:54:27.001Z",
            "endTime": "2025-03-26T18:55:27Z"
          },
          "value": {
            "int64Value": "36"
          }
        }
        // ... more data points ...
      ]
    }
    // ... potentially more time series with other response codes ...
  ],
  "unit": "1"
}

如要進一步瞭解回應格式，請參閱 projects.timeSeries.list。

為代理程式建立自訂指標

如果內建的代理程式指標無法涵蓋您的特定用途，您可以定義自訂指標。您可以使用下列方法建立自訂指標：

記錄指標：觀察大量記錄項目中的趨勢和模式。
使用者定義的指標：未由 Google Cloud定義的指標，例如擷取特定應用程式資料或用戶端系統資料。

記錄指標

以下步驟說明如何為範例工作流程建立及使用以記錄為基礎的指標 (tool_calling_count)，在該工作流程中，多個代理程式會呼叫多個工具，而您想要計算工具的叫用次數：

請指定工具，以便每次呼叫時寫入記錄項目。例如 "tool-\<tool-id\> invoked by agent-\<agent-id\>"。
透過 Google Cloud 控制台建立新的計數器類型記錄指標：
1. 在 Google Cloud 控制台中，前往「記錄指標」頁面：
  
  前往「Logs-based Metrics」(記錄指標)
2. 在「使用者定義指標」部分，按一下「建立指標」。系統隨即會顯示「Create log-based metric」窗格。
3. 在「指標類型」部分，選取「計數器」
4. 在「Details」部分，輸入「Log-based metric name」。例如，tool_calling_count。視需要輸入「Description」(說明)和「Units」(單位)。
5. 針對「Filter selection」部分，執行下列操作：
  1. 在「Select project or log bucket」下拉式清單中，選取「Project logs」
  2. 在「Build filter」欄位中，使用記錄查詢語言輸入記錄篩選器。例如：
```
resource.type="aiplatform.googleapis.com/ReasoningEngine"
resource.labels.reasoning_engine_id="RESOURCE_ID"
textPayload =~ "tool-\d+ invoked by agent-\d+" -- assuming both tool and agent IDs are numeric
```
6. 在「標籤」部分，按一下「新增標籤」按鈕，新增兩個標籤。
  1. 針對第一個標籤，請執行下列操作：
    1. 在「Label name」欄位中輸入 tool。
    2. 在「欄位名稱」欄位中輸入 textPayload。
    3. 在「規則運算式」欄位中輸入 (tool-\d+) invoked by agent-\d+。
  2. 針對第二個標籤，請執行下列操作：
    1. 在「Label name」欄位中輸入 agent。
    2. 在「欄位名稱」欄位中輸入 textPayload。
    3. 在「規則運算式」欄位中輸入 tool-\d+ invoked by (agent-\d+)。
  提示： 如果專案中已有這類工具叫用記錄，請按一下「預覽」，測試 tool 和 agent 的規則運算式。
  1. 按一下 [完成]。
7. 點選「建立指標」。
如要查看 tool_calling_count 指標及其相關記錄，請在 Google Cloud 主控台中執行下列操作：
1. 前往 Google Cloud 控制台的「Metrics Explorer」頁面：
  
  前往「Metrics Explorer」。
2. 按一下「選取指標」，開啟搜尋列。
3. 在搜尋列中輸入「Vertex AI Reasoning Engine」，然後按一下「Vertex AI Reasoning Engine」。
4. 按一下「記錄指標」指標類別，然後點選「Logging/user/tool_calling_count」。視需要調整時間範圍。
5. (選用) 依標籤 tool 和 agent 篩選。
  - 如要取得所有服務項目的特定工具總叫用次數，請將篩選器標籤 tool 設為該工具 ID 的值。
  - 如要取得特定服務代理程式在所有工具中的總叫用次數，請將篩選器標籤 agent 設為該服務代理程式 ID 的值。
  您可以視需要將「Sum By」設為 tool 或 agent，取得依不同工具或代理人區分的總數。

如要瞭解如何寫入代理程式記錄，請參閱「記錄代理程式」一文，如要進一步瞭解記錄指標，請參閱「記錄指標總覽」。

使用者定義的指標

以下步驟說明如何為示範工作流程建立及使用使用者定義的指標 (token_count)，在工作流程中，多個代理程式會呼叫多個模型，而您想要計算已用完的權杖總數 (假設您追蹤應用程式啟動後，每個叫用代理程式和目標模型的權杖數量)：

使用下列參數呼叫 projects.metricDescriptors.create，定義自訂指標類型：
- name：網址字串，例如 projects/PROJECT_ID
- Request body：MetricDescriptor 物件：
```
{
  "name": "token_count",
  "description": "Token Consumed by models.",
  "displayName": "Token Count",
  "type": "custom.googleapis.com/token_count",
  "metricKind": "CUMULATIVE",
  "valueType": "INT64",
  "unit": "1",
  "labels": [
    {
      "key": "model",
      "valueType": "STRING",
      "description": "Model."
    },
    {
      "key": "agent",
      "valueType": "STRING",
      "description": "Agent."
    }
  ],
  "monitoredResourceTypes": [
    "generic_node"
  ]
}
```
  新的指標 token_count 會使用類型 Cumulative 建立，代表應用程式啟動後的權杖總數。如要進一步瞭解 Cumulative 指標，請參閱「指標類型和類型」。標籤 model 和 agent 分別代表目標大型語言模型 (LLM) 和叫用代理程式名稱。
1. 您可以在 Metrics Explorer 中找到 token_count 指標：
  1. 前往 Google Cloud 控制台的「Metrics Explorer」頁面：
  前往「Metrics Explorer」。
  1. 按一下「選取指標」，開啟搜尋列。
  2. 在搜尋列中輸入「Generic node」，然後按一下「自訂指標」。
  3. 按一下「Token Count」。
注意： 這個步驟只需進行一次。

使用下列參數呼叫 projects.timeSeries.create，將資料點寫入新指標：

name：網址字串，例如 projects/PROJECT_ID

Request body：TimeSeries 物件清單：

{
  "timeSeries": [
    {
      "metric": {
        "type": "custom.googleapis.com/token_count",
        "labels": {
          "model": "model-1",
          "agent": "agent-1"
        }
      },
      "resource": {
        "type": "generic_node",
        "labels": {
          "project_id": "PROJECT_ID",
          "node_id": "RESOURCE_ID",
          "namespace": "",
          "location": "us-central1"
        }
      },
      "points": [
        {
          "interval": {
            "startTime": "2025-03-26T10:00:00-08:00",
            "endTime": "2025-03-26T10:01:00-08:00"
          },
          "value": {
            "int64Value": 15
          }
        }
      ]
    },
    {
      "metric": {
        "type": "custom.googleapis.com/token_count",
        "labels": {
          "model": "model-1",
          "agent": "agent-2"
        }
      },
      "resource": {
        "type": "generic_node",
        "labels": {
          "project_id": "PROJECT_ID",
          "node_id": "RESOURCE_ID",
          "namespace": "",
          "location": "us-central1"
        }
      },
      "points": [
        {
          "interval": {
            "startTime": "2025-03-26T10:00:00-08:00",
            "endTime": "2025-03-26T10:01:00-08:00"
          },
          "value": {
            "int64Value": 20
          }
        }
      ]
    }
    // ... more time series ...
  ]
}

透過 Cloud Monitoring API 上傳資料點後，您就可以透過 Google Cloud 主控台查看新的指標 token_count：
1. 前往 Google Cloud 控制台的「Metrics Explorer」頁面：
  
  前往「Metrics Explorer」。
2. 按一下「選取指標」，開啟搜尋列。
3. 在搜尋列中輸入「Generic node」，然後按一下「自訂指標」。
4. 按一下「Token Count」。視需要調整時間範圍，並設定 model 或 agent 的標籤值。

為服務專員建立快訊

您可以將指標與快訊搭配使用。詳情請參閱快訊總覽。

以下範例說明如何為 request_latencies 指標建立門檻快訊，以便在延遲時間在指定時間範圍內超過預定值時收到通知：

前往 Google Cloud 控制台的「Alerting」(快訊) 頁面：

前往「Alerting」
點選「Create Policy」(建立政策)。「Create alerting policy」頁面隨即開啟。
1. 針對「政策設定模式」，請選取「建構工具」。
2. 在「Select a metric」下拉式選單中，依序選取 Vertex AI Reasoning Engine -> reasoning_engine -> Request Latency。
3. 在「Add filters」部分，視需要設定篩選器 (例如 reasoning_engine_id、response_code)。
4. 在「Transform data」區段中，將「Rolling window」和「Rolling window function」切換至 5min 和 99th percentile 等值 (監控 5 分鐘對齊期間內的請求延遲的第 99 百分位數)。
5. 點按「Next」。
在「Configure alert trigger」(設定快訊觸發條件) 區段中，執行下列操作：
1. 在「Condition Types」中選取「Threshold」。
2. 選取「Alert trigger」(快訊觸發條件)，例如「Any time series violates」(任何時間序列違反條件時)。
3. 選取「門檻位置」，例如「高於門檻」。
4. 輸入門檻值，例如 5000ms。
5. 點按「Next」。
在「Configure notifications and finalize alert」(設定通知並完成快訊) 部分執行下列操作：
1. 選取一或多個通知管道。詳情請參閱「管理通知管道」。
2. (選用) 設定通知主旨、事件自動關閉期限、應用程式標籤、政策標籤、嚴重性等級和其他文件。
3. 在「為快訊政策命名」部分設定政策名稱，例如 latency-99p-alert。
4. 按一下「建立政策」。

如發生事件，請參閱以指標為基礎的警告政策事件，進一步瞭解如何確認及調查事件，以及靜音警告。

如需更多快訊範例，請參閱「JSON 格式中的範例政策」。

監控代理程式指標

您可以使用 Vertex AI Agent Engine 總覽資訊主頁，監控代理程式的運作健康狀態和效能。

查看預設資訊主頁

前往 Google Cloud 控制台的「Dashboards」(資訊主頁) 頁面：

前往「Dashboards」(資訊主頁)
選取 Google Cloud 專案。
在「My Dashboards」窗格中，新增篩選器 Name:Vertex AI Agent Engine Overview。
按一下「Vertex AI Agent Engine 總覽」，即可顯示預設的服務台資訊主頁。

自訂預設資訊主頁

預設資訊主頁只包含代理程式內建指標。如要將自己的自訂指標新增至資訊主頁，請按照下列步驟複製及自訂預設資訊主頁：

開啟預設資訊主頁。
按一下「複製資訊主頁」。在「複製資訊主頁」對話方塊中，按一下「複製」。資訊主頁副本隨即開啟。您也可以在「我的資訊主頁」窗格中的「自訂」類別下找到資訊主頁副本。
在資訊主頁副本中，按照下列步驟新增指標：
1. 點選「新增小工具」。畫面上隨即會顯示「Add widget」側邊面板。
2. 在「資料」部分，選取「指標」。「Configure widget」側邊面板隨即顯示。
3. 按一下「選取指標」，開啟搜尋列。
4. 如果您使用記錄指標建立自訂指標，請注意：
  1. 在搜尋列中輸入「Vertex AI Reasoning Engine」，然後按一下「Vertex AI Reasoning Engine」。
  2. 按一下「記錄檔」指標類別，然後點選指標，例如「Logging/user/tool_calling_count」。
  3. 按一下 [套用]。
5. 如果您是使用使用者定義指標建立自訂指標，請注意：
  1. 在搜尋列中輸入「Generic Node」，然後按一下「Generic Node」。
  2. 按一下「自訂指標」指標類別，然後點選指標 (例如「符記數量」)。
  3. 按一下 [套用]。
6. 資訊主頁會顯示新的圖表，其中顯示自訂指標。
您可以進一步調整資訊主頁的版面配置，例如：
1. 按住小工具標題，然後拖曳到同一數值面板的其他位置，即可移動小工具。
2. 按住小工具的右下角，然後調整大小即可調整小工具大小。

如要進一步瞭解如何使用Monitoring Query Language (MQL) 或 Prometheus 查詢語言 (PromQL) 新增指標圖表，以及製作指標表格，請參閱「在自訂資訊主頁中新增圖表和表格」。

如果您已設定自訂快訊，請參閱在資訊主頁上顯示快訊政策和快訊，瞭解如何將這類快訊新增至資訊主頁。

監控服務專員 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

總覽

支援的內建指標

查看代理程式指標

查詢代理程式指標

使用 MQL 或 PromQL 查詢指標

MQL

PromQL

MQL

PromQL

使用 Cloud Monitoring API 查詢指標

取得 Agent Engine 監控的資源定義

列出可用的代理程式指標定義

查詢 request_count 的時間序列資料

為代理程式建立自訂指標

記錄指標

使用者定義的指標

為服務專員建立快訊

監控代理程式指標

查看預設資訊主頁

自訂預設資訊主頁

監控服務專員

查詢 `request_count` 的時間序列資料