Memantau agen

Halaman ini menjelaskan cara menggunakan metrik bawaan, metrik kustom, dan pemberitahuan untuk memantau agen Anda di Vertex AI Agent Engine.

Ringkasan

Anda dapat menggunakan Vertex AI Agent Engine menggunakan Cloud Monitoring tanpa penyiapan atau konfigurasi tambahan. Metrik agen bawaan dikumpulkan dan divisualisasikan secara otomatis di halaman Cloud Monitoring di konsolGoogle Cloud .

Metrik bawaan yang didukung

Metrik agen berikut didukung dan dikaitkan dengan resource yang dipantau Vertex AI Agent Engine aiplatform.googleapis.com/ReasoningEngine:

  • Jumlah permintaan
  • Latensi permintaan
  • Waktu alokasi CPU container
  • Waktu alokasi memori container

Lihat daftar lengkap metrik AI Platform untuk mengetahui detail selengkapnya tentang jenis, unit, label metrik, serta latensi dan periode sampling.

Melihat metrik untuk agen

Anda dapat melihat metrik bawaan agen di Google Cloud konsol menggunakan Metrics Explorer:

  1. Untuk mendapatkan izin guna melihat metrik di Metrics Explorer, minta admin untuk memberi Anda peran Monitoring Viewer (roles/monitoring.viewer) di project Anda.

  2. Buka Metrics Explorer di Google Cloud konsol:

    Buka Metrics Explorer

  3. Pilih Google Cloud project Anda.

  4. Klik Select a metric untuk membuka kotak penelusuran.

  5. Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.

  6. Klik kategori metrik Reasoning_engine, lalu klik metrik, seperti Request count.

  7. Secara opsional, tetapkan filter label tambahan, elemen agregasi, dan sesuaikan rentang waktu.

Secara default, diagram di Metrics Explorer untuk metrik Jumlah permintaan menyelaraskan titik data dengan interval waktu default dan memetakan titik data sebagai permintaan per detik (metrik rasio).

Metrik kueri untuk agen

Anda juga dapat membuat kueri metrik melalui Monitoring Query Language (MQL), Prometheus Query Language (PromQL), atau Cloud Monitoring v3 API. MQL dan PromQL menawarkan lebih banyak opsi untuk pemfilteran, agregasi, dan transformasi metrik, sedangkan Cloud Monitoring API memungkinkan Anda membuat daftar dan membuat kueri semua titik data mentah secara terprogram.

Membuat kueri metrik dengan MQL atau PromQL

Anda dapat menggunakan MQL atau PromQL untuk menyelaraskan dan menggabungkan titik data dengan interval waktu kustom dan memetakan titik data yang ditransformasi sebagai jumlah permintaan absolut (bukan permintaan per detik):

MQL

fetch aiplatform.googleapis.com/ReasoningEngine
  | metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
  | filter
      (resource.reasoning_engine_id == 'RESOURCE_ID')
      && (metric.response_code == 'RESPONSE_CODE')
  | align delta(10m)
  | every 10m

PromQL

sum_over_time(
  increase(
      aiplatform_googleapis_com:reasoning_engine_request_count{
          monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
          reasoning_engine_id='RESOURCE_ID',
          response_code='RESPONSE_CODE'
      }
      [10m]
  )
  [10m:10m]
)

Anda dapat membuat kueri rasio error dengan menghitung rasio permintaan yang diberi label dengan kode respons error tertentu (seperti 500) terhadap jumlah total permintaan (persentase permintaan yang gagal):

MQL

fetch aiplatform.googleapis.com/ReasoningEngine
  | metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
  | filter resource.reasoning_engine_id == 'RESOURCE_ID'
  | { filter metric.response_code == '500' ; ident }
  | align rate(10m)
  | every 10m
  | group_by [], [value_request_count_aggregate: aggregate(value.request_count)]
  | ratio

PromQL

sum_over_time(
  sum(
    rate(
      aiplatform_googleapis_com:reasoning_engine_request_count{
        monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
        reasoning_engine_id='RESOURCE_ID',
        response_code='500'
      }
      [10m]
    )
  )
  [10m:10m]
)
/
sum_over_time(
  sum(
    rate(
      aiplatform_googleapis_com:reasoning_engine_request_count{
        monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
        reasoning_engine_id='RESOURCE_ID',
      }
      [10m]
    )
  )
  [10m:10m]
)

Untuk praktik terbaik dan batasan metrik rasio, lihat Tentang rasio metrik. Untuk contoh cara menetapkan pemberitahuan untuk metrik rasio error, lihat Contoh kebijakan dalam JSON.

Membuat kueri metrik dengan Cloud Monitoring API

Anda dapat menggunakan Cloud Monitoring API untuk melakukan hal berikut:

  • Mendapatkan definisi resource yang dipantau Vertex AI Agent Engine

  • Mencantumkan definisi metrik agen yang tersedia

  • Membuat kueri data deret waktu untuk request_count

Semua metrik Agen dikaitkan dengan resource yang dipantau Agent Engine aiplatform.googleapis.com/ReasoningEngine.

Anda dapat memanggil API ini melalui APIs Explorer, library klien khusus bahasa, atau command line. Lihat dokumentasi untuk membaca metrik melalui API Explorer dan library klien. Contoh berikut menunjukkan penggunaan di command line, lebih khusus alat curl.

Mendapatkan definisi resource yang dimonitor Agent Engine

Perintah berikut mengambil definisi resource yang dipantau menggunakan projects.monitoredResourceDescriptors, serta semua label yang tersedia yang dapat digunakan untuk pemfilteran:

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/monitoredResourceDescriptors/aiplatform.googleapis.com/ReasoningEngine

Label harus menyertakan resource_container, location, dan reasoning_engine_id.

Mencantumkan definisi metrik agen yang tersedia

Perintah berikut menggunakan projects.metricDescriptors untuk mengambil semua metrik dan filter label untuk Agent Engine:

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/metricDescriptors?filter='metric.type=starts_with("aiplatform.googleapis.com/reasoning_engine")'

Hasilnya harus menyertakan definisi untuk metrik berikut serta label spesifiknya:

  • aiplatform.googleapis.com/reasoning_engine/request_count
  • aiplatform.googleapis.com/reasoning_engine/request_latencies
  • aiplatform.googleapis.com/reasoning_engine/cpu/allocation_time
  • aiplatform.googleapis.com/reasoning_engine/memory/allocation_time

Membuat kueri data deret waktu untuk request_count

Anda dapat menggunakan projects.timeSeries.list bersama dengan parameter seperti interval, filter, dan aggregation untuk membuat kueri data deret waktu.

Contoh berikut menunjukkan cara membuat kueri titik data mentah untuk metrik request_count untuk instance agen tertentu selama jangka waktu tertentu:

gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/timeSeries?filter='metric.type="aiplatform.googleapis.com/reasoning_engine/request_count"%20AND%20resource.labels.reasoning_engine_id="RESOURCE_ID"&interval.endTime=2025-03-26T11:00:0.0-08:00&interval.startTime=2025-03-26T10:00:0.0-08:00'

Ganti kode berikut:

  • PROJECT_ID: Google Cloud Project ID Anda.
  • RESOURCE_ID: ID instance Agent Engine. Hal ini tidak selalu diperlukan. Anda dapat membuat kueri di beberapa instance Agent Engine dalam project yang sama.
  • interval.startTime dan interval.endTime: Awal (inklusif) dan akhir (eksklusif) interval waktu, dalam format RFC 3339. Misalnya, "2025-03-26T11:22:33Z" untuk Waktu Universal Terkoordinasi (UTC) dan "2025-03-26T11:22:33-08:00" untuk Waktu Standar Pasifik (PST). Lihat definisi lengkap dan contoh lainnya di RFC 3339.

Anda akan melihat respons seperti berikut:

{
  "timeSeries": [
    {
      "metric": {
        "labels": {
          "response_code": "200",
          "response_code_class": "2xx"
        },
        "type": "aiplatform.googleapis.com/reasoning_engine/request_count"
      },
      "resource": {
        "type": "aiplatform.googleapis.com/ReasoningEngine",
        "labels": {
          "reasoning_engine_id": "RESOURCE_ID",
          "location": "LOCATION",
          "project_id": "PROJECT_ID"
        }
      },
      "metricKind": "DELTA",
      "valueType": "INT64",
      "points": [
        {
          "interval": {
            "startTime": "2025-03-26T18:55:27.001Z",
            "endTime": "2025-03-26T18:56:27Z"
          },
          "value": {
            "int64Value": "25"
          }
        },
        {
          "interval": {
            "startTime": "2025-03-26T18:54:27.001Z",
            "endTime": "2025-03-26T18:55:27Z"
          },
          "value": {
            "int64Value": "36"
          }
        }
        // ... more data points ...
      ]
    }
    // ... potentially more time series with other response codes ...
  ],
  "unit": "1"
}

Lihat projects.timeSeries.list untuk detail selengkapnya tentang format respons.

Membuat metrik kustom untuk agen

Jika metrik agen bawaan tidak mencakup kasus penggunaan tertentu, Anda dapat menentukan metrik kustom. Anda dapat membuat metrik kustom menggunakan metode berikut:

Metrik berbasis log

Langkah-langkah berikut menunjukkan cara membuat dan menggunakan metrik berbasis log (tool_calling_count) untuk contoh alur kerja saat beberapa agen memanggil beberapa alat, dan Anda ingin menghitung pemanggilan alat:

  1. Tentukan alat Anda untuk menulis entri log setiap kali dipanggil. Misalnya, "tool-\<tool-id\> invoked by agent-\<agent-id\>".

  2. Buat metrik berbasis log jenis penghitung baru melalui Google Cloud konsol:

    1. Buka halaman Log-based Metrics di Google Cloud konsol:

      Buka Log-based Metrics

    2. Di bagian Metrik yang ditentukan pengguna, klik Buat metrik. Panel Create log-based metric akan muncul.

    3. Untuk Metric type, pilih Counter

    4. Untuk bagian Details, masukkan Log-based metric name. Contohnya, tool_calling_count. Secara opsional, masukkan Deskripsi dan Unit.

    5. Untuk bagian Filter selection, lakukan tindakan berikut:

      1. Di menu drop-down Select project or log bucket, pilih Project logs

      2. Di kolom Filter build, masukkan filter log menggunakan bahasa kueri logging. Contoh:

        resource.type="aiplatform.googleapis.com/ReasoningEngine"
        resource.labels.reasoning_engine_id="RESOURCE_ID"
        textPayload =~ "tool-\d+ invoked by agent-\d+" -- assuming both tool and agent IDs are numeric
        
    6. Untuk bagian Labels, tambahkan dua label baru dengan mengklik tombol Add label.

      1. Untuk label pertama, lakukan hal berikut:

        1. Di kolom Label name, masukkan tool.

        2. Di kolom Nama kolom, masukkan textPayload.

        3. Di kolom Regular expression, masukkan (tool-\d+) invoked by agent-\d+.

      2. Untuk label kedua, lakukan hal berikut:

        1. Di kolom Label name, masukkan agent.

        2. Di kolom Nama kolom, masukkan textPayload.

        3. Di kolom Regular expression, masukkan tool-\d+ invoked by (agent-\d+).

      1. Klik Selesai.
    7. Klik Create metric.

  3. Untuk melihat metrik tool_calling_count dan log terkaitnya, lakukan hal berikut di Google Cloud konsol:

    1. Buka halaman Metrics Explorer di Google Cloud konsol:

      Buka Metrics Explorer

    2. Klik Select a metric untuk membuka kotak penelusuran.

    3. Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.

    4. Klik kategori metrik Metrik berbasis log, lalu klik Logging/user/tool_calling_count. Sesuaikan rentang waktu jika perlu.

    5. (Opsional) Filter menurut label tool dan agent.

      • Untuk mendapatkan total jumlah pemanggilan untuk alat tertentu bagi semua agen, tetapkan label filter tool dengan nilai ID alat tersebut.

      • Untuk mendapatkan total jumlah pemanggilan untuk agen tertentu untuk semua alat, tetapkan label filter agent dengan nilai ID agen tersebut.

      Secara opsional, tetapkan Sum By ke tool atau agent untuk mendapatkan jumlah total yang dikelompokkan menurut berbagai alat atau agen.

Lihat Mencatat log agen untuk mengetahui petunjuk tentang cara menulis log agen, dan Ringkasan metrik berbasis log untuk mengetahui detail selengkapnya tentang metrik berbasis log.

Metrik yang ditentukan pengguna

Langkah-langkah berikut menunjukkan cara membuat dan menggunakan metrik yang ditentukan pengguna (token_count) untuk contoh alur kerja saat beberapa agen memanggil beberapa model, dan Anda ingin menghitung jumlah total token yang digunakan (dengan asumsi bahwa Anda melacak jumlah token sejak startup aplikasi untuk setiap agen pemanggilan dan model target):

  1. Tentukan jenis metrik kustom dengan memanggil projects.metricDescriptors.create dengan parameter berikut:

    • name: string URL, seperti projects/PROJECT_ID

    • Request body: objek MetricDescriptor:

      {
        "name": "token_count",
        "description": "Token Consumed by models.",
        "displayName": "Token Count",
        "type": "custom.googleapis.com/token_count",
        "metricKind": "CUMULATIVE",
        "valueType": "INT64",
        "unit": "1",
        "labels": [
          {
            "key": "model",
            "valueType": "STRING",
            "description": "Model."
          },
          {
            "key": "agent",
            "valueType": "STRING",
            "description": "Agent."
          }
        ],
        "monitoredResourceTypes": [
          "generic_node"
        ]
      }
      

      Metrik baru token_count dibuat dengan jenis Cumulative, yang mewakili jumlah total token sejak startup aplikasi. Lihat Jenis dan jenis metrik untuk mengetahui detail selengkapnya tentang metrik Cumulative. Label model dan agent mewakili nama model bahasa besar (LLM) target dan agen pemanggilan.

    1. Anda dapat menemukan metrik token_count di Metrics Explorer:

      1. Buka halaman Metrics Explorer di Google Cloud konsol:

      Buka Metrics Explorer

      1. Klik Select a metric untuk membuka kotak penelusuran.

      2. Masukkan Node generik di kotak penelusuran, lalu klik Metrik kustom.

      3. Klik Token Count.

  2. Tulis titik data ke metrik baru dengan memanggil projects.timeSeries.create dengan parameter berikut:

    • name: string URL, seperti projects/PROJECT_ID

    • Request body: daftar objek TimeSeries:

      {
        "timeSeries": [
          {
            "metric": {
              "type": "custom.googleapis.com/token_count",
              "labels": {
                "model": "model-1",
                "agent": "agent-1"
              }
            },
            "resource": {
              "type": "generic_node",
              "labels": {
                "project_id": "PROJECT_ID",
                "node_id": "RESOURCE_ID",
                "namespace": "",
                "location": "us-central1"
              }
            },
            "points": [
              {
                "interval": {
                  "startTime": "2025-03-26T10:00:00-08:00",
                  "endTime": "2025-03-26T10:01:00-08:00"
                },
                "value": {
                  "int64Value": 15
                }
              }
            ]
          },
          {
            "metric": {
              "type": "custom.googleapis.com/token_count",
              "labels": {
                "model": "model-1",
                "agent": "agent-2"
              }
            },
            "resource": {
              "type": "generic_node",
              "labels": {
                "project_id": "PROJECT_ID",
                "node_id": "RESOURCE_ID",
                "namespace": "",
                "location": "us-central1"
              }
            },
            "points": [
              {
                "interval": {
                  "startTime": "2025-03-26T10:00:00-08:00",
                  "endTime": "2025-03-26T10:01:00-08:00"
                },
                "value": {
                  "int64Value": 20
                }
              }
            ]
          }
          // ... more time series ...
        ]
      }
      
  3. Setelah titik data diupload melalui Cloud Monitoring API, Anda dapat melihat metrik baru token_count melalui konsol: Google Cloud

    1. Buka halaman Metrics Explorer di Google Cloud konsol:

      Buka Metrics Explorer

    2. Klik Select a metric untuk membuka kotak penelusuran.

    3. Masukkan Node generik di kotak penelusuran, lalu klik Metrik kustom.

    4. Klik Token Count. Sesuaikan rentang waktu dan konfigurasikan nilai label untuk model atau agent jika perlu.

Membuat pemberitahuan untuk agen

Anda dapat menggunakan metrik bersama dengan pemberitahuan. Lihat Ringkasan pemberitahuan untuk mengetahui detail selengkapnya.

Contoh berikut menunjukkan cara membuat pemberitahuan nilai minimum untuk metrik request_latencies sehingga Anda menerima notifikasi saat latensi melampaui nilai yang telah ditentukan selama durasi yang ditentukan:

  1. Buka halaman Alerting di Google Cloud konsol:

    Buka Pemberitahuan

  2. Klik Create Policy. Halaman Buat kebijakan pemberitahuan akan terbuka.

    1. Untuk Policy configuration mode, pilih Builder.

    2. Di menu drop-down Select a metric, pilih Vertex AI Reasoning Engine -> reasoning_engine -> Request Latency.

    3. Di bagian Tambahkan filter, konfigurasikan filter secara opsional (seperti reasoning_engine_id, response_code).

    4. Di bagian Transform data, alihkan Rolling window dan Rolling window function ke nilai seperti 5min dan 99th percentile (monitor persentil ke-99 latensi permintaan selama periode penyelarasan 5 menit).

    5. Klik Berikutnya.

  3. Di bagian Configure alert trigger, lakukan hal berikut:

    1. Pilih Batas untuk Jenis Kondisi.

    2. Pilih Pemicu pemberitahuan, seperti Deret waktu mana pun melanggar.

    3. Pilih Posisi nilai minimum, seperti Di atas nilai minimum.

    4. Masukkan nilai minimum, seperti 5000ms.

    5. Klik Berikutnya.

  4. Di bagian Configure notifications and finalize alert, lakukan hal berikut:

    1. Pilih satu atau beberapa saluran notifikasi. Lihat Mengelola saluran notifikasi untuk mengetahui detail selengkapnya.

    2. (Opsional) Konfigurasikan subjek notifikasi, durasi penutupan otomatis insiden, label aplikasi, label kebijakan, tingkat keparahan, dan dokumentasi tambahan.

    3. Tetapkan nama kebijakan di bagian Name the alert policy, seperti latency-99p-alert.

    4. Klik Create policy.

Jika terjadi insiden, lihat Insiden untuk kebijakan pemberitahuan berbasis metrik untuk mengetahui informasi selengkapnya tentang cara mengonfirmasi dan menyelidiki insiden serta membisukan pemberitahuan.

Anda dapat menemukan contoh pemberitahuan lainnya di Contoh kebijakan dalam JSON.

Memantau metrik untuk agen

Anda dapat menggunakan dasbor Ringkasan Mesin Agen Vertex AI untuk memantau kondisi operasional dan performa agen Anda.

Melihat dasbor default

  1. Buka halaman Dasbor di Google Cloud konsol:

    Buka Dasbor

  2. Pilih Google Cloud project Anda.

  3. Di panel Dasbor Saya, tambahkan filter Name:Vertex AI Agent Engine Overview.

  4. Klik Ringkasan Mesin Agen Vertex AI untuk menampilkan dasbor agen default.

Menyesuaikan dasbor default

Dasbor default hanya berisi metrik bawaan agen. Untuk menambahkan metrik kustom Anda sendiri ke dasbor, gunakan langkah-langkah berikut untuk menyalin dan menyesuaikan dasbor default:

  1. Buka dasbor default.

  2. Klik Salin Dasbor. Pada dialog Salin Dasbor, klik Salin. Salinan dasbor akan terbuka. Anda juga dapat menemukan salinan dasbor di panel Dasbor Saya di bagian kategori Kustom.

  3. Di salinan dasbor, ikuti langkah-langkah berikut untuk menambahkan metrik:

    1. Klik Add widget. Panel samping Tambahkan widget akan muncul.

    2. Untuk Data, pilih Metrik. Panel samping Konfigurasi widget akan muncul.

    3. Klik Select a metric untuk membuka kotak penelusuran.

    4. Jika metrik kustom Anda dibuat menggunakan metrik berbasis log:

      1. Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.

      2. Klik kategori metrik Metrik berbasis log, lalu klik metrik, seperti Logging/user/tool_calling_count.

      3. Klik Terapkan.

    5. Jika metrik kustom Anda dibuat menggunakan metrik yang ditentukan pengguna:

      1. Masukkan Node Umum di kotak penelusuran, lalu klik Node Umum.

      2. Klik kategori metrik Metrik kustom, lalu klik metrik, seperti Jumlah Token.

      3. Klik Terapkan.

    6. Diagram baru yang menampilkan metrik kustom Anda akan muncul di dasbor.

  4. Anda dapat menyesuaikan tata letak dasbor lebih lanjut, misalnya:

    1. Pindahkan widget dengan menahan judul widget dan menariknya ke lokasi lain di dasbor yang sama.

    2. Ubah ukuran widget dengan menahan pojok kanan bawah widget dan menyesuaikan ukurannya.

Lihat Menambahkan diagram dan tabel ke dasbor kustom untuk mengetahui detail selengkapnya tentang cara menambahkan diagram metrik menggunakan Monitoring Query Language (MQL) atau Prometheus Query Language (PromQL), serta membuat tabel metrik.

Jika Anda telah mengonfigurasi notifikasi kustom, lihat artikel Menampilkan kebijakan pemberitahuan dan pemberitahuan di dasbor untuk menambahkan pemberitahuan tersebut ke dasbor Anda.