Halaman ini menjelaskan cara menggunakan metrik bawaan, metrik kustom, dan pemberitahuan untuk memantau agen Anda di Vertex AI Agent Engine.
Ringkasan
Anda dapat menggunakan Vertex AI Agent Engine menggunakan Cloud Monitoring tanpa penyiapan atau konfigurasi tambahan. Metrik agen bawaan dikumpulkan dan divisualisasikan secara otomatis di halaman Cloud Monitoring di konsolGoogle Cloud .
Metrik bawaan yang didukung
Metrik agen berikut didukung dan dikaitkan dengan resource yang dipantau Vertex AI Agent Engine
aiplatform.googleapis.com/ReasoningEngine
:
- Jumlah permintaan
- Latensi permintaan
- Waktu alokasi CPU container
- Waktu alokasi memori container
Lihat daftar lengkap metrik AI Platform untuk mengetahui detail selengkapnya tentang jenis, unit, label metrik, serta latensi dan periode sampling.
Melihat metrik untuk agen
Anda dapat melihat metrik bawaan agen di Google Cloud konsol menggunakan Metrics Explorer:
Untuk mendapatkan izin guna melihat metrik di Metrics Explorer, minta admin untuk memberi Anda peran Monitoring Viewer (
roles/monitoring.viewer
) di project Anda.Buka Metrics Explorer di Google Cloud konsol:
Pilih Google Cloud project Anda.
Klik Select a metric untuk membuka kotak penelusuran.
Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.
Klik kategori metrik Reasoning_engine, lalu klik metrik, seperti Request count.
Secara opsional, tetapkan filter label tambahan, elemen agregasi, dan sesuaikan rentang waktu.
Secara default, diagram di Metrics Explorer untuk metrik Jumlah permintaan menyelaraskan titik data dengan interval waktu default dan memetakan titik data sebagai permintaan per detik (metrik rasio).
Metrik kueri untuk agen
Anda juga dapat membuat kueri metrik melalui Monitoring Query Language (MQL), Prometheus Query Language (PromQL), atau Cloud Monitoring v3 API. MQL dan PromQL menawarkan lebih banyak opsi untuk pemfilteran, agregasi, dan transformasi metrik, sedangkan Cloud Monitoring API memungkinkan Anda membuat daftar dan membuat kueri semua titik data mentah secara terprogram.
Membuat kueri metrik dengan MQL atau PromQL
Anda dapat menggunakan MQL atau PromQL untuk menyelaraskan dan menggabungkan titik data dengan interval waktu kustom dan memetakan titik data yang ditransformasi sebagai jumlah permintaan absolut (bukan permintaan per detik):
MQL
fetch aiplatform.googleapis.com/ReasoningEngine
| metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
| filter
(resource.reasoning_engine_id == 'RESOURCE_ID')
&& (metric.response_code == 'RESPONSE_CODE')
| align delta(10m)
| every 10m
PromQL
sum_over_time(
increase(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
response_code='RESPONSE_CODE'
}
[10m]
)
[10m:10m]
)
Anda dapat membuat kueri rasio error dengan menghitung rasio permintaan yang diberi label dengan kode respons error tertentu (seperti 500
) terhadap jumlah total permintaan (persentase permintaan yang gagal):
MQL
fetch aiplatform.googleapis.com/ReasoningEngine
| metric 'aiplatform.googleapis.com/reasoning_engine/request_count'
| filter resource.reasoning_engine_id == 'RESOURCE_ID'
| { filter metric.response_code == '500' ; ident }
| align rate(10m)
| every 10m
| group_by [], [value_request_count_aggregate: aggregate(value.request_count)]
| ratio
PromQL
sum_over_time(
sum(
rate(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
response_code='500'
}
[10m]
)
)
[10m:10m]
)
/
sum_over_time(
sum(
rate(
aiplatform_googleapis_com:reasoning_engine_request_count{
monitored_resource='aiplatform.googleapis.com/ReasoningEngine',
reasoning_engine_id='RESOURCE_ID',
}
[10m]
)
)
[10m:10m]
)
Untuk praktik terbaik dan batasan metrik rasio, lihat Tentang rasio metrik. Untuk contoh cara menetapkan pemberitahuan untuk metrik rasio error, lihat Contoh kebijakan dalam JSON.
Membuat kueri metrik dengan Cloud Monitoring API
Anda dapat menggunakan Cloud Monitoring API untuk melakukan hal berikut:
Mendapatkan definisi resource yang dipantau Vertex AI Agent Engine
Mencantumkan definisi metrik agen yang tersedia
Membuat kueri data deret waktu untuk
request_count
Semua metrik Agen dikaitkan dengan resource yang dipantau Agent Engine
aiplatform.googleapis.com/ReasoningEngine
.
Anda dapat memanggil API ini melalui APIs Explorer, library klien khusus bahasa, atau command line. Lihat
dokumentasi untuk membaca metrik
melalui API Explorer dan library klien. Contoh berikut menunjukkan penggunaan di command line, lebih khusus alat curl
.
Mendapatkan definisi resource yang dimonitor Agent Engine
Perintah berikut mengambil definisi resource yang dipantau menggunakan projects.monitoredResourceDescriptors
, serta
semua label yang tersedia yang dapat digunakan untuk pemfilteran:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/monitoredResourceDescriptors/aiplatform.googleapis.com/ReasoningEngine
Label harus menyertakan resource_container
, location
, dan
reasoning_engine_id
.
Mencantumkan definisi metrik agen yang tersedia
Perintah berikut menggunakan projects.metricDescriptors
untuk mengambil semua metrik dan filter label untuk Agent Engine:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/metricDescriptors?filter='metric.type=starts_with("aiplatform.googleapis.com/reasoning_engine")'
Hasilnya harus menyertakan definisi untuk metrik berikut serta label spesifiknya:
aiplatform.googleapis.com/reasoning_engine/request_count
aiplatform.googleapis.com/reasoning_engine/request_latencies
aiplatform.googleapis.com/reasoning_engine/cpu/allocation_time
aiplatform.googleapis.com/reasoning_engine/memory/allocation_time
Membuat kueri data deret waktu untuk request_count
Anda dapat menggunakan projects.timeSeries.list
bersama dengan parameter seperti interval
, filter
, dan
aggregation
untuk membuat kueri data deret waktu.
Contoh berikut menunjukkan cara membuat kueri titik data mentah untuk metrik request_count
untuk instance agen tertentu selama jangka waktu tertentu:
gcurl https://monitoring.googleapis.com/v3/projects/PROJECT_ID/timeSeries?filter='metric.type="aiplatform.googleapis.com/reasoning_engine/request_count"%20AND%20resource.labels.reasoning_engine_id="RESOURCE_ID"&interval.endTime=2025-03-26T11:00:0.0-08:00&interval.startTime=2025-03-26T10:00:0.0-08:00'
Ganti kode berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- RESOURCE_ID: ID instance Agent Engine. Hal ini tidak selalu diperlukan. Anda dapat membuat kueri di beberapa instance Agent Engine dalam project yang sama.
interval.startTime
daninterval.endTime
: Awal (inklusif) dan akhir (eksklusif) interval waktu, dalam format RFC 3339. Misalnya,"2025-03-26T11:22:33Z"
untuk Waktu Universal Terkoordinasi (UTC) dan"2025-03-26T11:22:33-08:00"
untuk Waktu Standar Pasifik (PST). Lihat definisi lengkap dan contoh lainnya di RFC 3339.
Anda akan melihat respons seperti berikut:
{
"timeSeries": [
{
"metric": {
"labels": {
"response_code": "200",
"response_code_class": "2xx"
},
"type": "aiplatform.googleapis.com/reasoning_engine/request_count"
},
"resource": {
"type": "aiplatform.googleapis.com/ReasoningEngine",
"labels": {
"reasoning_engine_id": "RESOURCE_ID",
"location": "LOCATION",
"project_id": "PROJECT_ID"
}
},
"metricKind": "DELTA",
"valueType": "INT64",
"points": [
{
"interval": {
"startTime": "2025-03-26T18:55:27.001Z",
"endTime": "2025-03-26T18:56:27Z"
},
"value": {
"int64Value": "25"
}
},
{
"interval": {
"startTime": "2025-03-26T18:54:27.001Z",
"endTime": "2025-03-26T18:55:27Z"
},
"value": {
"int64Value": "36"
}
}
// ... more data points ...
]
}
// ... potentially more time series with other response codes ...
],
"unit": "1"
}
Lihat
projects.timeSeries.list
untuk detail selengkapnya tentang format respons.
Membuat metrik kustom untuk agen
Jika metrik agen bawaan tidak mencakup kasus penggunaan tertentu, Anda dapat menentukan metrik kustom. Anda dapat membuat metrik kustom menggunakan metode berikut:
Metrik berbasis log: Mengamati tren dan pola dalam volume besar entri log.
Metrik yang ditentukan pengguna: Metrik yang tidak ditentukan oleh Google Cloud, seperti mengambil data khusus aplikasi atau data sistem sisi klien.
Metrik berbasis log
Langkah-langkah berikut menunjukkan cara membuat dan menggunakan metrik berbasis log (tool_calling_count
) untuk contoh alur kerja saat beberapa agen memanggil beberapa alat, dan Anda ingin menghitung pemanggilan alat:
Tentukan alat Anda untuk menulis entri log setiap kali dipanggil. Misalnya,
"tool-\<tool-id\> invoked by agent-\<agent-id\>"
.Buat metrik berbasis log jenis penghitung baru melalui Google Cloud konsol:
Buka halaman Log-based Metrics di Google Cloud konsol:
Di bagian Metrik yang ditentukan pengguna, klik Buat metrik. Panel Create log-based metric akan muncul.
Untuk Metric type, pilih Counter
Untuk bagian Details, masukkan Log-based metric name. Contohnya,
tool_calling_count
. Secara opsional, masukkan Deskripsi dan Unit.Untuk bagian Filter selection, lakukan tindakan berikut:
Di menu drop-down Select project or log bucket, pilih Project logs
Di kolom Filter build, masukkan filter log menggunakan bahasa kueri logging. Contoh:
resource.type="aiplatform.googleapis.com/ReasoningEngine" resource.labels.reasoning_engine_id="RESOURCE_ID" textPayload =~ "tool-\d+ invoked by agent-\d+" -- assuming both tool and agent IDs are numeric
Untuk bagian Labels, tambahkan dua label baru dengan mengklik tombol Add label.
Untuk label pertama, lakukan hal berikut:
Di kolom Label name, masukkan
tool
.Di kolom Nama kolom, masukkan
textPayload
.Di kolom Regular expression, masukkan
(tool-\d+) invoked by agent-\d+
.
Untuk label kedua, lakukan hal berikut:
Di kolom Label name, masukkan
agent
.Di kolom Nama kolom, masukkan
textPayload
.Di kolom Regular expression, masukkan
tool-\d+ invoked by (agent-\d+)
.
- Klik Selesai.
Klik Create metric.
Untuk melihat metrik
tool_calling_count
dan log terkaitnya, lakukan hal berikut di Google Cloud konsol:Buka halaman Metrics Explorer di Google Cloud konsol:
Klik Select a metric untuk membuka kotak penelusuran.
Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.
Klik kategori metrik Metrik berbasis log, lalu klik Logging/user/tool_calling_count. Sesuaikan rentang waktu jika perlu.
(Opsional) Filter menurut label
tool
danagent
.Untuk mendapatkan total jumlah pemanggilan untuk alat tertentu bagi semua agen, tetapkan label filter
tool
dengan nilai ID alat tersebut.Untuk mendapatkan total jumlah pemanggilan untuk agen tertentu untuk semua alat, tetapkan label filter
agent
dengan nilai ID agen tersebut.
Secara opsional, tetapkan Sum By ke
tool
atauagent
untuk mendapatkan jumlah total yang dikelompokkan menurut berbagai alat atau agen.
Lihat Mencatat log agen untuk mengetahui petunjuk tentang cara menulis log agen, dan Ringkasan metrik berbasis log untuk mengetahui detail selengkapnya tentang metrik berbasis log.
Metrik yang ditentukan pengguna
Langkah-langkah berikut menunjukkan cara membuat dan menggunakan metrik yang ditentukan pengguna (token_count
) untuk contoh alur kerja saat beberapa agen memanggil beberapa model, dan Anda
ingin menghitung jumlah total token yang digunakan (dengan asumsi bahwa Anda melacak jumlah token sejak startup aplikasi untuk setiap agen pemanggilan dan model target):
Tentukan jenis metrik kustom dengan memanggil
projects.metricDescriptors.create
dengan parameter berikut:name
: string URL, sepertiprojects/PROJECT_ID
Request body
: objekMetricDescriptor
:{ "name": "token_count", "description": "Token Consumed by models.", "displayName": "Token Count", "type": "custom.googleapis.com/token_count", "metricKind": "CUMULATIVE", "valueType": "INT64", "unit": "1", "labels": [ { "key": "model", "valueType": "STRING", "description": "Model." }, { "key": "agent", "valueType": "STRING", "description": "Agent." } ], "monitoredResourceTypes": [ "generic_node" ] }
Metrik baru
token_count
dibuat dengan jenisCumulative
, yang mewakili jumlah total token sejak startup aplikasi. Lihat Jenis dan jenis metrik untuk mengetahui detail selengkapnya tentang metrikCumulative
. Labelmodel
danagent
mewakili nama model bahasa besar (LLM) target dan agen pemanggilan.
Anda dapat menemukan metrik
token_count
di Metrics Explorer:- Buka halaman Metrics Explorer di Google Cloud konsol:
Klik Select a metric untuk membuka kotak penelusuran.
Masukkan Node generik di kotak penelusuran, lalu klik Metrik kustom.
Klik Token Count.
Tulis titik data ke metrik baru dengan memanggil
projects.timeSeries.create
dengan parameter berikut:name
: string URL, sepertiprojects/PROJECT_ID
Request body
: daftar objekTimeSeries
:{ "timeSeries": [ { "metric": { "type": "custom.googleapis.com/token_count", "labels": { "model": "model-1", "agent": "agent-1" } }, "resource": { "type": "generic_node", "labels": { "project_id": "PROJECT_ID", "node_id": "RESOURCE_ID", "namespace": "", "location": "us-central1" } }, "points": [ { "interval": { "startTime": "2025-03-26T10:00:00-08:00", "endTime": "2025-03-26T10:01:00-08:00" }, "value": { "int64Value": 15 } } ] }, { "metric": { "type": "custom.googleapis.com/token_count", "labels": { "model": "model-1", "agent": "agent-2" } }, "resource": { "type": "generic_node", "labels": { "project_id": "PROJECT_ID", "node_id": "RESOURCE_ID", "namespace": "", "location": "us-central1" } }, "points": [ { "interval": { "startTime": "2025-03-26T10:00:00-08:00", "endTime": "2025-03-26T10:01:00-08:00" }, "value": { "int64Value": 20 } } ] } // ... more time series ... ] }
Setelah titik data diupload melalui Cloud Monitoring API, Anda dapat melihat metrik baru
token_count
melalui konsol: Google CloudBuka halaman Metrics Explorer di Google Cloud konsol:
Klik Select a metric untuk membuka kotak penelusuran.
Masukkan Node generik di kotak penelusuran, lalu klik Metrik kustom.
Klik Token Count. Sesuaikan rentang waktu dan konfigurasikan nilai label untuk
model
atauagent
jika perlu.
Membuat pemberitahuan untuk agen
Anda dapat menggunakan metrik bersama dengan pemberitahuan. Lihat Ringkasan pemberitahuan untuk mengetahui detail selengkapnya.
Contoh berikut
menunjukkan cara membuat pemberitahuan nilai minimum untuk metrik request_latencies
sehingga Anda menerima notifikasi saat latensi melampaui nilai yang telah ditentukan selama durasi yang ditentukan:
Buka halaman Alerting di Google Cloud konsol:
Klik Create Policy. Halaman Buat kebijakan pemberitahuan akan terbuka.
Untuk Policy configuration mode, pilih Builder.
Di menu drop-down Select a metric, pilih
Vertex AI Reasoning Engine
->reasoning_engine
->Request Latency
.Di bagian Tambahkan filter, konfigurasikan filter secara opsional (seperti
reasoning_engine_id
,response_code
).Di bagian Transform data, alihkan Rolling window dan Rolling window function ke nilai seperti
5min
dan99th percentile
(monitor persentil ke-99 latensi permintaan selama periode penyelarasan 5 menit).Klik Berikutnya.
Di bagian Configure alert trigger, lakukan hal berikut:
Pilih Batas untuk Jenis Kondisi.
Pilih Pemicu pemberitahuan, seperti Deret waktu mana pun melanggar.
Pilih Posisi nilai minimum, seperti Di atas nilai minimum.
Masukkan nilai minimum, seperti
5000ms
.Klik Berikutnya.
Di bagian Configure notifications and finalize alert, lakukan hal berikut:
Pilih satu atau beberapa saluran notifikasi. Lihat Mengelola saluran notifikasi untuk mengetahui detail selengkapnya.
(Opsional) Konfigurasikan subjek notifikasi, durasi penutupan otomatis insiden, label aplikasi, label kebijakan, tingkat keparahan, dan dokumentasi tambahan.
Tetapkan nama kebijakan di bagian Name the alert policy, seperti
latency-99p-alert
.Klik Create policy.
Jika terjadi insiden, lihat Insiden untuk kebijakan pemberitahuan berbasis metrik untuk mengetahui informasi selengkapnya tentang cara mengonfirmasi dan menyelidiki insiden serta membisukan pemberitahuan.
Anda dapat menemukan contoh pemberitahuan lainnya di Contoh kebijakan dalam JSON.
Memantau metrik untuk agen
Anda dapat menggunakan dasbor Ringkasan Mesin Agen Vertex AI untuk memantau kondisi operasional dan performa agen Anda.
Melihat dasbor default
Buka halaman Dasbor di Google Cloud konsol:
Pilih Google Cloud project Anda.
Di panel Dasbor Saya, tambahkan filter
Name:Vertex AI Agent Engine Overview
.Klik Ringkasan Mesin Agen Vertex AI untuk menampilkan dasbor agen default.
Menyesuaikan dasbor default
Dasbor default hanya berisi metrik bawaan agen. Untuk menambahkan metrik kustom Anda sendiri ke dasbor, gunakan langkah-langkah berikut untuk menyalin dan menyesuaikan dasbor default:
Klik Salin Dasbor. Pada dialog Salin Dasbor, klik Salin. Salinan dasbor akan terbuka. Anda juga dapat menemukan salinan dasbor di panel Dasbor Saya di bagian kategori Kustom.
Di salinan dasbor, ikuti langkah-langkah berikut untuk menambahkan metrik:
Klik Add widget. Panel samping Tambahkan widget akan muncul.
Untuk Data, pilih Metrik. Panel samping Konfigurasi widget akan muncul.
Klik Select a metric untuk membuka kotak penelusuran.
Jika metrik kustom Anda dibuat menggunakan metrik berbasis log:
Masukkan Vertex AI Reasoning Engine di kotak penelusuran, lalu klik Vertex AI Reasoning Engine.
Klik kategori metrik Metrik berbasis log, lalu klik metrik, seperti Logging/user/tool_calling_count.
Klik Terapkan.
Jika metrik kustom Anda dibuat menggunakan metrik yang ditentukan pengguna:
Masukkan Node Umum di kotak penelusuran, lalu klik Node Umum.
Klik kategori metrik Metrik kustom, lalu klik metrik, seperti Jumlah Token.
Klik Terapkan.
Diagram baru yang menampilkan metrik kustom Anda akan muncul di dasbor.
Anda dapat menyesuaikan tata letak dasbor lebih lanjut, misalnya:
Pindahkan widget dengan menahan judul widget dan menariknya ke lokasi lain di dasbor yang sama.
Ubah ukuran widget dengan menahan pojok kanan bawah widget dan menyesuaikan ukurannya.
Lihat Menambahkan diagram dan tabel ke dasbor kustom untuk mengetahui detail selengkapnya tentang cara menambahkan diagram metrik menggunakan Monitoring Query Language (MQL) atau Prometheus Query Language (PromQL), serta membuat tabel metrik.
Jika Anda telah mengonfigurasi notifikasi kustom, lihat artikel Menampilkan kebijakan pemberitahuan dan pemberitahuan di dasbor untuk menambahkan pemberitahuan tersebut ke dasbor Anda.