Metrik pemantauan model

AI Generatif di Vertex AI menyediakan dasbor observasi model bawaan untuk melihat perilaku, kondisi, dan performa model yang terkelola sepenuhnya. Model terkelola sepenuhnya, yang juga dikenal sebagai Model sebagai Layanan (MaaS), disediakan oleh Google dan mencakup model Gemini Google dan model partner dengan endpoint terkelola. Metrik dari model yang dihosting sendiri tidak disertakan dalam dasbor.

AI Generatif di Vertex AI secara otomatis mengumpulkan dan melaporkan aktivitas dari model MaaS untuk membantu Anda memecahkan masalah latensi dengan cepat dan memantau kapasitas.

Contoh dasbor pengamatan model di Konsol Cloud
Contoh dasbor kejelasan model

Metrik pemantauan yang tersedia

Dasbor kejelasan model menampilkan subset metrik yang dikumpulkan oleh Cloud Monitoring, seperti permintaan model per detik (QPS), throughput token, dan latensi token pertama. Lihat dasbor untuk melihat semua metrik yang tersedia.

Kasus penggunaan

Sebagai developer aplikasi, Anda dapat melihat cara pengguna berinteraksi dengan model yang telah Anda ekspos. Misalnya, Anda dapat melihat tren penggunaan model (permintaan model per detik) dan intensitas komputasi perintah pengguna (latensi pemanggilan model) dari waktu ke waktu. Oleh karena itu, karena metrik ini terkait dengan penggunaan model, Anda juga dapat memperkirakan biaya untuk menjalankan setiap model.

Jika timbul masalah, Anda dapat memecahkan masalah dengan cepat dari dasbor. Anda dapat memeriksa apakah model merespons dengan andal dan tepat waktu dengan melihat rasio error API, latensi token pertama, dan throughput token.

Batasan

Vertex AI hanya merekam metrik dasbor untuk panggilan API ke endpoint model.Penggunaan konsol, seperti metrik dari Vertex AI Studio, tidak ditambahkan ke dasbor. Google Cloud

Melihat dasbor

  1. Di bagian Vertex AI pada Google Cloud konsol, buka halaman Dasbor.

    Buka Vertex AI

  2. Di bagian Kemampuan observasi model, klik Tampilkan semua metrik untuk melihat dasbor kemampuan observasi model di konsol Google Cloud Observability.

  3. Untuk melihat metrik untuk model tertentu atau di lokasi tertentu, tetapkan satu atau beberapa filter di bagian atas halaman dasbor.

    Untuk mengetahui deskripsi setiap metrik, lihat bagian "aiplatform" di halaman Google Cloud metrics.

Referensi lainnya