Memantau dan mengoptimalkan resource tugas dengan melihat metrik

Dokumen ini menjelaskan cara memantau dan mencoba mengoptimalkan resource untuk Batch job dengan melihat metrik di Cloud Monitoring. Untuk mempelajari lebih lanjut resource yang digunakan tugas, lihat Resource tugas.

Untuk setiap tugas, Monitoring menyediakan metrik dasar seperti pemakaian CPU dan traffic jaringan. Namun, beberapa metrik, seperti penggunaan memori dan proses, hanya dapat dikumpulkan jika tugas menginstal Agen Operasional. Metrik untuk resource tugas membantu Anda mengevaluasi performa dan pemanfaatan setiap resource. Informasi ini dapat membantu Anda mengidentifikasi peningkatan untuk iterasi tugas berikutnya. Misalnya, Anda dapat menghapus resource yang tidak digunakan untuk membantu mengoptimalkan biaya, atau Anda dapat meningkatkan kualitas atau menambah resource yang terbebani untuk membantu meningkatkan performa.

Sebelum memulai

  1. Jika belum pernah menggunakan Batch, baca Mulai menggunakan Batch dan aktifkan Batch dengan menyelesaikan prasyarat untuk project dan pengguna.
  2. Opsional: Untuk mengumpulkan metrik tambahan untuk tugas, buat dan jalankan tugas yang otomatis menginstal Agen Operasional.
  3. Jika project Anda belum melakukannya, aktifkan Monitoring API:

    Enable the API

  4. Untuk mendapatkan izin yang diperlukan untuk melihat metrik keobservasian, minta administrator untuk memberi Anda peran IAM Monitoring Metric Viewer (roles/monitoring.metricViewer) pada project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

    Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Melihat metrik untuk resource tugas

Mengamati dan memantau VM dalam dokumentasi Compute Engine memberikan informasi konseptual yang relevan tentang metrik VM; namun, metode yang berbeda direkomendasikan untuk melihat metrik VM untuk tugas Batch. Secara khusus, dokumentasi Compute Engine menjelaskan cara melihat metrik menggunakan dasbor Monitoring standar untuk Compute Engine atau halaman Compute Engine di konsol Google Cloud . Namun, yang penting, metode tersebut tidak menampilkan informasi tentang VM yang telah dihapus. Oleh karena itu, jangan gunakan metode tersebut kecuali jika Anda hanya ingin melihat metrik untuk tugas Batch saat sedang berjalan.

Lihat metrik untuk tugas Batch yang sedang berjalan dan telah selesai dengan menggunakan diagram Metrics Explorer seperti yang dijelaskan di bagian ini. Perlu diketahui bahwa diagram bersifat sementara kecuali jika Anda menyimpannya ke dasbor kustom.

Untuk membuat diagram untuk melihat satu atau beberapa metrik, lakukan tindakan berikut:

  1. Opsional: Jika Anda berencana menyimpan diagram, identifikasi atau buat dasbor kustom untuk diagram tersebut.
  2. Buat diagram Metrics Explorer untuk satu atau beberapa metrik.

    Tanpa filter, setiap metrik VM dalam diagram menyertakan data dari semua VM dalam project Anda. Jika ingin memfilter diagram agar hanya menyertakan metrik dari semua atau tugas Batch tertentu, tambahkan filter berikut:

    group=RESOURCE_GROUP_NAME
    

    Ganti RESOURCE_GROUP_NAME dengan nama grup resource untuk tugas Batch. Untuk mengetahui informasi selengkapnya, lihat Membuat grup resource untuk memfilter metrik dalam dokumen ini.

Membuat grup resource untuk memfilter metrik

Anda dapat menggunakan grup resource sebagai filter yang dapat disesuaikan untuk diagram Metrics Explorer. Untuk membuat grup resource untuk semua atau tugas Batch tertentu dalam project Anda, lakukan hal berikut:

  1. Pilih label yang akan digunakan sebagai kriteria keanggotaan berdasarkan tugas yang ingin Anda sertakan dalam grup:

    • Semua tugas Batch: Gunakan label batch-node bawaan, yang otomatis diterapkan ke semua resource untuk semua tugas Batch dan memiliki nilai null.
    • Tugas Batch tertentu: Gunakan label yang diterapkan ke resource hanya untuk tugas Batch tertentu.

      Misalnya, jika Anda ingin membuat grup berdasarkan nama pekerjaan lengkap atau sebagian, gunakan nama label batch-job-id yang telah ditentukan sebelumnya dengan nilai tertentu. Label batch-job-id otomatis diterapkan ke semua resource untuk semua tugas Batch dan ditentukan dengan nama tugas.

      Atau, jika Anda menggunakan label kustom, Anda harus menerapkan label kustom ke semua resource tugas Batch yang ingin disertakan dalam grup saat Anda membuat tugas.

  2. Pastikan project Anda memiliki setidaknya satu tugas dengan label yang Anda pilih dan tugas ini berada dalam status RUNNING. Jika tidak, label ini tidak akan muncul sebagai opsi saat Anda mencoba membuat grup resource.

  3. Buat grup resource. Saat Anda menentukan kriteria keanggotaan, lakukan hal berikut:

    1. Tetapkan Jenis ke Tag.
    2. Tetapkan kolom Tag ke nama label yang Anda pilih. Kemudian, tetapkan kolom berikut berdasarkan nilai label yang ingin disertakan dalam grup.

      Misalnya, jika Anda ingin grup ini menyertakan semua tugas Batch, tetapkan Tag ke batch-node, dan tetapkan Operator ke Ada. Atau, jika Anda ingin grup ini menyertakan Batch job dengan nama yang diawali dengan test, tetapkan Tag ke batch-job-id, tetapkan Operator ke Dimulai dengan, dan tetapkan Nilai ke test.

Langkah berikutnya