Melihat peristiwa Horizontal Pod Autoscaler


Halaman ini memberikan informasi tentang peristiwa keputusan yang dikeluarkan oleh Horizontal Pod Autoscaler di Google Kubernetes Engine (GKE). Dengan menganalisis peristiwa ini, Anda dapat memperoleh insight tentang cara pengontrol Horizontal Pod Autoscaler mengelola penskalaan beban kerja dan memahami proses pengambilan keputusan di balik tindakannya.

Horizontal Pod Autoscaler menghasilkan peristiwa keputusan, yang disimpan sebagai entri log di Cloud Logging.

Sebelum memulai

Pastikan untuk menyelesaikan prasyarat berikut:

Pilih atau buat project

Anda dapat menggunakan project yang ada, atau membuat project baru untuk tutorial ini.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

Mengaktifkan API

Enable the GKE, and Cloud Logging APIs.

Enable the APIs

Menyiapkan Cloud Shell

Dalam tutorial ini, Anda akan menggunakan Cloud Shell untuk menjalankan perintah gcloud dan kubectl. Cloud Shell adalah lingkungan shell untuk mengelola resource yang dihosting di Google Cloud. Cloud Shell telah diinstal dengan alat command line Google Cloud CLI dan kubectl.

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

Sesi Cloud Shell akan terbuka di dalam frame yang lebih rendah di konsol.

Sebelum menjalankan perintah dalam tutorial ini, pastikan project default Anda ditetapkan ke project ID tempat Anda ingin men-deploy aplikasi contoh. Jika belum ditetapkan, jalankan perintah berikut di Cloud Shell:

gcloud config set project PROJECT_ID

Ganti PROJECT_ID dengan project ID Anda.

Peran dan izin yang diperlukan

Untuk mendapatkan izin yang Anda perlukan guna mengaktifkan pembuatan log, serta mengakses dan memproses log, minta administrator untuk memberi Anda peran IAM berikut pada project:

  • Untuk mengaktifkan logging peristiwa Horizontal Pod Autoscaler di cluster Anda: Kubernetes Engine Cluster Admin (roles/container.clusterAdmin)
  • Untuk mengakses log dan menggunakan Logs Explorer dan Log Analytics: Logs Viewer (roles/logging.viewer)

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Persyaratan

  • Cluster GKE Anda harus menjalankan versi 1.31.5-gke.1090000 atau yang lebih baru, atau 1.32.1-gke.1260000 atau yang lebih baru.
  • Aktifkan Cloud Logging di cluster GKE Anda. Harga Cloud Logging berlaku.

Mengaktifkan peristiwa keputusan Horizontal Pod Autoscaler

Untuk membuat cluster baru dengan log keputusan KCP_HPA yang diaktifkan, jalankan perintah berikut:

gcloud container clusters create CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM,KCP_HPA

Untuk mengaktifkan log keputusan KCP_HPA di cluster yang ada, jalankan perintah berikut:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM,KCP_HPA

Ganti kode berikut:

  • CLUSTER_NAME: nama cluster yang ingin Anda buat atau perbarui.
  • PROJECT_ID: Google Cloud Project ID Anda.
  • LOCATION: Region atau zona komputasi untuk cluster Anda.

Perintah ini memungkinkan ekspor log yang dihasilkan oleh KCP_HPA dan menyimpannya di logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" tujuan dalam Cloud Logging.

Ambil konfigurasi logging cluster yang telah diperbarui dan tinjau daftar log untuk memastikan log KCP_HPA diaktifkan:

gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=loggingConfig \
    --format='csv[delimiter=",",no-heading](componentConfig.enableComponents)'

Outputnya mirip dengan hal berikut ini:

SYSTEM_COMPONENTS,APISERVER,CONTROLLER_MANAGER,SCHEDULER,KCP_HPA

Menonaktifkan peristiwa keputusan Horizontal Pod Autoscaler

Perbarui cluster untuk menghapus komponen KCP_HPA dari flag --logging:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM

Ganti kode berikut:

  • CLUSTER_NAME: nama cluster yang ingin Anda buat atau perbarui.
  • PROJECT_ID: Google Cloud Project ID Anda.
  • LOCATION: Region atau zona komputasi untuk cluster Anda.

Perintah ini menonaktifkan ekspor log yang dihasilkan oleh KCP_HPA. Anda tidak dapat mengambilnya menggunakan filter logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" dalam Cloud Logging.

Ambil konfigurasi logging cluster yang telah diperbarui dan tinjau daftar log untuk memastikan log KCP_HPA dinonaktifkan:

gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=loggingConfig \
    --format='csv[delimiter=",",no-heading](componentConfig.enableComponents)'

Outputnya mirip dengan hal berikut ini:

SYSTEM_COMPONENTS,APISERVER,CONTROLLER_MANAGER,SCHEDULER

Jenis Log

Peristiwa keputusan untuk Horizontal Pod Autoscaler disimpan di Cloud Logging, di lokasi logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" yang ada di bucket _Default dalam project yang sama dengan cluster GKE Anda. Semua peristiwa yang dicatat ke dalam log memiliki format JSON dan dapat ditemukan di kolom jsonPayload pada entri log.

Pastikan Anda memahami kebutuhan penyimpanan dari potensi volume log, selain implikasi performa atau biaya. Contoh berikut menjelaskan frekuensi Horizontal Pod Autoscaler menghasilkan setiap jenis peristiwa keputusan:

  • Rekomendasi atomik: Horizontal Pod Autoscaler menghasilkan satu peristiwa rekomendasi atomik setiap 15 detik untuk setiap metrik yang dipantau oleh setiap objek HPA di cluster Anda. Misalnya, jika Anda memiliki dua objek HPA di cluster dan setiap objek HPA memantau tiga metrik, enam rekomendasi atomik akan dicatat ke dalam log setiap 15 detik.

  • Rekomendasi akhir: Horizontal Pod Autoscaler menghasilkan satu peristiwa rekomendasi akhir setiap 15 detik untuk setiap objek HPA di cluster Anda. Misalnya, jika Anda memiliki dua objek HPA di cluster, dua rekomendasi akhir akan dicatat ke dalam log setiap 15 detik.

Secara total, dengan dua objek HPA yang masing-masing memantau tiga metrik, log KCP_HPA Anda akan menerima total delapan entri peristiwa keputusan setiap 15 detik.

Rekomendasi atom

Log rekomendasi atomik menjelaskan rekomendasi berdasarkan setiap metrik yang ditentukan di Horizontal Pod Autoscaler Anda.

Log atomik mencakup kolom berikut:

Kolom Deskripsi
start_time Menunjukkan kapan HPA mulai menghitung rekomendasi.
hpa Nama objek HPA yang terkait dengan rekomendasi.
pod_count Menunjukkan jumlah total Pod yang terkait dengan HPA saat membuat rekomendasi. Jumlah ini juga mencakup Pod yang siap, tidak siap, dan diabaikan.
metric Memberikan informasi tentang spesifikasi dan status metrik yang digunakan untuk rekomendasi. Kolom metric berisi subkolom berikut:
  • index: indeks metrik dalam array Spec metrics.
  • type: jenis metrik dengan nilai dari MetricSourceType (misalnya Resource, External).
  • spec: nama metrik dan target yang ditetapkan pada metrik tersebut.
  • status: Kondisi status sehubungan dengan skalabilitas dan batasan penskalaan.
  • newest_sample_time: stempel waktu sampel metrik terbaru.
  • newest_sample_age_seconds: usia sampel terbaru, diukur dalam detik, sejak komputasi rekomendasi dimulai. Nilai negatif menunjukkan bahwa sampel metrik lebih lama dari awal komputasi.
summary Kolom ringkasan berisi informasi terkait hasil rekomendasi, termasuk jumlah replika yang disarankan. Jika rekomendasi tidak dapat diusulkan, pesan error akan ditampilkan. Kolom summary berisi subkolom berikut:
  • dampening: HPA menerapkan peredam ke rekomendasi dan arahnya untuk mencoba dan mengurangi besarnya potensi skala. Redaman dapat terjadi dengan cara berikut:
    • up: arah peredam atas berarti HPA mengasumsikan Pod yang tidak memiliki metrik dengan penggunaan metrik 100%.
    • down: arah peredam turun berarti HPA mengasumsikan Pod yang tidak memiliki metrik atau Pod yang belum siap yang menggunakan 0% penggunaan metrik.
    • none: tidak ada peredam yang diterapkan.
  • override: pesan yang memberikan alasan saat rekomendasi yang diusulkan oleh HPA tidak diterapkan (misalnya, karena toleransi); atau none jika tidak ada penggantian.
  • result: hasil rekomendasi. Fungsi ini akan mengusulkan jumlah replika yang direkomendasikan atau menampilkan pesan error jika rekomendasi tidak dapat dihitung.

Contoh log rekomendasi atom:

{
  "insertId": "xiu4bty9k5b279wu",
  "jsonPayload": {
    "instance": {
      "vm_name": "my-unique-vm-identifier",
      "zone": "us-central1-a"
    },
    "atomicRecommendation": {
      "startTime": "2025-02-06T20:07:00.573419526Z",
      "hpa": "gke-managed-cim/kube-state-metrics",
      "metric": {
        "newestSampleAgeSeconds": -39.573419526,
        "status": {
          "averageValue": "25849856"
        },
        "newestSampleTime": "2025-02-06T20:06:21Z",
        "type": "Resource",
        "spec": {
          "target": {
            "averageValue": "400Mi"
          },
          "name": "memory"
        }
      },
      "podCount": {
        "ready": 1,
        "total": 1
      },
      "summary": {
        "override": "none",
        "replicas": 1,
        "dampening": "none"
      }
    }
  },
  "resource": {
    "type": "k8s_control_plane_component",
    "labels": {
      "project_id": "my-project-id",
      "cluster_name": "my-cluster",
      "location": "us-central1-a",
      "component_location": "us-central1-a",
      "component_name": "hpa-controller"
    }
  },
  "timestamp": "2025-02-06T20:07:00.593777835Z",
  "severity": "INFO",
  "labels": {
    "compute.googleapis.com/resource_name": "my-unique-vm-identifier"
  },
  "logName": "projects/my-project-id/logs/container.googleapis.com%2Fhpa-controller",
  "sourceLocation": {
    "file": "event_logger.go",
    "line": "61"
  },
  "receiveTimestamp": "2025-02-06T20:07:05.284753647Z"
}

Rekomendasi akhir

Log rekomendasi akhir menjelaskan rekomendasi gabungan yang diusulkan oleh Horizontal Pod Autoscaler. Horizontal Pod Autoscaler menggabungkan semua rekomendasi atomik dari berbagai metrik untuk membuat rekomendasi akhir dan mengaktifkan rekomendasi akhir. Pengaktifan berarti HPA menginstruksikan Deployment untuk menyesuaikan jumlah replika agar sesuai dengan nilai yang direkomendasikan. Jika rekomendasi akhir menyarankan jumlah Pod yang berbeda dengan jumlah Pod yang berjalan, Horizontal Pod Autoscaler akan memicu peristiwa penskalaan ke atas atau penskalaan ke bawah untuk menyesuaikan Deployment.

Log rekomendasi akhir mencakup kolom berikut:

Kolom Deskripsi
start_time Menunjukkan kapan HPA mulai menghitung rekomendasi.
hpa Nama objek HPA yang terkait dengan rekomendasi.
target_ref Menunjukkan objek ScaleTargetRef HPA yang terkait dengan rekomendasi.
configured_size Jumlah replika terakhir yang dicatat sebelum HPA menghitung dan menerapkan rekomendasi ini.
top_level_override Memberikan alasan jika rekomendasi yang diusulkan oleh HPA tidak diterapkan (misalnya, karena toleransi); atau none jika tidak ada penggantian.
top_level_limit Memberikan alasan jika rekomendasi yang diusulkan oleh HPA perlu disesuaikan (misalnya, karena jumlah replika yang ditentukan oleh kolom MinReplicas atau MaxReplicas dalam spesifikasi HPA).
leading_metric_index Indeks metrik utama dalam array Spec metrics adalah metrik yang rekomendasi atom terkaitnya digunakan sebagai rekomendasi akhir.
normalization Memberikan ringkasan stabilisasi dan batasan sebagai berikut, jika ada:

stabilization: menjelaskan status stabilisasi jika diterapkan. Stabilisasi digunakan untuk membatasi fluktuasi jumlah replika saat metrik yang digunakan untuk penskalaan terus berfluktuasi. Kolom stabilization terdiri dari subkolom berikut:

  • replicas: nomor replika setelah stabilisasi.
  • reason: jenis stabilisasi yang diterapkan — scaleUp atau scaleDown.
  • stabilization_window: jangka waktu stabilisasi terkait, dalam detik.
  • replicas_before_stabilization: jumlah replika yang direkomendasikan sebelum stabilisasi.

limitation: menjelaskan cara penanganan batasan penskalaan jika diterapkan. Perilaku ini mengubah rekomendasi yang diusulkan oleh HPA berdasarkan batasan yang berlaku. Kolom limitation terdiri dari subkolom berikut:

  • replicas: jumlah replika setelah pembatasan.
  • reason: alasan tidak menskalakan melebihi jumlah replika minimum atau maksimum.
  • scaling_policy: kebijakan penskalaan yang diterapkan.
  • selectPolicy: menentukan cara kebijakan dipilih saat penskalaan dalam arah tertentu. MaxChange sesuai dengan MaxChangePolicySelect; MinChange sesuai dengan MinChangePolicySelect. Jika penskalaan dinonaktifkan, kolom selectPolicy tidak akan ada.
  • replicas_before_limitation: jumlah replika yang direkomendasikan sebelum pembatasan.
replicas Jumlah replika yang direkomendasikan.
actuation_error Pesan error yang terkait dengan kegagalan, jika pengaktifan gagal.
actuation_time Stempel waktu aktuasi saat berhasil.
actuation_latency_seconds Waktu yang berlalu, dalam detik, dari awal komputasi rekomendasi hingga pengaktifan berhasil.

Contoh log rekomendasi akhir:

{
  "insertId": "qzyv7alfv1sm19ns",
  "jsonPayload": {
    "finalRecommendation": {
      "actuationTime": "2025-02-06T20:06:57.487786873Z",
      "targetRef": {
        "name": "kube-state-metrics",
        "kind": "StatefulSet",
        "apiVersion": "apps/v1"
      },
      "topLevelLimit": "none",
      "hpa": "gke-managed-cim/kube-state-metrics",
      "topLevelOverride": "noRecommendation",
      "replicas": 1,
      "configuredSize": 1,
      "actuationLatencySeconds": 0.003722451,
      "startTime": "2025-02-06T20:06:57.484064422Z"
    },
    "instance": {
      "vm_name": "my-unique-vm-identifier",
      "zone": "us-central1-a"
    }
  },
  "resource": {
    "type": "k8s_control_plane_component",
    "labels": {
      "cluster_name": "my-cluster",
      "component_location": "us-central1-a",
      "component_name": "hpa-controller",
      "location": "us-central1-a",
      "project_id": "my-project-id"
    }
  },
  "timestamp": "2025-02-06T20:06:57.488193527Z",
  "severity": "INFO",
  "labels": {
    "compute.googleapis.com/resource_name": "my-unique-vm-identifier"
  },
  "logName": "projects/my-project-id/logs/container.googleapis.com%2Fhpa-controller",
  "sourceLocation": {
    "file": "event_logger.go",
    "line": "61"
  },
  "receiveTimestamp": "2025-02-06T20:06:57.844898727Z"
}

Pemecahan masalah

Bagian ini menjelaskan masalah dan langkah-langkah penyelesaian terkait peristiwa Horizontal Pod Autoscaler.

Tidak ada peristiwa

Jika Anda tidak melihat peristiwa keputusan Horizontal Pod Autoscaler, pastikan Anda telah melakukan semua hal berikut:

  • Anda telah mengaktifkan Cloud Logging untuk cluster.
  • Anda telah mengaktifkan log KCP_HPA untuk cluster.
  • Anda telah men-deploy minimal satu objek hpa yang dikonfigurasi dengan benar ke cluster.

Untuk melihat konfigurasi objek hpa, jalankan perintah berikut:

  kubectl describe hpa $HPA_NAME

Jika Anda masih tidak melihat log KCP_HPA, hubungi Google Cloud Dukungan.

Langkah berikutnya