Mengonfigurasi update lonjakan node pool

Dokumen ini menjelaskan cara mengaktifkan dan mengelola update lonjakan node pool. Untuk mengetahui informasi tentang cara kerja update lonjakan node pool, lihat Tentang update lonjakan.

Hal-hal yang perlu dipertimbangkan sebelum menjalankan update lonjakan

Sebelum menjalankan update lonjakan, perhatikan hal berikut:

  • Instance tambahan yang dibuat sebagai bagian dari langkah lonjakan ini berpotensi melebihi batas kuota instance AWS Anda. Jika Anda tidak memiliki kuota yang cukup dan instance tambahan ini tidak dapat disediakan, update mungkin gagal.
  • Jika max-unavailable-update disetel ke 0, gangguan pada workload masih dapat terjadi saat Pod dikeluarkan dan dijadwalkan ulang ke node yang lebih baru.
  • Jumlah maksimum node yang dapat diupdate secara bersamaan sama dengan jumlah max-surge-update dan max-unavailable-update, dan dibatasi hingga 20.

Mengaktifkan dan mengonfigurasi update lonjakan

Untuk mengaktifkan update lonjakan, hubungi Google Cloud Dukungan. Setelah tim dukungan mengaktifkan fitur ini, Anda dapat menetapkan nilai ke parameter max-surge-update dan max-unavailable-update saat membuat atau memperbarui kumpulan node:

Buat

gcloud container aws node-pools create NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Perbarui

gcloud container aws node-pools update NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Ganti kode berikut:

  • NODE_POOL_NAME: nama node pool yang akan diupdate.
  • CLUSTER_NAME: nama cluster.
  • GOOGLE_CLOUD_LOCATION: region Google Cloud yang didukung yang mengelola cluster Anda. Contohnya, us-west1
  • MAX_SURGE: jumlah maksimum node tambahan yang dapat dibuat sementara di luar ukuran node pool saat ini selama update. Dengan menyesuaikan nilai ini, Anda dapat mengontrol jumlah node yang diupdate secara bersamaan. Setelan defaultnya adalah 1, tetapi Anda dapat menyetelnya ke 0. Jika Anda menetapkan max-surge-update ke nilai yang lebih besar dari 0, GKE di AWS akan membuat node lonjakan; jika ditetapkan ke 0, node lonjakan tidak akan dibuat.
  • MAX_UNAVAILABLE: jumlah maksimum node yang dapat tidak tersedia secara bersamaan selama proses update. Dengan meningkatkan nilai ini, lebih banyak node dapat diupdate secara bersamaan. Nilai defaultnya adalah 0, tetapi dapat disesuaikan ke atas.

Memeriksa setelan update lonjakan pada node pool

Untuk melihat setelan update lonjakan node pool, jalankan perintah berikut:

gcloud alpha container aws node-pools describe NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \

Ganti kode berikut:

  • NODE_POOL_NAME: nama node pool Anda.
  • CLUSTER_NAME: nama cluster.
  • GOOGLE_CLOUD_LOCATION: region Google Cloud yang didukung yang mengelola cluster Anda. Contohnya, us-west1

Jika update lonjakan diaktifkan pada node pool, output dari perintah ini akan menampilkan bagian berlabel surge_settings. Bagian surge_settings ini menampilkan nilai parameter max_surge dan max_unavailable.

Mengelola update lonjakan yang sedang berlangsung

Anda dapat membatalkan update lonjakan yang sedang berlangsung, melakukan roll back update lonjakan yang gagal, atau melanjutkan update yang terganggu.

Membatalkan (menjeda) dan melanjutkan update lonjakan

Di GKE di AWS, "membatalkan" update lonjakan sebenarnya berarti menjedanya. Untuk mengetahui detail cara membatalkan update, lihat Membatalkan operasi update.

Dengan kata lain, membatalkan update lonjakan tidak akan membatalkan update. Sebaliknya, node pool mungkin dibiarkan dalam status yang diupdate sebagian dengan dua grup penskalaan otomatis: satu dengan node yang menjalankan konfigurasi sebelumnya dan satu dengan node yang menjalankan konfigurasi baru. Untuk mengatasi masalah ini, lanjutkan update lonjakan dengan menjalankan perintah update lagi, menggunakan parameter target yang sama dengan operasi yang terganggu. Memulai update dengan parameter node pool yang berbeda dibatasi hingga update sebelumnya selesai.

Melakukan rollback update lonjakan yang gagal

Anda dapat me-roll back node pool ke status aslinya jika update lonjakan dibatalkan atau gagal.

Hal-hal yang perlu dipertimbangkan sebelum me-roll back update lonjakan

  • Anda hanya dapat me-roll back node pool yang diaktifkan untuk lonjakan dan berada dalam status yang diupdate sebagian (atau status DEGRADED).
  • Setelah rollback dimulai di kumpulan node, Anda tidak dapat membatalkannya.
  • Anda dilarang melakukan operasi update lainnya hingga operasi rollback berhasil diselesaikan.
  • Anda hanya dapat mencoba lagi pengembalian jika gagal.
  • Anda tidak dapat me-roll back node pool setelah berhasil diupdate.

Cara melakukan rollback update lonjakan yang gagal

Untuk mengembalikan operasi update yang tidak berhasil pada node pool, jalankan perintah berikut:

gcloud container aws node-pools rollback NODE_POOL_NAME
    --cluster CLUSTER_NAME

Ganti kode berikut:

  • NODE_POOL_NAME: nama node pool yang akan diupdate.
  • CLUSTER_NAME: nama cluster.

Cara kerja pengembalian

Memulai rollback secara internal akan memulai operasi update baru di kumpulan node. ('Secara internal' di sini berarti bahwa proses ini dieksekusi dalam sistem itu sendiri, dan tidak memerlukan intervensi Anda). Operasi ini akan mengembalikan node pool ke status aslinya berdasarkan upaya terbaik.

Node yang termasuk dalam grup penskalaan otomatis lama tidak lagi dibatasi, dan autoscaler cluster grup ini diaktifkan untuk memungkinkan workload dijadwalkan di node. Node pool yang diperbarui sebagian di grup penskalaan otomatis baru akan dikarantina, dikuras, dan dihentikan berdasarkan setelan lonjakan yang Anda tentukan dalam upaya update lonjakan awal.

Mengelola update lonjakan yang gagal

Anda memiliki tiga opsi untuk mengatasi update yang gagal:

  1. Lanjutkan update: Anda dapat melanjutkan update yang gagal menggunakan setelan node pool target yang sama dengan upaya awal yang tidak berhasil.
  2. Rollback: Gunakan perintah rollback untuk mengembalikan node pool ke status aslinya.
  3. Ubah dan mulai ulang: Jika Anda ingin mengubah parameter untuk update lonjakan, node pool yang ada harus dihapus lalu dibuat ulang dengan setelan baru. Untuk mengetahui petunjuk tentang cara menghapus node pool, lihat Menghapus node pool.