Meningkatkan ketersediaan aplikasi stateful dengan Operator HA Stateful


Operator Ketersediaan Tinggi (HA) Stateful memungkinkan Anda menggunakan integrasi bawaan GKE dengan Persistent Disk regional untuk mengotomatiskan dan mengontrol kecepatan failover Pod StatefulSet. Selama failover, operator secara otomatis menangani deteksi kegagalan node, melepaskan volume dari node yang gagal, dan memastikan pemasangan volume yang aman ke node failover.

Alasan menggunakan Operator HA Stateful

Arsitektur stateful umum untuk mencapai ketersediaan tinggi menggunakan Persistent Disk regional sebagai lapisan penyimpanan. Disk ini menyediakan replikasi data secara sinkron antara dua zona dalam satu region. Selama kegagalan jaringan zona atau node, arsitektur ini memungkinkan workload Anda melakukan pengalihan (dengan melakukan pemasangan paksa) replika ke penyimpanan di node lain di zona yang berbeda.

Operator HA Stateful memungkinkan Anda melakukan pengoptimalan berikut:

  • Meningkatkan waktu pemulihan aplikasi replika tunggal: Jika hanya menggunakan satu replika, Anda dapat menggunakan Operator HA Stateful dan menukar penyimpanan zonal dengan penyimpanan regional saat aplikasi Anda disediakan, untuk meningkatkan ketahanan dan ketersediaan data jika terjadi kegagalan node.
  • Mengurangi biaya jaringan lintas zona: Mereplikasi data di beberapa zona dapat menimbulkan biaya yang besar untuk aplikasi dengan throughput tinggi. Anda dapat menggunakan Operator HA Stateful untuk menjalankan aplikasi di satu zona, sekaligus mempertahankan jalur failover ke zona alternatif yang sesuai dengan SLA aplikasi Anda.

Batasan

  • Jenis volume gcePersistentDisk tidak didukung. Gunakan PersistentVolume yang menggunakan driver CSI persistent disk.
  • Dengan arsitektur Operator HA Stateful replika tunggal, GKE mempertahankan data Anda di dua zona melalui Persistent Disk regional, tetapi data hanya dapat diakses saat replika aplikasi Anda dalam kondisi baik. Selama pengalihan, aplikasi Anda akan tidak tersedia untuk sementara saat replika dijadwalkan ulang ke node baru yang responsif. Jika aplikasi Anda memiliki target waktu pemulihan (RTO) yang sangat rendah, sebaiknya gunakan pendekatan multi-replika.

Sebelum memulai

Sebelum memulai, pastikan Anda telah menjalankan tugas berikut:

  • Aktifkan Google Kubernetes Engine API.
  • Aktifkan Google Kubernetes Engine API
  • Jika ingin menggunakan Google Cloud CLI untuk tugas ini, instal lalu lakukan inisialisasi gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan gcloud components update.

Persyaratan

  • Bidang kontrol dan node cluster Anda harus menjalankan GKE versi 1.28 atau yang lebih baru.
  • Saat Anda menggunakan Operator HA Stateful, operator ini akan otomatis mengonfigurasi StatefulSet tertaut Anda untuk menggunakan Persistent Disk regional. Namun, Anda bertanggung jawab untuk memastikan bahwa Pod dikonfigurasi untuk menggunakan disk ini, dan dapat berjalan di semua zona yang terkait dengan penyimpanan pokok.
  • Pastikan aplikasi Anda berjalan di bentuk mesin yang didukung Persistent Disk regional: E2, N1, N2, N2D.
  • Pastikan driver CSI Persistent Disk Compute Engine diaktifkan. Driver CSI Persistent Disk diaktifkan secara default pada cluster Autopilot dan Standard baru dan tidak dapat dinonaktifkan atau diedit saat menggunakan Autopilot. Jika Anda perlu menambahkan driver CSI Persistent Disk secara manual dari cluster, lihat Mengaktifkan driver CSI Persistent Disk di cluster yang ada.
  • Jika Anda menggunakan StorageClass kustom, konfigurasi driver CSI Persistent Disk dengan penyedia pd.csi.storage.gke.io dan parameter berikut:
    • availability-class: regional-hard-failover
    • replication-type: regional-pd

Menyiapkan dan menggunakan Operator HA Stateful

Ikuti langkah-langkah berikut untuk menyiapkan Operator HA Stateful untuk beban kerja stateful Anda:

  1. Aktifkan add-on StatefulHA.
  2. Instal resource HighAvailabilityApplication.
  3. Instal StatefulSet.
  4. Periksa resource HighAvailabilityApplication.

Mengaktifkan add-on StatefulHA

Untuk menggunakan Operator HA Stateful, add-on StatefulHA harus diaktifkan di cluster Anda.

  • Cluster Autopilot: GKE secara otomatis mengaktifkan add-on StatefulHA saat pembuatan cluster. Jika Anda ingin menggunakan Stateful HA Operator untuk workload yang ada, deploy ulang workload Anda di cluster Autopilot baru.

  • Cluster standar:

    • Pembuatan cluster baru: Ikuti petunjuk gcloud CLI untuk membuat cluster Standard dan tambahkan tanda berikut: --add-on=StatefulHA.
    • Cluster Standard yang ada: Ikuti petunjuk gcloud CLI untuk memperbarui setelan cluster Standard, dan gunakan flag berikut untuk mengaktifkan add-on: --update-addons=StatefulHA=ENABLED`.

GKE secara otomatis menginstal StorageClass bernama standard-rwo-regional untuk Anda saat add-on diaktifkan.

Menginstal resource HighAvailabilityApplication

HighAvailabilityApplication adalah resource Kubernetes yang menyederhanakan setelan StatefulSet dan meningkatkan ketersediaan Pod di GKE. Operator HA Stateful merekonsiliasi resource HighAvailabilityApplication di GKE.

Dalam spesifikasi HighAvailabilityApplication, Anda harus menetapkan HighAvailabilityApplication.spec.resourceSelection.resourceKind ke StatefulSet.

Untuk mempelajari cara mengonfigurasi resource HighAvailability, lihat dokumentasi referensi HighAvailabilityApplication.

Lihat contoh berikut untuk PostgreSQL:

  1. Simpan manifes berikut dalam file bernama stateful-ha-example-resource.yaml:

    kind: HighAvailabilityApplication
    apiVersion: ha.gke.io/v1
    metadata:
      name: APP_NAME
      namespace: APP_NAMESPACE
    spec:
      resourceSelection:
        resourceKind: StatefulSet
      policy:
        storageSettings:
          requireRegionalStorage: true
        failoverSettings:
          forceDeleteStrategy: AfterNodeUnreachable
          afterNodeUnreachable:
            afterNodeUnreachableSeconds: 20
    

    Ganti kode berikut:

    • APP_NAME: nama aplikasi di cluster yang ingin Anda lindungi. Nama ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet.
    • APP_NAMESPACE: namespace aplikasi. Namespace ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet yang dilindungi.

    Dalam contoh ini:

    • HighAvailabilityApplication.spec.policy.storageSettings.requireRegionalSettings disetel ke true. Tindakan ini menerapkan penyimpanan regional.
    • HighAvailabilityApplication.spec.policy.failoverSettings disetel ke AfterNodeUnreachable. Setelan ini menentukan cara penghapusan paksa dipicu saat terjadi kegagalan node.
    • HighAvailabilityApplication.spec.policy.failoverSettings.afterNodeUnreachable disetel ke 20. Ini adalah waktu tunggu untuk menghapus Pod secara paksa setelah node tempat Pod berjalan ditandai sebagai tidak dapat dijangkau.
  2. Buat resource. Resource HighAvailabilityApplication mengidentifikasi StatefulSet dengan namespace dan nama yang cocok.

    kubectl apply -f stateful-ha-example-resource.yaml
    

Instal StatefulSet

Instal StatefulSet. Misalnya, Anda dapat menginstal StatefulSet PostgreSQL menggunakan Helm (Helm sudah diinstal sebelumnya dengan Cloud Shell):

helm install postgresql oci://registry-1.docker.io/bitnamicharts/postgresql \
  --namespace=APP_NAMESPACE \
  --set fullnameOverride=APP_NAME

Resource HighAvailabilityApplication otomatis mengubah StorageClass StatefulSet menjadi standard-rwo-regional, yang menggunakan Persistent Disk regional.

Periksa resource HighAvailabilityApplication

Jalankan perintah berikut untuk memverifikasi bahwa failover otomatis telah diaktifkan untuk contoh aplikasi:

kubectl describe highavailabilityapplication APP_NAME

Output akan muncul seperti berikut:

Status:
Conditions:
  Last Transition Time:  2023-08-09T23:59:52Z
  Message:               Application is protected
  Observed Generation:   1
  Reason:                ApplicationProtected
  Status:                True
  Type:                  Protected

Menggunakan Persistent Disk yang ada

Jika Anda menggunakan Persistent Disk yang sudah ada dan PersistentVolume yang ditentukan secara statis, konfigurasi PersistentVolume dengan force-attach: true di .spec.csi.volumeAttributes. Contoh:

apiVersion: v1
kind: PersistentVolume
metadata:
  name: PV_NAME
spec:
  storageClassName: "STORAGE_CLASS_NAME"
  capacity:
    storage: DISK_SIZE
  accessModes:
    - ReadWriteOnce
  claimRef:
    name: PV_CLAIM_NAME
    namespace: default
  csi:
    driver: pd.csi.storage.gke.io
    volumeHandle: DISK_ID
    fsType: FS_TYPE
    volumeAttributes:
      force-attach: true