Operator Ketersediaan Tinggi (HA) Stateful memungkinkan Anda menggunakan integrasi bawaan GKE dengan Persistent Disk regional untuk mengotomatiskan dan mengontrol kecepatan failover Pod StatefulSet. Selama failover, operator secara otomatis menangani deteksi kegagalan node, melepaskan volume dari node yang gagal, dan memastikan pemasangan volume yang aman ke node failover.
Alasan menggunakan Operator HA Stateful
Arsitektur stateful umum untuk mencapai ketersediaan tinggi menggunakan Persistent Disk regional sebagai lapisan penyimpanan. Disk ini menyediakan replikasi data secara sinkron antara dua zona dalam satu region. Selama kegagalan jaringan zona atau node, arsitektur ini memungkinkan workload Anda melakukan pengalihan (dengan melakukan pemasangan paksa) replika ke penyimpanan di node lain di zona yang berbeda.
Operator HA Stateful memungkinkan Anda melakukan pengoptimalan berikut:
- Meningkatkan waktu pemulihan aplikasi replika tunggal: Jika hanya menggunakan satu replika, Anda dapat menggunakan Operator HA Stateful dan menukar penyimpanan zonal dengan penyimpanan regional saat aplikasi Anda disediakan, untuk meningkatkan ketahanan dan ketersediaan data jika terjadi kegagalan node.
- Mengurangi biaya jaringan lintas zona: Mereplikasi data di beberapa zona dapat menimbulkan biaya yang besar untuk aplikasi dengan throughput tinggi. Anda dapat menggunakan Operator HA Stateful untuk menjalankan aplikasi di satu zona, sekaligus mempertahankan jalur failover ke zona alternatif yang sesuai dengan SLA aplikasi Anda.
Batasan
- Jenis volume
gcePersistentDisk
tidak didukung. Gunakan
PersistentVolume
yang menggunakan driver CSI persistent disk. - Dengan arsitektur Operator HA Stateful replika tunggal, GKE mempertahankan data Anda di dua zona melalui Persistent Disk regional, tetapi data hanya dapat diakses saat replika aplikasi Anda dalam kondisi baik. Selama pengalihan, aplikasi Anda akan tidak tersedia untuk sementara saat replika dijadwalkan ulang ke node baru yang responsif. Jika aplikasi Anda memiliki target waktu pemulihan (RTO) yang sangat rendah, sebaiknya gunakan pendekatan multi-replika.
Sebelum memulai
Sebelum memulai, pastikan Anda telah menjalankan tugas berikut:
- Aktifkan Google Kubernetes Engine API. Aktifkan Google Kubernetes Engine API
- Jika ingin menggunakan Google Cloud CLI untuk tugas ini,
instal lalu
lakukan inisialisasi
gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan
gcloud components update
.
Persyaratan
- Bidang kontrol dan node cluster Anda harus menjalankan GKE versi 1.28 atau yang lebih baru.
- Saat Anda menggunakan Operator HA Stateful, operator ini akan otomatis mengonfigurasi StatefulSet tertaut Anda untuk menggunakan Persistent Disk regional. Namun, Anda bertanggung jawab untuk memastikan bahwa Pod dikonfigurasi untuk menggunakan disk ini, dan dapat berjalan di semua zona yang terkait dengan penyimpanan pokok.
- Pastikan aplikasi Anda berjalan di bentuk mesin yang didukung Persistent Disk regional: E2, N1, N2, N2D.
- Pastikan driver CSI Persistent Disk Compute Engine diaktifkan. Driver CSI Persistent Disk diaktifkan secara default pada cluster Autopilot dan Standard baru dan tidak dapat dinonaktifkan atau diedit saat menggunakan Autopilot. Jika Anda perlu menambahkan driver CSI Persistent Disk secara manual dari cluster, lihat Mengaktifkan driver CSI Persistent Disk di cluster yang ada.
- Jika Anda menggunakan StorageClass kustom, konfigurasi driver CSI Persistent Disk dengan penyedia
pd.csi.storage.gke.io
dan parameter berikut:availability-class: regional-hard-failover
replication-type: regional-pd
Menyiapkan dan menggunakan Operator HA Stateful
Ikuti langkah-langkah berikut untuk menyiapkan Operator HA Stateful untuk beban kerja stateful Anda:
- Aktifkan add-on
StatefulHA
. - Instal resource HighAvailabilityApplication.
- Instal StatefulSet.
- Periksa resource HighAvailabilityApplication.
Mengaktifkan add-on StatefulHA
Untuk menggunakan Operator HA Stateful, add-on StatefulHA
harus diaktifkan di cluster Anda.
Cluster Autopilot: GKE secara otomatis mengaktifkan add-on
StatefulHA
saat pembuatan cluster. Jika Anda ingin menggunakan Stateful HA Operator untuk workload yang ada, deploy ulang workload Anda di cluster Autopilot baru.Cluster standar:
- Pembuatan cluster baru: Ikuti petunjuk gcloud CLI untuk membuat cluster Standard dan tambahkan tanda berikut:
--add-on=StatefulHA
. - Cluster Standard yang ada: Ikuti petunjuk gcloud CLI untuk memperbarui setelan cluster Standard, dan gunakan flag berikut untuk mengaktifkan add-on:
--update-addons=StatefulHA=ENABLED
`.
- Pembuatan cluster baru: Ikuti petunjuk gcloud CLI untuk membuat cluster Standard dan tambahkan tanda berikut:
GKE secara otomatis menginstal StorageClass bernama
standard-rwo-regional
untuk Anda saat add-on diaktifkan.
Menginstal resource HighAvailabilityApplication
HighAvailabilityApplication
adalah resource Kubernetes yang menyederhanakan setelan StatefulSet dan meningkatkan ketersediaan Pod di GKE.
Operator HA Stateful merekonsiliasi resource HighAvailabilityApplication
di GKE.
Dalam spesifikasi HighAvailabilityApplication
, Anda harus menetapkan
HighAvailabilityApplication.spec.resourceSelection.resourceKind
ke
StatefulSet
.
Untuk mempelajari cara mengonfigurasi resource HighAvailability, lihat dokumentasi referensi HighAvailabilityApplication
.
Lihat contoh berikut untuk PostgreSQL:
Simpan manifes berikut dalam file bernama
stateful-ha-example-resource.yaml
:kind: HighAvailabilityApplication apiVersion: ha.gke.io/v1 metadata: name: APP_NAME namespace: APP_NAMESPACE spec: resourceSelection: resourceKind: StatefulSet policy: storageSettings: requireRegionalStorage: true failoverSettings: forceDeleteStrategy: AfterNodeUnreachable afterNodeUnreachable: afterNodeUnreachableSeconds: 20
Ganti kode berikut:
- APP_NAME: nama aplikasi di cluster yang ingin Anda lindungi. Nama ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet.
- APP_NAMESPACE: namespace aplikasi. Namespace ini harus dibagikan oleh HighAvailabilityApplication dan StatefulSet yang dilindungi.
Dalam contoh ini:
HighAvailabilityApplication.spec.policy.storageSettings.requireRegionalSettings
disetel ketrue
. Tindakan ini menerapkan penyimpanan regional.HighAvailabilityApplication.spec.policy.failoverSettings
disetel keAfterNodeUnreachable
. Setelan ini menentukan cara penghapusan paksa dipicu saat terjadi kegagalan node.HighAvailabilityApplication.spec.policy.failoverSettings.afterNodeUnreachable
disetel ke 20. Ini adalah waktu tunggu untuk menghapus Pod secara paksa setelah node tempat Pod berjalan ditandai sebagai tidak dapat dijangkau.
Buat resource. Resource
HighAvailabilityApplication
mengidentifikasi StatefulSet dengan namespace dan nama yang cocok.kubectl apply -f stateful-ha-example-resource.yaml
Instal StatefulSet
Instal StatefulSet. Misalnya, Anda dapat menginstal StatefulSet PostgreSQL menggunakan Helm (Helm sudah diinstal sebelumnya dengan Cloud Shell):
helm install postgresql oci://registry-1.docker.io/bitnamicharts/postgresql \
--namespace=APP_NAMESPACE \
--set fullnameOverride=APP_NAME
Resource HighAvailabilityApplication
otomatis mengubah StorageClass StatefulSet menjadi standard-rwo-regional
, yang menggunakan Persistent Disk regional.
Periksa resource HighAvailabilityApplication
Jalankan perintah berikut untuk memverifikasi bahwa failover otomatis telah diaktifkan untuk contoh aplikasi:
kubectl describe highavailabilityapplication APP_NAME
Output akan muncul seperti berikut:
Status:
Conditions:
Last Transition Time: 2023-08-09T23:59:52Z
Message: Application is protected
Observed Generation: 1
Reason: ApplicationProtected
Status: True
Type: Protected
Menggunakan Persistent Disk yang ada
Jika Anda menggunakan Persistent Disk yang sudah ada dan PersistentVolume yang ditentukan secara statis, konfigurasi PersistentVolume dengan force-attach: true
di .spec.csi.volumeAttributes
. Contoh:
apiVersion: v1
kind: PersistentVolume
metadata:
name: PV_NAME
spec:
storageClassName: "STORAGE_CLASS_NAME"
capacity:
storage: DISK_SIZE
accessModes:
- ReadWriteOnce
claimRef:
name: PV_CLAIM_NAME
namespace: default
csi:
driver: pd.csi.storage.gke.io
volumeHandle: DISK_ID
fsType: FS_TYPE
volumeAttributes:
force-attach: true