Prinsip ini dalam pilar keandalan Google Cloud Framework yang Dirancang dengan Baik memberikan rekomendasi untuk merencanakan, membangun, dan mengelola redundansi resource, yang dapat membantu Anda menghindari kegagalan.
Prinsip ini relevan dengan area fokus penentuan cakupan keandalan.
Ringkasan prinsip
Setelah memutuskan tingkat keandalan yang Anda butuhkan, Anda harus mendesain sistem untuk menghindari titik kegagalan tunggal. Setiap komponen penting dalam sistem harus direplikasi di beberapa mesin, zona, dan region. Misalnya, database penting tidak boleh berada di satu region saja, dan server metadata tidak boleh di-deploy di satu zona atau region saja. Dalam contoh tersebut, jika satu-satunya zona atau region mengalami pemadaman, sistem akan mengalami pemadaman global.
Rekomendasi
Untuk membangun sistem yang redundan, pertimbangkan rekomendasi di subbagian berikut.
Mengidentifikasi domain kegagalan dan mereplikasi layanan
Petakan domain kegagalan sistem Anda, dari VM individual hingga region, dan desain untuk redundansi di seluruh domain kegagalan.
Untuk memastikan ketersediaan tinggi, distribusikan dan replikasi layanan dan aplikasi Anda di beberapa zona dan region. Konfigurasi sistem untuk failover otomatis guna memastikan layanan dan aplikasi terus tersedia jika terjadi pemadaman layanan zona atau region.
Untuk contoh arsitektur multi-zona dan multi-region, lihat Mendesain infrastruktur yang andal untuk workload Anda di Google Cloud.
Mendeteksi dan mengatasi masalah dengan cepat
Terus lacak status domain yang gagal untuk mendeteksi dan mengatasi masalah dengan cepat.
Anda dapat memantau status layanan saat ini di semua region menggunakan Google Cloud Dasbor Service Health. Google Cloud Anda juga dapat melihat insiden yang relevan dengan project Anda menggunakan Personalized Service Health. Anda dapat menggunakan load balancer untuk mendeteksi kondisi resource dan merutekan traffic secara otomatis ke backend yang berfungsi dengan baik. Untuk mengetahui informasi selengkapnya, lihat Ringkasan health check.
Menguji skenario failover
Seperti latihan menghadapi kebakaran, simulasikan kegagalan secara rutin untuk memvalidasi efektivitas strategi replikasi dan failover Anda.
Untuk mengetahui informasi selengkapnya, lihat Menyimulasikan pemadaman layanan zona untuk MIG regional dan Menyimulasikan kegagalan zona di cluster regional GKE.