Halaman ini diterjemahkan oleh Cloud Translation API.

Panduan keandalan infrastruktur Google Cloud

Last reviewed 2024-11-20 UTC

Infrastruktur yang andal adalah persyaratan penting untuk workload di cloud. Sebagai arsitek cloud, untuk merancang infrastruktur workload yang andal, Anda memerlukan pemahaman yang baik mengenai kemampuan keandalan penyedia cloud pilihan Anda. Dokumen ini menjelaskan elemen penyusun keandalan di Google Cloud (zona, region, dan resource cakupan lokasi) dan tingkat ketersediaan yang disediakannya. Dokumen ini juga memberikan panduan untuk menilai persyaratan keandalan workload Anda, dan menyajikan rekomendasi arsitektur untuk membangun serta mengelola infrastruktur yang andal di Google Cloud.

Dokumen ini dibagi menjadi bagian-bagian berikut:

Jika Anda telah membaca panduan ini sebelumnya dan ingin melihat apa saja yang berubah, lihat Catatan rilis.

Ringkasan keandalan

Aplikasi atau workload dikatakan dapat diandalkan jika memenuhi tujuan Anda dan memiliki ketersediaan dan ketahanan terhadap kegagalan.

Ketersediaan (atau waktu beroperasi) adalah persentase waktu penggunaan aplikasi. Misalnya, untuk aplikasi yang memiliki target ketersediaan 99,99%, total periode nonaktif tidak boleh melebihi 8,64 detik selama periode 24 jam. Terkadang, ketersediaan diukur sebagai proporsi permintaan yang berhasil ditayangkan oleh aplikasi selama periode tertentu. Misalnya, untuk aplikasi yang memiliki target ketersediaan 99,99%, untuk setiap 100.000 permintaan yang diterima, yang boleh gagal tidak lebih dari sepuluh permintaan. Ketersediaan sering kali dinyatakan dengan angka sembilan dalam persentase. Misalnya, ketersediaan 99,99% dinyatakan dengan "4 angka sembilan".

Bergantung pada tujuan aplikasi, Anda mungkin memiliki kumpulan indikator yang berbeda untuk menunjukkan keandalan aplikasi. Berikut adalah contoh indikator keandalan:

Untuk aplikasi yang menayangkan konten, indikator keandalan yang penting antara lain ketersediaan, latensi, dan throughput. Indikator ini menunjukkan apakah aplikasi dapat merespons permintaan, berapa lama aplikasi dapat merespons permintaan, dan berapa banyak permintaan yang dapat diproses oleh aplikasi dengan sukses dalam periode tertentu.
Untuk database dan sistem penyimpanan, indikator keandalannya berupa latensi, throughput, ketersediaan, dan ketahanan (seberapa baik data terlindungi dari kehilangan atau kerusakan). Metrik ini menunjukkan berapa lama sistem membutuhkan waktu untuk membaca atau menulis data, dan apakah data dapat diakses secara on-demand.
Untuk big data dan workload analisis seperti pipeline pemrosesan data, performa pipeline yang konsisten (throughput dan latensi) sangat penting untuk memastikan keaktualan produk data, dan merupakan indikator keandalan yang penting. Metrik ini menunjukkan jumlah data yang dapat diproses, dan berapa lama waktu yang dibutuhkan pipeline untuk bergerak dari penyerapan data ke pemrosesan data.
Sebagian besar aplikasi menjadikan ketepatan data sebagai indikator keandalan yang penting.

Guna mengetahui panduan lebih lanjut untuk menentukan tujuan keandalan aplikasi, baca Menilai persyaratan keandalan untuk workload cloud Anda.

Faktor-faktor yang memengaruhi keandalan aplikasi

Keandalan aplikasi yang di-deploy di Google Cloud bergantung pada faktor-faktor berikut:

Desain internal aplikasi.
Aplikasi atau komponen sekunder yang menjadi dependensi aplikasi.
Google Cloud resource infrastruktur seperti komputasi, jaringan, penyimpanan, database, dan keamanan tempat aplikasi berjalan, serta cara aplikasi menggunakan infrastruktur tersebut.
Kapasitas infrastruktur yang Anda sediakan, dan cara kapasitas diskalakan.
Proses dan alat DevOps yang Anda gunakan untuk mem-build, men-deploy, dan mengelola aplikasi, beserta dependensinya, juga infrastruktur Google Cloud.

Faktor-faktor ini dirangkum dalam diagram berikut:

Dependensi keandalan aplikasi.

Seperti yang ditunjukkan pada diagram sebelumnya, keandalan aplikasi yang di-deploy di Google Cloud bergantung pada beberapa faktor. Fokus panduan ini adalah keandalan infrastruktur Google Cloud .

Langkah berikutnya

Kontributor

Penulis:

Nir Tarcic | Cloud Lifecycle SRE UTL
Kumar Dhanagopal | Cross-Product Solution Developer

Kontributor lainnya:

Alok Kumar | Distinguished Engineer
Andrew Fikes | Engineering Fellow, Reliability
Chris Heiser | SRE TL
David Ferguson | Director, Site Reliability Engineering
Joe Tan | Senior Product Counsel
Krzysztof Duleba | Principal Engineer
Narayan Desai | Principal SRE
Sailesh Krishnamurthy | VP, Engineering
Steve McGhee | Reliability Advocate
Sudhanshu Jain | Product Manager
Yaniv Aknin | Software Engineer

Berikutnya

Elemen penyusun keandalan