Praktik terbaik pengelolaan peristiwa

Saat mengelola musim puncak atau peristiwa traffic tinggi di cloud, ada tiga fase utama:

  1. Persiapan: selesaikan aktivitas dan tugas untuk mempersiapkan acara Anda, termasuk peninjauan arsitektur, perencanaan kapasitas, dan pembuatan reservasi.
  2. Eksekusi: saat peristiwa dimulai, pantau dengan cermat dan bereaksi sesuai dengan peristiwa tersebut.
  3. Analisis: setelah acara selesai, analisis hal-hal yang berjalan dengan baik, hal-hal yang tidak berjalan dengan baik, dan cara meningkatkan kualitas acara di masa mendatang.

Anda harus memahami dan mengikuti praktik terbaik tertentu selama fase ini agar dapat memberikan layanan dengan periode nonaktif minimal atau tanpa periode nonaktif, dan tanpa penurunan performa atau pengalaman pengguna selama peristiwa.

Persiapan: jelaskan proses perencanaan acara Anda

Saat berada dalam fase persiapan untuk peristiwa kapasitas puncak, Anda harus menghubungi tim akun atau TAM untuk membantu meninjau arsitektur, membuat diagram, linimasa, dan checklist peluncuran, memeriksa kuota layanan berdasarkan profil traffic yang diperkirakan, dan menentukan dampak keseluruhan pada project Anda.

Perencanaan harus dimulai jauh sebelum tanggal acara Anda. Dalam beberapa kasus, Anda mungkin perlu mulai merencanakan beberapa bulan sebelumnya saat layanan Anda masih dalam pengembangan. Kumpulkan tim yang dapat membantu Anda meninjau alur kerja peristiwa yang diusulkan, audiens yang diharapkan, persyaratan dan kriteria keberhasilan Anda, serta rantai pengiriman media menyeluruh. Fase persiapan harus mencakup penilaian risiko, perencanaan mitigasi, dan peninjauan kesiapan operasional untuk memastikan alur kerja Anda dirancang dengan baik.

Untuk informasi selengkapnya, tinjau Google Cloud Framework Arsitektur yang memberikan rekomendasi untuk membantu arsitek, developer, administrator, dan praktisi cloud lainnya mendesain dan mengoperasikan topologi cloud yang aman, efisien, tangguh, berperforma tinggi, dan hemat biaya.

Eksekusi: memantau dan bereaksi selama eksekusi

Saat musim puncak atau peristiwa peluncuran dimulai, Anda harus memantau aktivitas dengan cermat dan bereaksi sesuai kebutuhan. Setelah menyiapkan pemantauan, pemberitahuan, dan logging di fase persiapan, Anda dapat memantau traffic, log, dan tingkat kuota yang penting bagi bisnis, serta menggunakan informasi ini untuk menentukan akar masalah dan menyelesaikan masalah dengan cepat. Untuk informasi selengkapnya, lihat Meninjau pemberitahuan dan dasbor.

Jika terjadi masalah, proses eskalasi dan manajemen insiden yang jelas adalah kunci untuk mengurangi upaya dan waktu yang diperlukan untuk mengatasi dan menyelesaikan masalah. Jika Anda belum melakukannya, buat proses pengelolaan insiden. Untuk mengetahui informasi selengkapnya, lihat Bersiap untuk menyelesaikan masalah selama acara.

Analisis: meninjau dan mendokumentasikan analisis Anda

Setelah musim puncak atau peristiwa peluncuran selesai, tinjau dan analisis peristiwa tersebut, serta dokumentasikan pengalaman yang diperoleh sehingga Anda dapat menerapkannya ke peristiwa besar berikutnya.

Fokus pada area berikut:

  • Ringkasan linimasa: catat kapan traffic Anda mulai meningkat dan peristiwa utama (puncak) selama periode peristiwa. Identifikasi kapan, jika ada, masalah muncul.

  • Analisis akar masalah: menyelidiki masalah yang terjadi. Apakah ada hal yang bisa Anda atau Google Cloud lakukan secara berbeda? Apakah hal ini perlu dipertimbangkan untuk lain kali? Dokumentasikan pelajaran yang diperoleh dan langkah-langkah yang diperlukan untuk meningkatkan kualitas di masa mendatang.

  • Membandingkan prediksi dengan yang sebenarnya: analisis prediksi traffic Anda dengan traffic sebenarnya yang Anda catat. Di mana sumber daya tambahan diperlukan? Di mana resource tidak dimanfaatkan sepenuhnya atau tidak diperlukan?

  • Retrospektif: bagikan dan tinjau informasi sebelumnya dengan pemangku kepentingan utama. Promosikan budaya tanpa menyalahkan, dengan mengasumsikan bahwa semua orang yang terlibat memiliki niat baik dan Anda berfokus untuk mengidentifikasi penyebab yang berkontribusi tanpa menunjukkan individu atau tim mana pun.

Langkah berikutnya