Bersiap menghadapi peristiwa kapasitas puncak


Panduan ini menjelaskan cara bersiap menghadapi peristiwa kapasitas puncak dan traffic tinggi sehingga Anda dapat memberikan layanan dengan periode nonaktif minimal atau tanpa periode nonaktif, dan tanpa penurunan performa atau pengalaman pengguna.

Saat mengelola peristiwa di cloud, ada tiga fase utama:

  1. Persiapan: selesaikan aktivitas dan tugas untuk mempersiapkan acara Anda, termasuk peninjauan arsitektur, perencanaan kapasitas, dan pembuatan reservasi.
  2. Eksekusi: saat peristiwa dimulai, pantau dengan cermat dan bereaksilah dengan tepat.
  3. Analisis: setelah acara selesai, analisis hal-hal yang berjalan dengan baik, hal-hal yang tidak berjalan dengan baik, dan cara meningkatkan kualitas acara di masa mendatang.

Panduan ini berfokus pada fase persiapan.

Checklist

Pelajari cara mempersiapkan peristiwa kapasitas puncak dengan menyelesaikan tugas berikut:


Jika ingin mengikuti panduan langkah demi langkah untuk tugas ini langsung di Konsol Google Cloud, klik Pandu saya:

Pandu saya


Sebelum memulai

Bergantung pada paket dukungan Customer Care yang telah Anda beli, pastikan Anda memahami layanan kesiapan acara yang tersedia untuk Anda:

  • Dukungan yang Ditingkatkan: Anda dapat mengoptimalkan kesiapan untuk peristiwa, peluncuran, dan migrasi menggunakan Dukungan untuk Peristiwa Terencana, yaitu Layanan Nilai Tambah yang memberikan cakupan untuk fase penting dari peristiwa digital jangka pendek dengan traffic tinggi seperti pembukaan besar-besaran, peluncuran produk baru, atau migrasi data.

  • Dukungan Premium: Anda dapat menggunakan Layanan Pengelolaan Peristiwa untuk peristiwa puncak yang direncanakan, seperti peluncuran produk atau acara penjualan besar. Dengan layanan ini, Layanan Pelanggan akan berpartner dengan Anda untuk membuat rencana, memberikan panduan selama peristiwa berlangsung, dan mendukung Anda dengan hal-hal berikut:

    • Menyiapkan sistem Anda untuk momen penting dan beban kerja yang berat
    • Menjalankan pengujian bencana untuk menyelesaikan potensi masalah secara proaktif
    • Mengembangkan dan menerapkan jalur penyelesaian yang lebih cepat untuk mengurangi dampak masalah yang mungkin terjadi

    Setelah acara, Technical Account Manager (TAM) akan bekerja sama dengan Anda untuk meninjau hasilnya dan membuat rekomendasi untuk acara mendatang. Untuk memulai atau mempelajari lebih lanjut, hubungi TAM Anda.

Memahami praktik terbaik pengelolaan peristiwa

Anda harus memahami dan mengikuti praktik terbaik pengelolaan peristiwa tertentu:

  1. Menjelaskan proses perencanaan peristiwa Anda: saat berada dalam fase persiapan untuk peristiwa kapasitas puncak, Anda harus menghubungi tim akun atau TAM untuk membantu Anda meninjau arsitektur, membuat diagram, linimasa, dan checklist peluncuran, memeriksa kuota layanan berdasarkan profil traffic yang diperkirakan, dan menentukan dampak keseluruhan pada project Anda.

  2. Pantau dan bereaksi selama eksekusi: saat musim puncak atau peristiwa peluncuran dimulai, Anda harus memantau aktivitas dengan cermat dan bereaksi sesuai kebutuhan. Jika terjadi masalah, manajemen insiden dan proses eskalasi yang jelas adalah kunci untuk mengurangi upaya dan waktu yang diperlukan untuk mengatasi dan menyelesaikan masalah.

  3. Tinjau dan dokumentasikan analisis Anda: setelah musim puncak atau peristiwa peluncuran selesai, tinjau dan analisis peristiwa tersebut, serta dokumentasikan pelajaran yang diperoleh sehingga Anda dapat menerapkannya ke peristiwa besar berikutnya.

Untuk mengetahui informasi selengkapnya, lihat Praktik terbaik pengelolaan peristiwa.

Meminta dan mendapatkan kapasitas yang sesuai untuk acara Anda

Komponen penting dari fase persiapan adalah perencanaan kapasitas, tempat Anda menentukan jumlah resource cloud yang diperlukan untuk memastikan workload Anda memiliki apa yang diperlukan untuk beroperasi secara efektif. Saat Anda bersiap untuk acara traffic tinggi atau musim puncak, pastikan kuota Anda sesuai dengan persyaratan resource agar Anda tidak mengalami kegagalan yang tidak terduga. Untuk informasi selengkapnya, lihat Mengamankan kapasitas untuk acara Anda.

Menggunakan Capacity Planner

Capacity Planner memungkinkan Anda melihat histori dan perkiraan penggunaan instance virtual machine (VM), volume Persistent Disk, dan GPU. Anda juga dapat melihat pemesanan, memesan resource terlebih dahulu, mengelola batas kuota project, dan menyiapkan permintaan peningkatan kuota otomatis. Untuk mengetahui informasi selengkapnya, lihat Melihat data penggunaan dan perkiraan di Capacity Planner.

  1. Di konsol Google Cloud, buka halaman Capacity Planner.

    Buka Capacity Planner

  2. Dengan pemilih resource di toolbar konsol, pilih project, folder, atau organisasi.

  3. Pilih jenis resource Compute Engine yang data penggunaannya ingin Anda lihat:

    • Untuk melihat data penggunaan VM, klik tab Virtual machine, jika belum dipilih.

    • Untuk melihat data penggunaan volume Persistent Disk, klik tab Disk.

    • Untuk melihat data penggunaan GPU, klik tab GPU.

  4. Anda dapat memfilter elemen untuk melihat visualisasi data yang berbeda untuk data penggunaan dan perkiraan resource.

Mengaktifkan pengatur kuota

Pengatur kuota memantau pemakaian resource Anda dan secara proaktif mengirimkan permintaan penyesuaian kuota atas nama Anda sehingga Anda tidak perlu membuat permintaan manual. Untuk informasi selengkapnya, lihat Cara kerja penyesuai kuota.

  1. Di konsol Google Cloud, buka halaman IAM & Admin > Kuota dan batas sistem.

    Buka Kuota dan batas sistem

  2. Klik tab Konfigurasi.

  3. Untuk mengaktifkan penyesuai kuota, klik tombol Enable ke posisi aktif.

Jika kolom Status menampilkan Diaktifkan, pengatur kuota akan memantau penggunaan Anda dan mengeluarkan permintaan penyesuaian kuota saat penggunaan resource menghampiri nilai kuotanya.

Meminta penyesuaian kuota

Jika kuota Anda tidak mencukupi untuk kebutuhan Anda, Anda dapat meminta penyesuaian kuota. Untuk informasi selengkapnya, lihat Melihat dan mengelola kuota.

  1. Di konsol Google Cloud, buka halaman IAM & Admin > Kuota dan batas sistem.

    Buka Kuota dan batas sistem

  2. Centang kotak di samping kuota yang ingin Anda perbarui.

    Secara opsional, untuk menelusuri kuota, gunakan Filter.

  3. Klik Edit dan panel Quota changes akan muncul.

  4. Di kolom New value, masukkan nilai kuota yang Anda inginkan. Beberapa nilai kuota memiliki satuan pengukuran; jika hal ini berlaku, pilih satuan yang Anda inginkan dalam daftar yang berdekatan.

  5. Jika Anda melihat pesan yang menunjukkan bahwa Anda akan menghapus penggantian kuota dengan meminta kuota yang lebih besar dari penggantian, centang kotak untuk melanjutkan, lalu pilih Minta kuota lebih tinggi.

  6. Di kolom Request description, masukkan deskripsi, lalu klik Done.

  7. Klik Berikutnya dan berikan detail kontak Anda.

  8. Klik Submit request.

Jika permintaan Anda ditolak, Anda dapat mencoba meminta penambahan kuota dengan membuat kasus dukungan, atau dengan menghubungi tim akun atau TAM Anda.

Membuat pemesanan

Pemesanan membantu memastikan bahwa Anda memiliki resource Compute Engine yang tersedia untuk membuat VM dengan hardware yang sama (memori dan vCPU) dan resource opsional (GPU dan disk SSD Lokal) kapan pun Anda membutuhkannya.

Pemesanan on-demand disediakan pada saat Anda memintanya, jika kapasitas yang diminta tersedia. Pemesanan untuk masa mendatang memungkinkan Anda meminta kapasitas terlebih dahulu. Sebaiknya Anda mendapatkan reservasi mendatang jauh sebelum acara. Untuk mengetahui informasi selengkapnya, lihat Pemesanan resource zona Compute Engine.

Membuat pemesanan on demand untuk satu project

  1. Di konsol Google Cloud, buka halaman Reservations.

    Buka Pemesanan

  2. Di tab Pemesanan sesuai permintaan (default), klik Buat pemesanan.

    Halaman Create a reservation akan terbuka.

  3. Masukkan Nama untuk pemesanan Anda.

  4. Pilih Region dan Zone tempat Anda ingin memesan resource.

  5. Untuk Jenis berbagi, pilih Lokal jika belum dipilih.

  6. Untuk mengizinkan reservasi VM GPU digunakan oleh tugas pelatihan kustom atau tugas prediksi Vertex AI, di bagian Layanan Google Cloud, pilih Bagikan reservasi.

  7. Pilih opsi Gunakan dengan instance VM:

    • Untuk mengizinkan VM yang cocok menggunakan pemesanan ini secara otomatis, pilih Gunakan pemesanan secara otomatis jika belum dipilih.

    • Untuk menggunakan resource pemesanan ini hanya saat membuat VM yang sama persis yang secara khusus menargetkan pemesanan ini berdasarkan nama, pilih Pilih pemesanan tertentu.

  8. Masukkan Jumlah instance VM yang ingin Anda pesan.

  9. Di bagian Machine configuration, lakukan hal berikut:

    1. Untuk menentukan properti VM Anda dari template instance yang ada, pilih Gunakan template instance.

    2. Tentukan Instance Template. Jika memilih template regional, Anda hanya dapat memesan resource di region tersebut.

  10. Untuk menghapus pemesanan secara otomatis pada waktu yang ditentukan, centang kotak Enable auto-delete. Menghapus otomatis pemesanan dapat berguna untuk menghindari biaya yang tidak perlu saat Anda berhenti menggunakan pemesanan.

  11. Untuk membuat pemesanan, klik Buat.

    Halaman Reservations akan terbuka. Mungkin perlu waktu hingga satu menit untuk membuat reservasi.

Membuat pemesanan untuk masa mendatang bagi project tunggal

  1. Di konsol Google Cloud, buka halaman Reservations.

    Buka Reservations

  2. Klik tab Future reservations.

  3. Klik Create future reservation.

    Halaman Create a future reservation akan terbuka.

  4. Untuk Name, masukkan nama untuk permintaan pemesanan untuk masa mendatang.

  5. Untuk Awalan, masukkan awalan nama. Nama setiap pemesanan yang dibuat secara otomatis dari permintaan pemesanan untuk masa mendatang dimulai dengan awalan ini.

  6. Untuk Region dan Zone, pilih region dan zona tempat Anda ingin memesan resource.

  7. Untuk Start time, masukkan waktu mulai untuk periode pemesanan. Waktu mulai tidak boleh lebih dari satu tahun sejak tanggal dan waktu Anda mengirimkan permintaan pemesanan untuk masa mendatang untuk ditinjau. Agar memiliki cukup waktu untuk mengubah, membatalkan, atau menghapus pemesanan untuk masa mendatang secara opsional sebelum memasuki waktu penguncian, tentukan nilai yang direkomendasikan untuk waktu mulai.

  8. Untuk End time, masukkan waktu berakhir untuk periode pemesanan minimal 14 hari. Di bagian Duration summary, Anda dapat melihat durasi periode pemesanan. Untuk meningkatkan kemungkinan Google Cloud menyetujui permintaan pemesanan untuk masa mendatang setelah Anda mengirimkannya untuk ditinjau, pastikan untuk menentukan nilai yang direkomendasikan untuk periode pemesanan.

  9. Di bagian Jenis berbagi, pilih Lokal jika belum dipilih.

  10. Untuk Total kapasitas yang diperlukan, masukkan jumlah total VM yang ingin Anda pesan untuk periode, konfigurasi VM, dan project yang ditentukan dalam permintaan pemesanan untuk masa mendatang.

  11. Di bagian Machine configuration, lakukan hal berikut:

    1. Pilih Gunakan template instance.

    2. Untuk Instance template, pilih template instance pilihan Anda. Jika memilih template instance regional, Anda hanya dapat memesan resource dalam region yang sama dengan region template.

  12. Di bagian Auto-generated reservations auto-delete, lakukan salah satu tindakan berikut:

    • Agar Compute Engine dapat otomatis menghapus pemesanan yang dibuat secara otomatis untuk permintaan pemesanan untuk masa mendatang, lakukan langkah berikut:

      1. Klik tombol Aktifkan hapus otomatis ke posisi aktif jika belum disetel ke posisi tersebut.

      2. Opsional: Untuk Auto-delete time, masukkan tanggal dan waktu untuk menghapus pemesanan yang dibuat otomatis. Tanggal dan waktu harus setelah waktu berakhirnya periode pemesanan. Jika Anda membiarkan kolom ini kosong, pemesanan yang dibuat secara otomatis akan dihapus dalam waktu dua jam setelah waktu berakhir periode pemesanan.

    • Jika tidak, klik tombol Enable auto-delete ke posisi nonaktif.

  13. Untuk menyelesaikan pembuatan draf permintaan pemesanan untuk masa mendatang, klik Save a draft.

Halaman Reservations akan terbuka. Pembuatan permintaan pemesanan untuk masa mendatang dapat memakan waktu hingga satu menit.

Bersiaplah untuk menyelesaikan masalah dengan cepat selama acara

Cara Anda merespons, mengategorikan, dan menyelesaikan insiden dengan tingkat keparahan yang berbeda dapat memengaruhi operasi Anda secara signifikan selama peristiwa. Pastikan untuk menggunakan sistem pengelolaan insiden terpusat untuk pelacakan yang efektif selama siklus proses insiden.

Selain meninjau kontak dan mengaktifkan Kesehatan Layanan yang Dipersonalisasi, Anda harus melakukan hal berikut:

  • Meninjau praktik terbaik saat bekerja dengan Layanan Pelanggan
  • Membuat rencana komunikasi
  • Memastikan akses

Untuk mengetahui informasi selengkapnya, lihat Bersiap untuk menyelesaikan masalah selama acara.

Meninjau kontak Anda

Banyak Google Cloud penawaran yang mengirimkan notifikasi untuk membagikan informasi penting kepada Google Cloud pengguna. Secara default, notifikasi ini dikirim kepada anggota dengan peran Pengelolaan Akses dan Identitas (IAM) tertentu. Dengan Kontak Penting, Anda dapat menyesuaikan siapa yang menerima notifikasi dengan menyediakan daftar kontak Anda sendiri. Untuk mengetahui informasi selengkapnya, lihat Mengelola kontak untuk notifikasi.

  1. Di konsol Google Cloud, buka halaman IAM & Admin > Kontak Penting.

    Buka Kontak Penting

  2. Pastikan nama project, folder, atau organisasi Anda muncul di pemilih resource di toolbar konsol. Pemilih resource memberi tahu Anda project, folder, atau organisasi tempat Anda mengelola kontak.

  3. Untuk mencantumkan kontak menurut kategori, pilih Kategori. Untuk mencantumkan kontak secara alfabet, pilih Kontak.

Mengaktifkan Personalized Service Health

Personalized Service Health memungkinkan Anda mengidentifikasi Google Cloud gangguan layanan yang relevan dengan project Anda sehingga Anda dapat mengelola dan meresponsnya secara efisien. Untuk informasi selengkapnya, lihat Ringkasan Kesehatan Layanan yang Dipersonalisasi.

Pastikan Anda telah mengaktifkan Service Health API sebelum peristiwa dimulai dan organisasi Anda dapat mengakses dasbor dan mengonfigurasi pemberitahuan. Untuk informasi selengkapnya, lihat Mengelola akses Fitur Kesehatan Layanan yang Dipersonalisasi.

  1. Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.

    Buka pemilih project

  2. Enable the Service Health API.

    Enable the API

Mengelola dan mengoptimalkan resource cloud Anda

Kelola dan optimalkan resource yang digunakan oleh workload Google Cloud Anda. Hal ini mencakup penyesuaian ukuran resource berdasarkan penggunaan dan permintaan sebenarnya, menggunakan penskalaan otomatis untuk alokasi resource dinamis, dan meninjau rekomendasi keamanan dan arsitektur.

Selain meninjau rekomendasi Active Assist, Anda harus melakukan hal berikut:

  • Tinjau Google Cloud praktik terbaik
  • Meninjau skalabilitas
  • Meninjau versi produk
  • Meninjau pemberitahuan dan dasbor

Untuk informasi selengkapnya, lihat Mengoptimalkan resource cloud.

Meninjau rekomendasi Active Assist

Active Assist mengacu pada portofolio alat yang digunakan di Google Cloud untuk menghasilkan rekomendasi dan insight guna membantu Anda mengoptimalkan project Google Cloud . Untuk informasi selengkapnya, lihat Apa itu Active Assist.

  1. Di konsol Google Cloud, buka Recommendation Hub.

    Buka Hub Rekomendasi

  2. Dengan pemilih resource di toolbar konsol, pilih project, folder, atau organisasiGoogle Cloud .

    Anda hanya dapat melihat rekomendasi di tingkat organisasi atau folder jika memiliki izin untuk organisasi atau folder tersebut, terlepas dari izin Anda untuk folder atau project di dalamnya.

  3. Di panel navigasi, klik Semua rekomendasi.

    Rekomendasi yang dapat Anda filter, urutkan, dan bagikan akan ditampilkan. Anda dapat mempelajari rekomendasi secara mendetail, melihat resource yang terpengaruh, dan dampak yang mungkin ditimbulkan oleh penerapan rekomendasi.

  4. Untuk mempelajari rekomendasi lebih lanjut, klik rekomendasi di kolom Rekomendasi.

    Data relevan yang dapat membantu Anda memutuskan apakah akan menerapkan atau menutup rekomendasi akan ditampilkan.

  5. Jika memiliki izin, Anda dapat menerapkan atau menolak rekomendasi dengan mengklik tombol yang berlaku.

    Perhatikan bahwa beberapa rekomendasi mungkin tidak berlaku secara langsung. Ikuti petunjuk yang dijelaskan di konsol untuk menerapkannya.

Menjadwalkan dan melakukan pengujian beban

Pengujian beban dapat menentukan apakah sistem Anda akan berhasil diskalakan selama penggunaan produksi, dan menemukan bottleneck yang mencegah penskalaannya.

  1. Tiga hingga lima bulan sebelum peristiwa, Anda harus melakukan uji beban pada project dan beban kerja penting untuk menyimulasikan traffic puncak.

  2. Selidiki kuota dan implikasi biaya dari pengujian beban, lalu pertimbangkan untuk membuat pemberitahuan anggaran Penagihan Cloud yang akan memantau biaya layanan yang paling banyak Anda gunakan.

  3. Setelah setiap pengujian, evaluasi hasilnya dan gunakan Capacity Planner untuk memvisualisasikan data perkiraan dan penggunaan Anda, serta minta peningkatan kuota jika diperlukan. Dalam dokumen ini, lihat Menggunakan Capacity Planner dan Meminta penyesuaian kuota.

Jika Anda memerlukan bantuan, hubungi tim akun atau TAM Anda. Alat ini dapat membantu Anda menangkap dan merencanakan perubahan arsitektur untuk meningkatkan keandalan dan ketersediaan layanan secara keseluruhan.

Menjadwalkan dan melakukan pengujian disaster recovery

Jika memiliki strategi disaster recovery (DR) yang andal dan teruji dengan baik, Anda dapat meminimalkan dampak gangguan, mencapai waktu pemulihan yang lebih cepat, dan melanjutkan operasi inti dengan lebih cepat saat terjadi masalah.

Strategi DR Anda harus mencakup persyaratan tanggap darurat yang terperinci, operasi pencadangan, dan prosedur pemulihan.

  1. Satu hingga tiga bulan sebelum peristiwa, pastikan untuk menjalankan simulasi skenario bencana untuk mengidentifikasi kesenjangan dalam rencana dan kesiapan DR Anda.

  2. Setelah setiap pengujian, evaluasi hasilnya untuk menentukan apakah ada perubahan arsitektur yang diperlukan. Tinjau dan optimalkan resource sesuai kebutuhan. Dalam dokumen ini, lihat Mengelola dan mengoptimalkan resource cloud Anda.

Tim akun atau TAM dapat membantu Anda melakukan pengujian DR, serta cara memahami dan meningkatkan proses respons insiden. Untuk informasi selengkapnya, lihat Panduan perencanaan pemulihan dari bencana (disaster recovery).

Ringkasan referensi

Tabel berikut mencantumkan panduan yang dirujuk dalam dokumen ini.

Memahami praktik terbaik pengelolaan peristiwa
Meminta dan mendapatkan kapasitas yang sesuai untuk acara Anda
Bersiaplah untuk menyelesaikan masalah dengan cepat selama acara
Mengelola dan mengoptimalkan resource cloud Anda
Menjadwalkan dan melakukan pengujian beban
Menjadwalkan dan melakukan pengujian disaster recovery

Langkah berikutnya