Dokumen ini menjelaskan berbagai jenis reservasi yang dapat Anda gunakan untuk memesan kapasitas untuk instance Compute Engine. Untuk mempelajari lebih lanjut resource yang dapat Anda gunakan untuk membuat instance, lihat Instance Compute Engine.
Pemesanan membantu memastikan bahwa Anda memiliki resource yang tersedia untuk membuat instance dengan hardware yang sama (memori dan vCPU) dan resource opsional (GPU, TPU, atau disk SSD Lokal) kapan pun Anda membutuhkannya. Reservasi menawarkan manfaat berikut:
Jaminan kapasitas yang tinggi: Anda mencadangkan resource untuk mengakomodasi peningkatan permintaan pada masa mendatang, seperti berikut:
Pertumbuhan
Lonjakan penggunaan yang direncanakan atau tidak direncanakan
Migrasi besar
Pencadangan dan pemulihan dari bencana (disaster recovery)
Akses eksklusif: reservasi mencegah orang lain menggunakan resource yang Anda pesan.
Properti yang diwariskan: reservasi mewarisi properti yang sama dengan kelompok mesin yang Anda pilih.
Setelah mencadangkan kapasitas, Anda dapat menggunakannya untuk membuat instance yang cocok dengan reservasi. Anda tidak dikenai biaya tambahan saat membuat instance ini. Anda hanya membayar resource yang bukan bagian dari reservasi, seperti disk atau alamat IP.
Batasan
Semua jenis reservasi memiliki batasan berikut:
Reservasi adalah resource khusus zona.
Anda tidak dapat menggunakan kapasitas yang dipesan untuk membuat resource Compute Engine berikut:
Spot VM atau instance preemptible
Sole-tenant node
Pilih jenis reservasi
Diagram berikut membantu Anda memilih jenis reservasi Compute Engine yang paling sesuai dengan kebutuhan workload Anda:
Pertanyaan dalam diagram sebelumnya adalah sebagai berikut:
Apakah Anda memerlukan kapasitas segera?
Ya: Lanjutkan ke pertanyaan berikutnya.
Tidak: Lanjutkan ke pertanyaan 3.
Apakah Anda memerlukan fleksibilitas dalam berapa lama kapasitas harus dipertahankan?
Ya: Lihat Menggunakan reservasi sesuai permintaan.
Tidak: Lanjutkan ke pertanyaan berikutnya.
Apakah Anda memerlukan resource dengan permintaan tinggi seperti GPU?
Ya: Lanjutkan ke pertanyaan berikutnya.
Tidak: Lihat Menggunakan pemesanan untuk masa mendatang.
Apakah Anda memerlukan sumber daya selama lebih dari 90 hari?
Ya: Lihat Kapasitas cadangan di AI Hypercomputer.
Tidak: Lihat Menggunakan pemesanan untuk masa mendatang dalam mode kalender.
Menggunakan reservasi on-demand
Dengan pemesanan on-demand, Anda dapat mencadangkan kapasitas untuk instance komputasi dan mendapatkannya segera setelah Anda mencadangkannya. Setelah membuat pemesanan on-demand, Anda dapat menggunakan, mengubah, atau menghapusnya kapan pun Anda mau.
Untuk mengetahui informasi selengkapnya, lihat Tentang reservasi.
Menggunakan pemesanan untuk masa mendatang
Untuk memesan instance selama jangka waktu tertentu, Anda dapat menggunakan pemesanan untuk masa mendatang. Setelah membuat permintaan reservasi, Anda harus mengirimkannya ke Google Cloud untuk ditinjau. Google Cloud biasanya memerlukan waktu lima hari untuk meninjau permintaan Anda. Jika permintaan Anda disetujui, Compute Engine akan membuat pemesanan on-demand dengan kapasitas yang Anda minta pada tanggal dan waktu yang Anda pilih. Untuk menggunakan reservasi ini, Anda membuat instance komputasi yang menggunakan reservasi tersebut. Setelah periode pemesanan berakhir, Anda dapat mengubah atau menghapus pemesanan.
Untuk mengetahui informasi selengkapnya, lihat Tentang permintaan pemesanan untuk masa mendatang.
Menggunakan pemesanan untuk masa mendatang dalam mode kalender
Untuk memesan instance GPU atau TPU hingga 90 hari, Anda dapat menggunakan pemesanan untuk masa mendatang dalam mode kalender. Untuk membuat jenis reservasi ini, lihat terlebih dahulu kapan jumlah dan jenis resource yang Anda pilih tersedia di suatu region. Kemudian, buat dan kirim permintaan reservasi dengan properti yang telah Anda konfirmasi sebagai tersedia. Jika Anda berhasil membuat permintaan, maka Google Cloud akan menyetujuinya dalam waktu satu menit. Setelah permintaan disetujui, Compute Engine melakukan hal berikut:
Compute Engine membuat pemesanan on-demand.
Compute Engine mencadangkan resource yang Anda minta sedekat mungkin satu sama lain untuk meminimalkan latensi jaringan.
Di awal periode pemesanan, Anda dapat menggunakan pemesanan dengan membuat instance GPU atau TPU. Di akhir periode reservasi, Compute Engine akan menghapus reservasi, dan menghentikan atau menghapus instance yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk instance tersebut.
Untuk mengetahui informasi selengkapnya, lihat Tentang permintaan pemesanan untuk masa mendatang dalam mode kalender.
Mencadangkan kapasitas di Hypercomputer AI
Hubungi tim akun Anda dan minta untuk mencadangkan instance GPU untuk workload kecerdasan buatan (AI) dan machine learning (ML) skala besar. Setelah Google membuat draf permintaan pemesanan untuk Anda, kirimkan untuk ditinjau jika semuanya tampak benar. Google Cloud segera menyetujui permintaan tersebut, lalu Compute Engine akan melakukan hal berikut:
Compute Engine membuat pemesanan on-demand.
Compute Engine mencadangkan resource yang Anda minta sedekat mungkin satu sama lain untuk meminimalkan latensi jaringan.
Compute Engine mencadangkan resource dengan penjadwalan yang kompatibel dengan topologi, serta pemantauan dan pemeliharaan yang ditingkatkan.
Di awal periode reservasi, Anda dapat menggunakan reservasi dengan membuat instance GPU. Di akhir periode reservasi, Compute Engine akan menghapus reservasi, dan menghentikan atau menghapus instance yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk instance tersebut.
Untuk mengetahui informasi selengkapnya, lihat Kapasitas cadangan dalam dokumentasi AI Hypercomputer.