Dokumen ini memberikan ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mempelajari lebih lanjut berbagai cara mencadangkan resource di Compute Engine, lihat Memilih jenis reservasi.
Untuk mendapatkan kapasitas guna membuat instance mesin virtual (VM) yang memiliki GPU atau TPU terpasang, gunakan permintaan pemesanan untuk masa mendatang dalam mode kalender. Jika Google Cloud menyetujui permintaan Anda, Compute Engine akan menyediakan resource yang dicadangkan pada tanggal dan waktu yang Anda pilih, serta selama durasi yang Anda pilih. Anda dapat menggunakan resource yang dicadangkan untuk membuat VM GPU atau VM TPU guna menjalankan workload berikut:
Tugas prapelatihan model
Tugas penyesuaian model
Workload simulasi komputasi berperforma tinggi (HPC)
Peningkatan beban kerja inferensi yang diperkirakan dalam jangka pendek
Membuat permintaan dalam mode kalender
Bagian berikut menjelaskan cara melihat ketersediaan resource, serta detail yang harus ditentukan saat Anda membuat permintaan pemesanan untuk masa mendatang dalam mode kalender.
Melihat ketersediaan resource pada masa mendatang
Sebelum membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda dapat melihat ketersediaan di masa mendatang di suatu region untuk resource berikut:
Untuk VM GPU, hingga 60 hari sebelumnya
Untuk TPU, hingga 120 hari sebelumnya
Compute Engine menggunakan Dynamic Workload Scheduler (DWS) untuk melihat kapan resource yang Anda minta tersedia. Saat membuat permintaan, tentukan jumlah, jenis, dan periode reservasi untuk resource yang telah Anda konfirmasi ketersediaannya. Google Cloud lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.
Menentukan properti permintaan
Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus menentukan properti berikut:
Hapus otomatis. Properti ini menentukan apakah Compute Engine menghapus pemesanan yang dibuat secara otomatis (auto-created) untuk permintaan Anda pada waktu berakhir, meskipun pemesanan belum digunakan sepenuhnya. Untuk membuat permintaan dalam mode kalender, Anda harus mengaktifkan opsi hapus otomatis.
Jenis konsumsi. Properti ini menentukan cara VM menggunakan pemesanan yang dibuat secara otomatis. Saat membuat permintaan dalam mode kalender, Anda harus menentukan bahwa Anda ingin membuat pemesanan yang ditargetkan secara khusus. Setelan ini berarti hanya VM yang menargetkan reservasi yang dapat menggunakannya.
Jenis deployment. Properti ini menentukan kolokasi resource yang dipesan. Saat membuat permintaan dalam mode kalender, Anda harus menentukan untuk men-deploy resource secara padat. Dalam jenis deployment ini, resource ditempatkan berdekatan satu sama lain untuk meminimalkan latensi jaringan.
Name. Nama permintaan Anda, yang harus unik dalam project Anda.
Number of resources. Jumlah VM GPU atau TPU yang akan dipesan pada waktu mulai yang Anda minta.
Status perencanaan. Properti ini menentukan apakah Anda langsung mengirimkan permintaan ke Google Cloud untuk ditinjau, atau menyimpannya sebagai draf dan mengirimkannya nanti. Saat membuat permintaan dalam mode kalender, Anda harus menentukan untuk segera mengirimkan permintaan untuk ditinjau.
Mode reservasi. Properti ini menentukan metode untuk mencadangkan resource, yang harus Anda tetapkan ke
CALENDAR
untuk permintaan dalam mode kalender.Nama reservasi. Nama untuk pemesanan yang dibuat secara otomatis oleh Compute Engine jika Google Cloud menyetujui permintaan Anda.
Jenis berbagi. Properti ini menentukan apakah project lain di organisasi Anda dapat menggunakan pemesanan yang dibuat otomatis untuk permintaan yang disetujui. Anda dapat menentukan salah satu opsi berikut:
Proyek tunggal. Hanya project Anda yang dapat menggunakan kapasitas yang dicadangkan.
Dibagikan. Anda dapat membagikan kapasitas yang dicadangkan dengan hingga 100 project lain di organisasi Anda. Jika Anda menentukan opsi ini, Anda harus menentukan project yang akan diajak berbagi pemesanan yang dibuat otomatis. Untuk informasi selengkapnya, lihat praktik terbaik untuk pemesanan bersama.
Periode reservasi. Tanggal dan waktu saat Compute Engine menyediakan kapasitas yang Anda minta, dan Anda dapat menggunakannya. Periode reservasi mencakup hal berikut:
Waktu mulai. Saat Anda ingin mulai menggunakan kapasitas yang dipesan. Berdasarkan resource yang Anda pesan, waktu mulai harus setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:
Untuk VM GPU, 87 jam (tiga hari dan 15 jam)
Untuk TPU, 24 jam
Waktu berakhir. Saat kapasitas yang Anda minta tidak lagi dicadangkan untuk Anda. Pada saat ini, Compute Engine akan menghapus reservasi yang dibuat secara otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk VM.
Properti resource. Persyaratan hardware VM GPU atau TPU yang ingin Anda cadangkan. VM hanya dapat menggunakan reservasi jika propertinya cocok dengan properti reservasi. Untuk mengetahui informasi selengkapnya, lihat persyaratan untuk menggunakan reservasi.
Jenis workload. Jika Anda memesan TPU v5e, Anda harus menentukan cara memesan kapasitas berdasarkan jenis workload Anda:
Batch. Untuk workload yang menangani sejumlah besar data dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML).
Menayangkan. Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML.
Zona. Zona tempat Anda ingin memesan kapasitas.
Proses permintaan peninjauan
Untuk memesan kapasitas menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus membuat dan mengirimkan permintaan ke Google Cloud untuk ditinjau. Setelah Anda membuat dan mengirimkan permintaan, Google Cloud akan meninjaunya dalam waktu satu menit, dan kemudian salah satu hal berikut akan terjadi:
Google Cloud menyetujui permintaan Anda: Compute Engine akan mencadangkan resource yang Anda minta dan, dalam waktu satu menit setelah persetujuan, akan otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan meningkatkan jumlah TPU dalam pemesanan.
Anda mengalami error. Permintaan gagal karena zona permintaan tidak memiliki resource yang memadai. Sebaiknya lihat kembali ketersediaan sumber daya di masa mendatang, lalu buat dan kirim permintaan peninjauan baru.
Siklus proses permintaan
Diagram berikut menunjukkan berbagai status yang dapat ditetapkan Compute Engine untuk permintaan pemesanan untuk masa mendatang dalam mode kalender:
Status dan alur peristiwa yang ditampilkan dalam diagram sebelumnya adalah sebagai berikut:
PENDING_APPROVAL
: Anda membuat dan mengirimkan permintaan peninjauan. Dalam waktu satu menit, Google Cloud menyetujui permintaan.APPROVED
: Google Cloud menyetujui permintaan Anda. Kemudian, dalam waktu satu menit, Compute Engine akan otomatis membuat pemesanan kosong dan mengubah status permintaan menjadiPROCURING
.PROCURING
: Compute Engine menjadwalkan penyediaan resource yang dipesan. Sebelum waktu mulai permintaan, status permintaan berubah menjadiPROVISIONING
.PROVISIONING
: Compute Engine sedang menyediakan resource yang dipesan dengan meningkatkan jumlah TPU yang dipesan dalam reservasi yang dibuat secara otomatis. Pada waktu mulai permintaan, status permintaan akan berubah menjadiFULFILLED
.FULFILLED
: Compute Engine telah menyediakan resource yang dipesan, dan Anda akan ditagih untuk resource tersebut. Anda dapat menggunakan pemesanan yang dibuat secara otomatis dengan membuat VM hingga waktu berakhir permintaan.
Pada waktu berakhir permintaan, Compute Engine akan menghapus permintaan dan pemesanan yang dibuat secara otomatis. Tindakan ini juga menghentikan atau menghapus VM yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk VM.
Menggunakan kapasitas yang disediakan
Setelah Google Cloud menyetujui permintaan pemesanan untuk masa mendatang dalam mode kalender, Compute Engine akan otomatis membuat pemesanan dengan karakteristik berikut:
Pemesanan yang dibuat otomatis tidak memiliki VM atau TPU GPU yang dicadangkan; Anda belum dapat menggunakannya.
Pemesanan yang dibuat secara otomatis mewarisi properti VM atau TPU yang ditentukan dalam permintaan Anda.
Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan meningkatkan jumlah VM GPU atau TPU dalam pemesanan yang dibuat secara otomatis. Selanjutnya, Anda dapat menggunakan reservasi dengan membuat VM GPU atau VM TPU yang memenuhi semua kondisi berikut:
VM dan reservasi memiliki properti yang cocok.
VM menggunakan model penyediaan terikat reservasi.
VM harus dihentikan atau dihapus pada waktu berakhirnya pemesanan.
Anda dapat membuat VM hingga pemesanan digunakan sepenuhnya atau hingga waktu berakhir permintaan. Pada waktu berakhir permintaan, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus semua VM yang menggunakan pemesanan tersebut.
Kuota
Permintaan pemesanan untuk masa mendatang dalam mode kalender harus menggunakan model penyediaan terikat pemesanan. Model ini tidak memerlukan kuota Compute Engine untuk mencadangkan resource. Namun, sebelum membuat permintaan, pastikan Anda memiliki kuota yang cukup untuk resource yang tidak termasuk dalam reservasi saat membuat VM, seperti disk atau alamat IP.
Harga
Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda tidak ditagih. Sebagai gantinya, Anda dikenai biaya saat hal berikut terjadi:
Compute Engine menyediakan kapasitas yang Anda minta. Saat permintaan mencapai status
FULFILLED
, Anda akan ditagih untuk resource yang disediakan sesuai dengan harga DWS. Model harga ini menawarkan vCPU, GPU, dan TPU dengan harga diskon.Anda menggunakan resource yang tidak tercakup dalam reservasi. Saat membuat VM yang menggunakan pemesanan yang dibuat secara otomatis, Anda tidak akan ditagih lagi untuk resource yang digunakan. Anda hanya ditagih untuk resource yang bukan bagian dari reservasi, seperti disk atau alamat IP.
Anda tidak lagi dikenai biaya pada waktu berakhirnya permintaan. Pada saat ini, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus semua VM yang menggunakan pemesanan tersebut.
Batasan
Bagian berikut menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang dalam mode kalender.
Batasan untuk semua permintaan
Semua permintaan pemesanan untuk masa mendatang dalam mode kalender memiliki batasan berikut:
Anda dapat memesan resource untuk jangka waktu antara 1 dan 90 hari.
Setelah membuat dan mengirimkan permintaan, Anda tidak dapat membatalkan, menghapus, atau mengubah permintaan Anda.
Batasan untuk permintaan VM GPU
Anda hanya dapat memesan VM GPU sebagai berikut:
Anda dapat mencadangkan antara 1 dan 80 VM GPU per permintaan.
Anda dapat memesan seri mesin berikut:
Anda dapat memesan VM GPU hanya di zona tertentu.
Batasan untuk permintaan TPU
Anda hanya dapat memesan TPU sebagai berikut:
Anda dapat memesan 1, 4, 8, 16, 32, 64, 128, 256, 512, atau 1.024 chip TPU per permintaan.
Anda dapat memesan versi TPU berikut:
Anda hanya dapat mencadangkan 1, 4, atau 8 chip TPU v5e untuk jenis workload penayangan (
SERVING
).Anda hanya dapat memesan TPU di zona berikut:
Untuk TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Untuk TPU v5p:
us-east5-a
Untuk TPU v5e:
Untuk jenis beban kerja batch (
BATCH
):us-west4-b
Untuk jenis beban kerja penayangan (
SERVING
):us-central1-a
Batasan untuk semua pemesanan yang dibuat secara otomatis
Pemesanan yang dibuat secara otomatis untuk permintaan memiliki batasan berikut:
Anda hanya dapat mengubah pemesanan sebagai berikut:
Untuk mengizinkan atau tidak mengizinkan tugas Vertex AI menggunakannya.
Setelah waktu mulai pemesanan.
Anda tidak dapat menerapkan diskon abonemen (CUD) atau diskon untuk penggunaan berkelanjutan (SUD) ke reservasi.
Anda tidak dapat menghapus pemesanan; Compute Engine akan menghapusnya pada waktu berakhir pemesanan.