Halaman ini diterjemahkan oleh Cloud Translation API.

Tentang permintaan reservasi untuk masa mendatang dalam mode kalender

Dokumen ini memberikan ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mempelajari lebih lanjut berbagai cara mencadangkan resource di Compute Engine, lihat Memilih jenis reservasi.

Untuk mendapatkan kapasitas guna membuat instance mesin virtual (VM) yang memiliki GPU atau TPU terpasang, gunakan permintaan pemesanan untuk masa mendatang dalam mode kalender. Jika Google Cloud menyetujui permintaan Anda, Compute Engine akan menyediakan resource yang dicadangkan pada tanggal dan waktu yang Anda pilih, dan hingga 90 hari. Selanjutnya, Anda dapat menggunakan resource yang dipesan untuk membuat VM GPU atau VM TPU guna menjalankan workload berikut:

Tugas pra-pelatihan model
Tugas penyesuaian model
Workload simulasi komputasi berperforma tinggi (HPC)
Peningkatan beban kerja inferensi yang diperkirakan dalam jangka pendek

Membuat permintaan dalam mode kalender

Bagian berikut menjelaskan cara melihat ketersediaan resource, serta detail yang harus ditentukan saat Anda membuat permintaan pemesanan untuk masa mendatang dalam mode kalender.

Melihat ketersediaan mendatang resource

Sebelum membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda dapat melihat ketersediaan di masa mendatang di suatu region untuk resource berikut:

Untuk VM GPU, hingga 60 hari sebelumnya
Untuk TPU, hingga 120 hari sebelumnya

Compute Engine menggunakan Dynamic Workload Scheduler (DWS) untuk melihat kapan resource yang Anda minta tersedia. Saat membuat permintaan, tentukan jumlah, jenis, dan periode reservasi untuk resource yang telah Anda konfirmasi ketersediaannya. Google Cloud lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.

Menentukan properti permintaan

Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus menentukan properti berikut:

Hapus otomatis. Properti ini menentukan apakah Compute Engine menghapus pemesanan yang dibuat secara otomatis (auto-created) untuk permintaan Anda pada waktu berakhir, meskipun pemesanan belum digunakan sepenuhnya. Untuk membuat permintaan dalam mode kalender, Anda harus mengaktifkan opsi hapus otomatis.
Jenis konsumsi. Properti ini menentukan cara VM menggunakan pemesanan yang dibuat secara otomatis. Saat membuat permintaan dalam mode kalender, Anda harus menentukan bahwa Anda ingin membuat pemesanan yang ditargetkan secara khusus. Setelan ini berarti hanya VM yang menargetkan reservasi yang dapat menggunakannya.
Jenis deployment. Properti ini menentukan kolokasi resource yang dipesan. Saat membuat permintaan dalam mode kalender, Anda harus menentukan untuk men-deploy resource secara padat. Dalam jenis deployment ini, resource ditempatkan berdekatan satu sama lain untuk meminimalkan latensi jaringan.
Name. Nama permintaan Anda, yang harus unik dalam project Anda.
Number of resources. Jumlah VM GPU atau TPU yang akan dipesan pada waktu mulai yang Anda minta.
Status perencanaan. Properti ini menentukan apakah Anda langsung mengirimkan permintaan ke Google Cloud untuk ditinjau, atau menyimpannya sebagai draf dan mengirimkannya nanti. Saat membuat permintaan dalam mode kalender, Anda harus menentukan untuk segera mengirimkan permintaan untuk ditinjau.
Mode reservasi. Properti ini menentukan metode untuk mencadangkan resource, yang harus Anda tetapkan ke CALENDAR untuk permintaan dalam mode kalender.
Nama reservasi. Nama untuk pemesanan yang dibuat secara otomatis oleh Compute Engine jika Google Cloud menyetujui permintaan Anda.
Jenis berbagi. Properti ini menentukan apakah project lain di organisasi Anda dapat menggunakan pemesanan yang dibuat otomatis untuk permintaan yang disetujui. Anda dapat menentukan salah satu opsi berikut:
- Proyek tunggal. Hanya project Anda yang dapat menggunakan kapasitas yang dicadangkan.
- Dibagikan. Anda dapat membagikan kapasitas yang dicadangkan dengan hingga 100 project lain di organisasi Anda. Jika Anda menentukan opsi ini, Anda harus menentukan project yang akan diajak berbagi pemesanan yang dibuat otomatis. Untuk informasi selengkapnya, lihat praktik terbaik untuk pemesanan bersama.
Penting: Anda hanya dapat menentukan jenis berbagi dan project bersama untuk pemesanan yang dibuat otomatis saat Anda membuat permintaan.
Periode reservasi. Tanggal dan waktu saat Compute Engine menyediakan kapasitas yang Anda minta, dan Anda dapat menggunakannya. Periode reservasi mencakup hal berikut:
- Waktu mulai. Saat Anda ingin mulai menggunakan kapasitas yang dipesan. Berdasarkan resource yang Anda pesan, waktu mulai harus setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:
  - Untuk VM GPU, 87 jam (tiga hari dan 15 jam)
  - Untuk TPU, enam jam
- Waktu berakhir. Saat kapasitas yang Anda minta tidak lagi dicadangkan untuk Anda. Pada saat ini, Compute Engine akan menghapus reservasi yang dibuat secara otomatis, dan menghentikan atau menghapus VM apa pun yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk VM.
Properti resource. Persyaratan hardware VM GPU atau TPU yang ingin Anda cadangkan. VM hanya dapat menggunakan reservasi jika propertinya cocok dengan properti reservasi. Untuk mengetahui informasi selengkapnya, lihat persyaratan untuk menggunakan reservasi.
Jenis workload. Jika Anda memesan TPU v5e, Anda harus menentukan cara memesan kapasitas berdasarkan jenis workload Anda:
- Batch. Untuk beban kerja yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti beban kerja pelatihan machine learning (ML).
- Menayangkan. Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML.
Zona. Zona tempat Anda ingin memesan kapasitas.

Proses permintaan peninjauan

Untuk memesan kapasitas menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda harus membuat dan mengirimkan permintaan ke Google Cloud untuk ditinjau. Setelah Anda membuat dan mengirimkan permintaan, Google Cloud akan meninjaunya dalam waktu satu menit, dan kemudian salah satu hal berikut akan terjadi:

Google Cloud menyetujui permintaan Anda: Compute Engine akan mencadangkan resource yang Anda minta dan, dalam waktu satu menit setelah persetujuan, akan otomatis membuat pemesanan kosong. Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan meningkatkan jumlah VM GPU atau TPU dalam reservasi.

Perhatian: Setelah membuat permintaan, Anda tidak dapat membatalkan, menghapus, atau mengubahnya. Anda berkomitmen untuk membayar kapasitas yang diminta pada waktu mulai permintaan, terlepas dari apakah Anda menggunakan kapasitas tersebut atau tidak.
Anda mengalami error. Permintaan gagal karena zona permintaan tidak memiliki resource yang memadai. Sebaiknya lihat kembali ketersediaan sumber daya di masa mendatang, lalu buat dan kirimkan permintaan peninjauan baru.

Siklus proses permintaan

Diagram berikut menunjukkan berbagai status yang dapat ditetapkan Compute Engine untuk permintaan pemesanan untuk masa mendatang dalam mode kalender:

Status dan alur peristiwa yang ditampilkan dalam diagram sebelumnya adalah sebagai berikut:

PENDING_APPROVAL: Anda membuat dan mengirimkan permintaan peninjauan. Dalam waktu satu menit, Google Cloud menyetujui permintaan.
APPROVED: Google Cloud menyetujui permintaan Anda. Kemudian, dalam waktu satu menit, Compute Engine akan otomatis membuat pemesanan kosong dan mengubah status permintaan menjadi PROCURING.
PROCURING: Compute Engine menjadwalkan penyediaan resource yang dipesan. Sebelum waktu mulai permintaan, status permintaan berubah menjadi PROVISIONING.
PROVISIONING: Compute Engine sedang menyediakan resource yang dipesan dengan meningkatkan jumlah VM GPU atau TPU yang dipesan dalam pemesanan yang dibuat secara otomatis. Pada waktu mulai permintaan, status permintaan berubah menjadi FULFILLED.
FULFILLED: Compute Engine telah menyediakan resource yang dipesan, dan Anda akan ditagih untuk resource tersebut. Anda dapat menggunakan pemesanan yang dibuat secara otomatis dengan membuat VM hingga waktu berakhir permintaan.

Pada waktu berakhir permintaan, Compute Engine akan menghapus permintaan dan pemesanan yang dibuat secara otomatis. Tindakan ini juga menghentikan atau menghapus VM yang menggunakan reservasi berdasarkan tindakan penghentian yang Anda tentukan untuk VM.

Menggunakan kapasitas yang disediakan

Setelah Google Cloud menyetujui permintaan pemesanan untuk masa mendatang dalam mode kalender, Compute Engine akan otomatis membuat pemesanan dengan karakteristik berikut:

Pemesanan yang dibuat otomatis tidak memiliki VM atau TPU GPU yang dicadangkan; Anda belum dapat menggunakannya.
Pemesanan yang dibuat secara otomatis mewarisi properti VM atau TPU yang ditentukan dalam permintaan Anda.

Pada waktu mulai permintaan, Compute Engine akan menyediakan kapasitas yang Anda minta dengan meningkatkan jumlah VM GPU atau TPU dalam pemesanan yang dibuat secara otomatis. Selanjutnya, Anda dapat menggunakan reservasi dengan membuat VM GPU atau VM TPU yang memenuhi semua kondisi berikut:

VM dan reservasi memiliki properti yang cocok.
VM secara khusus menargetkan pemesanan.
VM menggunakan model penyediaan terikat reservasi.
VM harus dihentikan atau dihapus pada waktu berakhirnya pemesanan.

Anda dapat membuat VM hingga pemesanan digunakan sepenuhnya atau hingga waktu berakhir permintaan. Pada waktu berakhir permintaan, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus semua VM yang menggunakan pemesanan tersebut.

Kuota

Permintaan pemesanan untuk masa mendatang dalam mode kalender harus menggunakan model penyediaan terikat pemesanan. Model ini tidak memerlukan kuota Compute Engine untuk mencadangkan resource. Namun, sebelum membuat permintaan, pastikan Anda memiliki kuota yang cukup untuk resource yang tidak termasuk dalam reservasi saat membuat VM, seperti disk atau alamat IP.

Harga

Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda tidak ditagih. Sebagai gantinya, Anda dikenai biaya saat hal berikut terjadi:

Compute Engine menyediakan kapasitas yang Anda minta. Saat permintaan mencapai status FULFILLED, Anda akan ditagih untuk resource yang disediakan sesuai dengan harga DWS. Model penetapan harga ini menawarkan vCPU, memori, GPU, dan TPU dengan harga diskon dibandingkan dengan harga standar.
Anda menggunakan resource yang tidak tercakup dalam reservasi. Saat membuat VM yang menggunakan pemesanan yang dibuat secara otomatis, Anda tidak akan ditagih lagi untuk resource yang digunakan. Anda hanya ditagih untuk resource yang bukan bagian dari reservasi, seperti disk atau alamat IP.

Anda berhenti dikenai biaya untuk resource yang dipesan pada waktu berakhirnya permintaan. Pada saat ini, Compute Engine akan menghapus pemesanan yang dibuat secara otomatis, dan menghentikan atau menghapus VM yang menggunakan pemesanan tersebut.

Batasan

Bagian berikut menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang dalam mode kalender.

Batasan untuk semua permintaan

Semua permintaan pemesanan untuk masa mendatang dalam mode kalender memiliki batasan berikut:

Anda dapat memesan resource untuk jangka waktu antara 1 dan 90 hari.
Setelah membuat dan mengirimkan permintaan, Anda tidak dapat membatalkan, menghapus, atau mengubah permintaan Anda.

Batasan untuk permintaan VM GPU

Anda hanya dapat memesan VM GPU sebagai berikut:

Anda dapat mencadangkan antara 1 dan 80 VM GPU per permintaan.
Anda dapat memesan seri mesin berikut:
- A4
- A3 Ultra
Anda dapat memesan VM GPU hanya di zona tertentu.

Batasan untuk permintaan TPU

Anda hanya dapat memesan TPU sebagai berikut:

Anda dapat memesan 1, 4, 8, 16, 32, 64, 128, 256, 512, atau 1.024 chip TPU per permintaan.
Anda dapat memesan versi TPU berikut:
- TPU v6e
- TPU v5p
- TPU v5e
Anda hanya dapat mencadangkan 1, 4, atau 8 chip TPU v5e untuk jenis workload penayangan (SERVING).
Anda hanya dapat memesan TPU di zona berikut:
- Untuk TPU v6e:
  - asia-northeast1-b
  - us-east5-a
  - us-east5-b
- Untuk TPU v5p:
  - us-east5-a
- Untuk TPU v5e:
  - Untuk jenis beban kerja batch (BATCH): us-west4-b
  - Untuk jenis beban kerja penayangan (SERVING): us-central1-a

Batasan untuk semua pemesanan yang dibuat secara otomatis

Pemesanan yang dibuat secara otomatis untuk permintaan memiliki batasan berikut:

Anda hanya dapat mengubah pemesanan sebagai berikut:
- Untuk mengizinkan atau tidak mengizinkan tugas Vertex AI menggunakannya.
- Setelah waktu mulai pemesanan.
Anda tidak dapat menerapkan diskon abonemen (CUD) atau diskon untuk penggunaan berkelanjutan (SUD) ke reservasi.
Anda tidak dapat menghapus pemesanan; Compute Engine akan menghapusnya pada waktu berakhir pemesanan.

Langkah berikutnya

Membuat permintaan pemesanan untuk masa mendatang dalam mode kalender