Halaman ini diterjemahkan oleh Cloud Translation API.

Membuat permintaan pemesanan untuk masa mendatang dalam mode kalender

Dokumen ini menjelaskan cara membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mempelajari lebih lanjut jenis pemesanan ini, lihat Ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender.

Buat permintaan pemesanan untuk masa mendatang dalam mode kalender untuk mencadangkan resource berikut hingga 90 hari:

Hingga 80 instance virtual machine (VM) yang telah memasang GPU.
Hingga 1.024 chip TPU.

Pada tanggal dan waktu pengiriman yang Anda pilih, Anda dapat membuat VM GPU atau TPU dengan menggunakan kapasitas yang dicadangkan. Gunakan permintaan pemesanan untuk masa mendatang dalam mode kalender guna mendapatkan resource yang sangat diminati untuk beban kerja berikut:

Tugas pra-pelatihan model
Tugas penyesuaian model
Workload simulasi komputasi berperforma tinggi (HPC)
Peningkatan beban kerja inferensi dalam jangka pendek

Untuk mencadangkan lebih dari 80 VM GPU atau selama lebih dari 90 hari dalam satu permintaan, lihat Mencadangkan kapasitas dalam dokumentasi AI Hypercomputer.

Batasan

Bagian berikut menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang dalam mode kalender.

Batasan untuk semua permintaan

Semua permintaan pemesanan untuk masa mendatang dalam mode kalender memiliki batasan berikut:

Anda dapat memesan resource untuk jangka waktu antara 1 dan 90 hari.
Setelah membuat dan mengirimkan permintaan, Anda tidak dapat membatalkan, menghapus, atau mengubah permintaan Anda.

Batasan untuk permintaan VM GPU

Anda hanya dapat memesan VM GPU sebagai berikut:

Anda dapat mencadangkan antara 1 dan 80 VM GPU per permintaan.
Anda dapat memesan seri mesin berikut:
- A4
- A3 Ultra
Anda dapat memesan VM GPU hanya di zona tertentu.

Batasan untuk permintaan TPU

Anda hanya dapat memesan TPU sebagai berikut:

Anda dapat memesan 1, 4, 8, 16, 32, 64, 128, 256, 512, atau 1.024 chip TPU per permintaan.
Anda dapat memesan versi TPU berikut:
- TPU v6e
- TPU v5p
- TPU v5e
Anda hanya dapat mencadangkan 1, 4, atau 8 chip TPU v5e untuk jenis workload penayangan (SERVING).
Anda hanya dapat memesan TPU di zona berikut:
- Untuk TPU v6e:
  - asia-northeast1-b
  - us-east5-a
  - us-east5-b
- Untuk TPU v5p:
  - us-east5-a
- Untuk TPU v5e:
  - Untuk jenis beban kerja batch (BATCH): us-west4-b
  - Untuk jenis beban kerja penayangan (SERVING): us-central1-a

Sebelum memulai

Jika Anda tidak dapat menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda mungkin tidak memenuhi syarat untuk mengakses dan menggunakan fitur ini. Dalam hal ini, hubungi tim akun atau tim penjualan Anda.
Untuk membagikan kapasitas yang dipesan ke project lain dalam organisasi Anda, pastikan project tempat Anda ingin membuat permintaan pemesanan untuk masa mendatang dalam mode kalender diizinkan untuk membuat pemesanan bersama. Jika tidak, Anda akan mengalami error.
Jika Anda belum melakukannya, siapkan autentikasi. Autentikasi memverifikasi identitas Anda untuk mengakses Google Cloud layanan dan API. Untuk menjalankan kode atau sampel dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke Compute Engine dengan memilih salah satu opsi berikut:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Menginstal Google Cloud CLI. Setelah penginstalan, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
  gcloud init
  Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
  
  Catatan: Jika Anda telah menginstal gcloud CLI sebelumnya, pastikan Anda memiliki versi terbaru dengan menjalankan gcloud components update.
2. Set a default region and zone.
REST

Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, Anda menggunakan kredensial yang Anda berikan ke gcloud CLI.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, minta administrator untuk memberi Anda peran IAM Compute Future Reservation User (roles/compute.futureReservationUser) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender:

Untuk membuat permintaan pemesanan untuk masa mendatang: compute.futureReservations.create pada project
Agar Compute Engine dapat membuat pemesanan secara otomatis: compute.reservations.create pada project
Untuk menentukan template instance: compute.instanceTemplates.useReadOnly pada template instance
Untuk melihat ketersediaan resource pada masa mendatang: compute.advice.calendarMode pada project

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Ringkasan

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, selesaikan langkah-langkah berikut:

Lihat ketersediaan mendatang resource. Lihat ketersediaan mendatang untuk VM GPU atau TPU yang ingin Anda pesan. Kemudian, saat membuat permintaan, tentukan jumlah, jenis, dan durasi reservasi resource yang telah Anda konfirmasi ketersediaannya. Google Cloud lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.

Catatan: Jika Anda membuat permintaan menggunakan konsol Google Cloud , lewati langkah ini. Anda dapat melihat ketersediaan GPU VM atau TPU di masa mendatang saat membuat permintaan.
Buat permintaan reservasi untuk VM GPU atau TPU. Buat dan kirim permintaan pemesanan di masa mendatang dalam mode kalender untuk VM GPU atau TPU. Jika Anda dapat berhasil membuat permintaan, maka Google Cloud menyetujuinya dalam satu menit.

Melihat ketersediaan resource pada masa mendatang

Anda dapat melihat ketersediaan mendatang untuk VM GPU atau TPU di suatu region sebagai berikut:

Untuk VM GPU, hingga 60 hari sebelumnya
Untuk TPU, hingga 120 hari sebelumnya

Untuk melihat ketersediaan VM GPU atau TPU pada masa mendatang di suatu region, pilih salah satu opsi berikut:

Konsol

Anda dapat melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mengetahui informasi selengkapnya, lihat Membuat permintaan reservasi untuk VM GPU atau TPU dalam dokumen ini.

gcloud

Untuk melihat ketersediaan mendatang VM GPU atau TPU di suatu region, gunakan salah satu perintah gcloud beta compute advice calendar-mode berikut. Berdasarkan resource yang ingin Anda lihat, sertakan tanda berikut:

Untuk melihat ketersediaan VM GPU, sertakan tanda --vm-count dan --machine-type:

gcloud beta compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --end-time-range=from=FROM_END_TIME,to=TO_END_TIME

Untuk melihat ketersediaan TPU, sertakan flag --chip-count dan --tpu-version:

gcloud beta compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --end-time-range=from=FROM_END_TIME,to=TO_END_TIME

Ganti kode berikut:

NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.
MACHINE_TYPE: jenis mesin GPU yang akan dipesan.
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.
TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:
- Untuk TPU v6e: V6E
- Untuk TPU v5p: V5P
- Untuk TPU v5e: V5E
Jika Anda menentukan TPU v5e, Anda harus menyertakan flag --workload-type. Tetapkan flag ini ke jenis beban kerja yang ingin Anda jalankan di TPU:
- Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.
- Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.
REGION: region tempat VM GPU atau TPU akan dipesan. Untuk memeriksa region dan zona yang didukung, lihat Batasan dalam dokumen ini.
FROM_START_TIME dan TO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Ganti kode berikut:
- YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).
- HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).
- OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Jika tidak ingin menggunakan offset, tentukan Z.
FROM_END_TIME dan TO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti flag --end-time-range dengan flag --duration-range.

Outputnya mirip dengan hal berikut ini:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Jika resource yang Anda minta tersedia, output akan berisi kolom startTime, endTime, dan location. Kolom ini menentukan waktu mulai paling awal, waktu berakhir paling akhir, dan zona saat resource tersedia.

REST

Untuk melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region, buat permintaan GET ke metode advice.calendarMode beta. Berdasarkan resource yang ingin Anda lihat, sertakan kolom berikut dalam isi permintaan:

Untuk melihat ketersediaan VM GPU, sertakan kolom instanceCount dan machineType:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "endTimeNotEarlierThan": "FROM_END_TIME",
        "endTimeNotLaterThan": "TO_END_TIME"
      }
    }
  }
}

Untuk melihat ketersediaan TPU, sertakan kolom acceleratorCount dan vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "endTimeNotEarlierThan": "FROM_END_TIME",
        "endTimeNotLaterThan": "TO_END_TIME"
      }
    }
  }
}

Ganti kode berikut:

PROJECT_ID: ID project tempat Anda ingin memesan resource.
REGION: region tempat Anda ingin memesan VM GPU atau TPU. Untuk memeriksa region dan zona yang didukung, lihat Batasan dalam dokumen ini.
NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.
MACHINE_TYPE: jenis mesin GPU yang akan dipesan.
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.
TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:
- Untuk TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Untuk TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Untuk TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Jika Anda menentukan TPU v5e, maka di kolom aggregateResources, Anda harus menyertakan kolom workloadType. Tetapkan kolom ini ke jenis beban kerja yang ingin Anda jalankan di TPU:
- Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.
- Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.
FROM_START_TIME dan TO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
Ganti kode berikut:
- YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).
- HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).
- OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Jika tidak ingin menggunakan offset, tentukan Z.
FROM_END_TIME dan TO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti kolom endTimeNotEarlierThan dan endTimeNotLaterThan dengan kolom minDuration dan maxDuration.

Outputnya mirip dengan hal berikut ini:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Membuat permintaan reservasi untuk VM GPU atau TPU

Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda hanya dapat menentukan periode pemesanan sebagai berikut:

Waktu mulai: berdasarkan resource yang ingin Anda pesan, Anda harus menentukan waktu mulai yang setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:
- Untuk VM GPU, 87 jam (tiga hari dan 15 jam)
- Untuk TPU, enam jam
Waktu berakhir: Anda dapat memesan resource selama maksimum 90 hari.

Untuk membuat permintaan menggunakan VM GPU yang ada sebagai referensi, gunakan konsolGoogle Cloud . Jika tidak, pilih salah satu opsi berikut:

Konsol

Di konsol Google Cloud , buka halaman Reservations.

Buka Pemesanan
Klik tab Future reservations.
Klik Create future reservation. Halaman Create a future reservation akan muncul dan panel Hardware configuration akan dipilih.
Di bagian Configuration, tentukan properti VM GPU atau TPU yang ingin Anda pesan dengan melakukan salah satu hal berikut:
- Untuk menentukan properti VM GPU atau TPU secara langsung, selesaikan langkah-langkah berikut:
  1. Pilih Specify machine type.
  2. Klik tab GPU atau TPU, lalu pilih jenis mesin GPU atau versi TPU yang akan dicadangkan.
- Untuk menentukan properti VM GPU menggunakan template instance yang ada, pilih Template instance, lalu pilih template.
- Untuk menentukan properti VM GPU dengan menggunakan VM yang ada sebagai referensi, pilih Gunakan VM yang ada, lalu pilih VM.
Jika Anda menentukan TPU v5e (CT5LP) pada langkah sebelumnya, pilih salah satu opsi berikut di daftar TPU v5 workload type:
- Untuk menjalankan workload di TPU yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan ML, pilih Batch.
- Untuk menjalankan beban kerja di TPU yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti beban kerja inferensi ML, pilih Penayangan.
Di bagian Search for capacity, selesaikan langkah-langkah berikut:
1. Dalam daftar Region dan Zone, tentukan region dan zona tempat Anda ingin memesan resource. Untuk meninjau region dan zona yang didukung, lihat Batasan dalam dokumen ini.
2. Di kolom Total capacity needed (saat memesan VM GPU) atau daftar Number of chips (saat memesan TPU), tentukan jumlah VM GPU atau chip TPU yang akan dipesan.
3. Dalam daftar Waktu mulai, pilih waktu mulai untuk permintaan Anda.
4. Opsional: Di daftar Pilih fleksibilitas tanggal mulai Anda, pilih seberapa tepat tanggal mulai Anda.
5. Di kolom Reservation duration, tentukan berapa lama Anda ingin memesan resource.
6. Klik Telusuri kapasitas. Kemudian, di tabel Kapasitas yang tersedia, pilih salah satu opsi yang tersedia yang berisi jenis, jumlah, dan periode reservasi VM GPU atau TPU yang akan dipesan.
Klik Berikutnya.
Di bagian Jenis berbagi, pilih project untuk membagikan kapasitas yang diminta:
- Untuk menggunakan kapasitas yang dicadangkan hanya dalam project Anda, pilih Lokal.
- Untuk membagikan kapasitas yang dicadangkan dengan project lain, pilih Dibagikan, klik Tambahkan project, lalu ikuti perintah untuk memilih project.
Klik Berikutnya.
Di kolom Nama pemesanan untuk masa mendatang, masukkan nama untuk permintaan.
Di kolom Reservation name, masukkan nama pemesanan yang dibuat Compute Engine secara otomatis untuk menyediakan kapasitas yang Anda minta.
Klik Buat.

gcloud

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, gunakan salah satu perintah gcloud beta compute future-reservations create berikut. Berdasarkan resource yang ingin Anda cadangkan, sertakan tanda berikut:

Untuk memesan VM GPU, sertakan flag --total-count dan --machine-type:

gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Untuk memesan TPU, sertakan flag --chip-count dan --tpu-version:

gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

Ganti kode berikut:

FUTURE_RESERVATION_NAME: nama permintaan.
NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.
MACHINE_TYPE: jenis mesin GPU yang akan dipesan.
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.
TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:
- Untuk TPU v6e: V6E
- Untuk TPU v5p: V5P
- Untuk TPU v5e: V5E
Jika Anda menentukan TPU v5e, Anda harus menyertakan flag --workload-type. Tetapkan tanda ke jenis beban kerja yang ingin Anda jalankan di TPU:
- Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.
- Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.
RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.
SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:
- Untuk menggunakan kapasitas hanya dalam project Anda: local
- Untuk membagikan kapasitas dengan project lain: projects
Jika Anda menentukan projects, Anda harus menyertakan flag --share-with yang ditetapkan ke daftar project ID yang dipisahkan koma—misalnya, project-1,project-2. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan sertakan project ID Anda dalam daftar ini. Anda dapat menggunakan kapasitas yang dicadangkan secara default.
START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.
END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti flag --end-time dengan flag --duration.
ZONE: zona tempat Anda ingin memesan resource.

REST

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, kirim permintaan POST berikut ke metode beta futureReservations.insert. Berdasarkan resource yang ingin Anda pesan, sertakan kolom berikut dalam isi permintaan:

Untuk memesan VM GPU, sertakan kolom totalCount dan machineType:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Untuk memesan TPU, sertakan kolom acceleratorCount dan vmFamily:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

Ganti kode berikut:

PROJECT_ID: ID project tempat Anda ingin membuat permintaan.
ZONE: zona tempat Anda ingin memesan resource.
FUTURE_RESERVATION_NAME: nama permintaan.
RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.
SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:
- Untuk menggunakan kapasitas hanya dalam project Anda: LOCAL
- Untuk membagikan kapasitas dengan project lain: SPECIFIC_PROJECTS
Jika Anda menentukan SPECIFIC_PROJECTS, maka di kolom shareSettings, Anda harus menyertakan kolom projectMap untuk menentukan project yang akan berbagi kapasitas. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan tentukan project ID Anda. Anda dapat menggunakan kapasitas yang dicadangkan secara default.

Misalnya, untuk membagikan kapasitas yang diminta ke dua project lain, sertakan yang berikut:
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
Ganti CONSUMER_PROJECT_ID_1 dan CONSUMER_PROJECT_ID_2 dengan ID dua project yang ingin Anda izinkan untuk menggunakan kapasitas yang diminta.
NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.
MACHINE_TYPE: jenis mesin GPU yang akan dipesan.
NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.
TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:
- Untuk TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- Untuk TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- Untuk TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Jika Anda menentukan TPU v5e, maka di kolom aggregateResources, Anda harus menyertakan kolom workloadType. Tetapkan kolom ke jenis beban kerja yang ingin Anda jalankan di TPU:
- Untuk beban kerja yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti beban kerja pelatihan ML, tentukan BATCH.
- Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.
START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.
END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti kolom endTime dengan kolom duration.

Membuat permintaan pemesanan untuk masa mendatang dalam mode kalender Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Batasan

Batasan untuk semua permintaan

Batasan untuk permintaan VM GPU

Batasan untuk permintaan TPU

Sebelum memulai

Console

gcloud

REST

Peran yang diperlukan

Izin yang diperlukan

Ringkasan

Melihat ketersediaan resource pada masa mendatang

Konsol

gcloud

REST

Membuat permintaan reservasi untuk VM GPU atau TPU

Konsol

gcloud

REST

Langkah berikutnya

Membuat permintaan pemesanan untuk masa mendatang dalam mode kalender