Membuat permintaan pemesanan untuk masa mendatang dalam mode kalender


Dokumen ini menjelaskan cara membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mempelajari lebih lanjut jenis pemesanan ini, lihat Ringkasan permintaan pemesanan untuk masa mendatang dalam mode kalender.

Buat permintaan pemesanan untuk masa mendatang dalam mode kalender untuk mencadangkan resource berikut hingga 90 hari:

  • Hingga 80 instance virtual machine (VM) yang telah memasang GPU.

  • Hingga 1.024 chip TPU.

Pada tanggal dan waktu pengiriman yang Anda pilih, Anda dapat membuat VM GPU atau TPU dengan menggunakan kapasitas yang dicadangkan. Gunakan permintaan pemesanan untuk masa mendatang dalam mode kalender guna mendapatkan resource yang sangat diminati untuk beban kerja berikut:

  • Tugas prapelatihan model

  • Tugas penyesuaian model

  • Workload simulasi komputasi berperforma tinggi (HPC)

  • Peningkatan beban kerja inferensi dalam jangka pendek

Untuk mencadangkan lebih dari 80 VM GPU atau selama lebih dari 90 hari dalam satu permintaan, lihat Mencadangkan kapasitas dalam dokumentasi AI Hypercomputer.

Batasan

Bagian berikut menjelaskan batasan untuk permintaan pemesanan untuk masa mendatang dalam mode kalender.

Batasan untuk semua permintaan

Semua permintaan pemesanan untuk masa mendatang dalam mode kalender memiliki batasan berikut:

  • Anda dapat memesan resource untuk jangka waktu antara 1 dan 90 hari.

  • Setelah membuat dan mengirimkan permintaan, Anda tidak dapat membatalkan, menghapus, atau mengubah permintaan Anda.

Batasan untuk permintaan VM GPU

Anda hanya dapat memesan VM GPU sebagai berikut:

  • Anda dapat mencadangkan antara 1 dan 80 VM GPU per permintaan.

  • Anda dapat memesan seri mesin berikut:

  • Anda dapat memesan VM GPU hanya di zona tertentu.

Batasan untuk permintaan TPU

Anda hanya dapat memesan TPU sebagai berikut:

  • Anda dapat memesan 1, 4, 8, 16, 32, 64, 128, 256, 512, atau 1.024 chip TPU per permintaan.

  • Anda dapat memesan versi TPU berikut:

  • Anda hanya dapat mencadangkan 1, 4, atau 8 chip TPU v5e untuk jenis workload penayangan (SERVING).

  • Anda hanya dapat memesan TPU di zona berikut:

    • Untuk TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Untuk TPU v5p:

      • us-east5-a
    • Untuk TPU v5e:

      • Untuk jenis beban kerja batch (BATCH): us-west4-b

      • Untuk jenis beban kerja penayangan (SERVING): us-central1-a

Sebelum memulai

  • Jika Anda tidak dapat menggunakan permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda mungkin tidak memenuhi syarat untuk mengakses dan menggunakan fitur ini. Dalam hal ini, hubungi tim akun atau tim penjualan Anda.
  • Untuk membagikan kapasitas yang dipesan ke project lain dalam organisasi Anda, pastikan project tempat Anda ingin membuat permintaan pemesanan untuk masa mendatang dalam mode kalender diizinkan untuk membuat pemesanan bersama. Jika tidak, Anda akan mengalami error.
  • Jika Anda belum melakukannya, siapkan autentikasi. Autentikasi adalah proses yang digunakan untuk memverifikasi identitas Anda untuk mengakses Google Cloud layanan dan API. Untuk menjalankan kode atau sampel dari lingkungan pengembangan lokal, Anda dapat melakukan autentikasi ke Compute Engine dengan memilih salah satu opsi berikut:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, minta administrator untuk memberi Anda peran IAM Compute Future Reservation Admin (roles/compute.futureReservationAdmin) di project. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin yang diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk melihat izin yang benar-benar diperlukan, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

Izin berikut diperlukan untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender:

  • Untuk membuat permintaan pemesanan untuk masa mendatang: compute.futureReservations.create pada project
  • Agar Compute Engine dapat membuat pemesanan secara otomatis: compute.reservations.create pada project
  • Untuk menentukan template instance: compute.instanceTemplates.useReadOnly pada template instance
  • Untuk melihat ketersediaan resource pada masa mendatang: compute.advice.calendarMode pada project

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Ringkasan

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, selesaikan langkah-langkah berikut:

  1. Lihat ketersediaan mendatang resource. Lihat ketersediaan di masa mendatang untuk VM GPU atau TPU yang ingin Anda pesan. Kemudian, saat membuat permintaan, tentukan jumlah, jenis, dan durasi reservasi resource yang Anda konfirmasi ketersediaannya. Google Cloud lebih cenderung menyetujui permintaan Anda jika Anda memberikan informasi ini.

  2. Buat permintaan reservasi untuk VM GPU atau TPU. Buat dan kirim permintaan reservasi mendatang dalam mode kalender untuk VM GPU atau TPU. Jika Anda dapat berhasil membuat permintaan, maka Google Cloud akan menyetujuinya dalam satu menit.

Melihat ketersediaan resource pada masa mendatang

Anda dapat melihat ketersediaan mendatang untuk VM GPU atau TPU di suatu region sebagai berikut:

  • Untuk VM GPU, hingga 60 hari sebelumnya

  • Untuk TPU, hingga 120 hari sebelumnya

Untuk melihat ketersediaan VM GPU atau TPU pada masa mendatang di suatu region, pilih salah satu opsi berikut:

Konsol

Anda dapat melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender. Untuk mengetahui informasi selengkapnya, lihat Membuat permintaan reservasi untuk VM GPU atau TPU dalam dokumen ini.

gcloud

Untuk melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region, gunakan salah satu perintah gcloud beta compute advice calendar-mode berikut. Berdasarkan resource yang ingin Anda lihat, sertakan tanda berikut:

  • Untuk melihat ketersediaan VM GPU, sertakan tanda --vm-count dan --machine-type:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Untuk melihat ketersediaan TPU, sertakan flag --chip-count dan --tpu-version:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Ganti kode berikut:

  • NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.

  • MACHINE_TYPE: jenis mesin GPU yang akan dipesan.

  • NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.

  • TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:

    • Untuk TPU v6e: V6E

    • Untuk TPU v5p: V5P

    • Untuk TPU v5e: V5E

    Jika Anda menentukan TPU v5e, Anda harus menyertakan flag --workload-type. Tetapkan flag ini ke jenis beban kerja yang ingin Anda jalankan di TPU:

    • Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.

    • Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.

  • REGION: region tempat VM GPU atau TPU dipesan. Untuk memeriksa region dan zona yang didukung, lihat Batasan dalam dokumen ini.

  • FROM_START_TIME dan TO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ganti kode berikut:

    • YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).

    • HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).

    • OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Jika tidak ingin menggunakan offset, tentukan Z.

  • FROM_END_TIME dan TO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti flag --end-time-range dengan flag --duration-range.

Outputnya mirip dengan hal berikut ini:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Jika resource yang Anda minta tersedia, output akan berisi kolom startTime, endTime, dan location. Kolom ini menentukan waktu mulai paling awal, waktu berakhir paling akhir, dan zona saat resource tersedia.

REST

Untuk melihat ketersediaan GPU VM atau TPU pada masa mendatang di suatu region, buat permintaan GET ke metode advice.calendarMode beta. Berdasarkan resource yang ingin Anda lihat, sertakan kolom berikut dalam isi permintaan:

  • Untuk melihat ketersediaan VM GPU, sertakan kolom instanceCount dan machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Untuk melihat ketersediaan TPU, sertakan kolom acceleratorCount dan vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Ganti kode berikut:

  • PROJECT_ID: ID project tempat Anda ingin memesan resource.

  • REGION: region tempat Anda ingin memesan VM GPU atau TPU. Untuk memeriksa region dan zona yang didukung, lihat Batasan dalam dokumen ini.

  • NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.

  • MACHINE_TYPE: jenis mesin GPU yang akan dipesan.

  • NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.

  • TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:

    • Untuk TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Untuk TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Untuk TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Jika Anda menentukan TPU v5e, maka di kolom aggregateResources, Anda harus menyertakan kolom workloadType. Tetapkan kolom ini ke jenis beban kerja yang ingin Anda jalankan di TPU:

    • Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.

    • Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.

  • FROM_START_TIME dan TO_START_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mencadangkan kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ganti kode berikut:

    • YYYY-MM-DD: tanggal yang diformat sebagai tahun empat digit, bulan dua digit, dan hari dua digit, yang dipisahkan oleh tanda hubung (-).

    • HH:MM:SS: waktu yang diformat sebagai jam dua digit menggunakan waktu 24 jam, menit dua digit, dan detik dua digit, yang dipisahkan oleh titik dua (:).

    • OFFSET: zona waktu yang diformat sebagai offset Waktu Universal Terkoordinasi (UTC). Misalnya, untuk menggunakan Waktu Standar Pasifik (PST), tentukan -08:00. Jika tidak ingin menggunakan offset, tentukan Z.

  • FROM_END_TIME dan TO_END_TIME: tanggal paling awal dan paling akhir yang Anda inginkan untuk mengakhiri reservasi kapasitas. Format tanggal ini sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan rentang durasi untuk periode pemesanan, bukan waktu berakhir, ganti kolom endTimeNotEarlierThan dan endTimeNotLaterThan dengan kolom minDuration dan maxDuration.

Outputnya mirip dengan hal berikut ini:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Jika resource yang Anda minta tersedia, output akan berisi kolom startTime, endTime, dan location. Kolom ini menentukan waktu mulai paling awal, waktu berakhir paling akhir, dan zona saat resource tersedia.

Membuat permintaan reservasi untuk VM GPU atau TPU

Saat membuat permintaan pemesanan untuk masa mendatang dalam mode kalender, Anda hanya dapat menentukan periode pemesanan sebagai berikut:

  • Waktu mulai: berdasarkan resource yang ingin Anda pesan, Anda harus menentukan waktu mulai yang setidaknya salah satu nilai berikut dari saat Anda membuat dan mengirimkan permintaan:

    • Untuk VM GPU, 87 jam (tiga hari dan 15 jam)

    • Untuk TPU, 24 jam

  • Waktu berakhir: Anda dapat memesan resource selama maksimum 90 hari.

Untuk membuat permintaan menggunakan VM GPU yang ada sebagai referensi, gunakan konsolGoogle Cloud . Jika tidak, pilih salah satu opsi berikut:

Konsol

  1. Di konsol Google Cloud , buka halaman Reservations.

    Buka Pemesanan

  2. Klik tab Future reservations.

  3. Klik Create future reservation. Halaman Create a future reservation akan muncul dan panel Hardware configuration akan dipilih.

  4. Di bagian Configuration, tentukan properti VM GPU atau TPU yang ingin Anda pesan dengan melakukan salah satu hal berikut:

    • Untuk menentukan properti VM GPU atau TPU secara langsung, selesaikan langkah-langkah berikut:

      1. Pilih Specify machine type.

      2. Klik tab GPU atau TPU, lalu pilih jenis mesin GPU atau versi TPU yang akan dicadangkan.

    • Untuk menentukan properti VM GPU menggunakan template instance yang ada, pilih Template instance, lalu pilih template.

    • Untuk menentukan properti VM GPU dengan menggunakan VM yang ada sebagai referensi, pilih Gunakan VM yang ada, lalu pilih VM.

  5. Jika Anda menentukan TPU v5e (CT5LP) pada langkah sebelumnya, pilih salah satu opsi berikut di daftar TPU v5 workload type:

    • Untuk menjalankan workload di TPU yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan ML, pilih Batch.

    • Untuk menjalankan beban kerja di TPU yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti beban kerja inferensi ML, pilih Penayangan.

  6. Di bagian Cari kapasitas, selesaikan langkah-langkah berikut:

    1. Dalam daftar Region dan Zone, tentukan region dan zona tempat Anda ingin memesan resource. Untuk meninjau region dan zona yang didukung, lihat Batasan dalam dokumen ini.

    2. Di kolom Total capacity needed (saat memesan VM GPU) atau daftar Number of chips (saat memesan TPU), tentukan jumlah VM GPU atau chip TPU yang akan dipesan.

    3. Dalam daftar Waktu mulai, pilih waktu mulai untuk permintaan Anda.

    4. Opsional: Di daftar Pilih fleksibilitas tanggal mulai Anda, pilih seberapa tepat tanggal mulai Anda.

    5. Di kolom Reservation duration, tentukan berapa lama Anda ingin memesan resource.

    6. Klik Telusuri kapasitas. Kemudian, di tabel Kapasitas yang tersedia, pilih salah satu opsi yang tersedia yang berisi jenis, jumlah, dan periode reservasi VM GPU atau TPU yang akan dipesan.

  7. Klik Berikutnya.

  8. Di bagian Jenis berbagi, pilih project untuk membagikan kapasitas yang diminta:

    • Untuk menggunakan kapasitas yang dicadangkan hanya dalam project Anda, pilih Lokal.

    • Untuk membagikan kapasitas yang dipesan dengan project lain, pilih Dibagikan, klik Tambahkan project, lalu ikuti perintah untuk memilih project.

  9. Klik Berikutnya.

  10. Di kolom Nama pemesanan mendatang, masukkan nama untuk permintaan.

  11. Di kolom Reservation name, masukkan nama pemesanan yang dibuat Compute Engine secara otomatis untuk menyediakan kapasitas yang Anda minta.

  12. Klik Buat.

gcloud

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, gunakan salah satu perintah gcloud beta compute future-reservations create berikut. Berdasarkan sumber daya yang ingin Anda cadangkan, sertakan tanda berikut:

  • Untuk memesan VM GPU, sertakan tanda --total-count dan --machine-type:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Untuk memesan TPU, sertakan flag --chip-count dan --tpu-version:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Ganti kode berikut:

  • FUTURE_RESERVATION_NAME: nama permintaan.

  • NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.

  • MACHINE_TYPE: jenis mesin GPU yang akan dipesan.

  • NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.

  • TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:

    • Untuk TPU v6e: V6E

    • Untuk TPU v5p: V5P

    • Untuk TPU v5e: V5E

    Jika Anda menentukan TPU v5e, Anda harus menyertakan flag --workload-type. Tetapkan flag ke jenis workload yang ingin Anda jalankan di TPU:

    • Untuk workload yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti workload pelatihan machine learning (ML), tentukan BATCH.

    • Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.

  • RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.

  • SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:

    • Untuk menggunakan kapasitas hanya dalam project Anda: local

    • Untuk membagikan kapasitas dengan project lain: projects

    Jika Anda menentukan projects, Anda harus menyertakan flag --share-with yang ditetapkan ke daftar project ID yang dipisahkan koma—misalnya, project-1,project-2. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan sertakan project ID Anda dalam daftar ini. Anda dapat menggunakan kapasitas yang dicadangkan secara default.

  • START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.

  • END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti flag --end-time dengan flag --duration.

  • ZONE: zona tempat Anda ingin memesan resource.

REST

Untuk membuat permintaan pemesanan untuk masa mendatang dalam mode kalender dan mengirimkannya untuk ditinjau, kirim permintaan POST berikut ke metode beta futureReservations.insert. Berdasarkan resource yang ingin Anda pesan, sertakan kolom berikut dalam isi permintaan:

  • Untuk memesan VM GPU, sertakan kolom totalCount dan machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Untuk memesan TPU, sertakan kolom acceleratorCount dan vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Ganti kode berikut:

  • PROJECT_ID: ID project tempat Anda ingin membuat permintaan.

  • ZONE: zona tempat Anda ingin memesan resource.

  • FUTURE_RESERVATION_NAME: nama permintaan.

  • RESERVATION_NAME: nama reservasi yang dibuat secara otomatis oleh Compute Engine untuk menyediakan kapasitas yang Anda minta.

  • SHARE_TYPE: apakah project lain dalam organisasi Anda dapat menggunakan kapasitas yang dipesan. Tentukan salah satu nilai berikut:

    • Untuk menggunakan kapasitas hanya dalam project Anda: LOCAL

    • Untuk membagikan kapasitas dengan project lain: SPECIFIC_PROJECTS

    Jika Anda menentukan SPECIFIC_PROJECTS, maka di kolom shareSettings, Anda harus menyertakan kolom projectMap untuk menentukan project yang akan berbagi kapasitas. Anda dapat menentukan hingga 100 project dalam organisasi Anda. Jangan tentukan project ID Anda. Anda dapat menggunakan kapasitas yang dicadangkan secara default.

    Misalnya, untuk membagikan kapasitas yang diminta ke dua project lain, sertakan yang berikut:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Ganti CONSUMER_PROJECT_ID_1 dan CONSUMER_PROJECT_ID_2 dengan ID dua project yang ingin Anda izinkan untuk menggunakan kapasitas yang diminta.

  • NUMBER_OF_VMS: jumlah VM GPU yang akan dipesan.

  • MACHINE_TYPE: jenis mesin GPU yang akan dipesan.

  • NUMBER_OF_CHIPS: jumlah chip TPU yang akan dipesan.

  • TPU_VERSION: versi TPU yang akan dipesan. Tentukan salah satu nilai berikut:

    • Untuk TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Untuk TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Untuk TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Jika Anda menentukan TPU v5e, maka di kolom aggregateResources, Anda harus menyertakan kolom workloadType. Tetapkan kolom ke jenis beban kerja yang ingin Anda jalankan di TPU:

    • Untuk beban kerja yang menangani data dalam jumlah besar dalam satu atau beberapa operasi, seperti beban kerja pelatihan ML, tentukan BATCH.

    • Untuk workload yang menangani permintaan serentak dan memerlukan latensi jaringan minimal, seperti workload inferensi ML, tentukan SERVING.

  • START_TIME: waktu mulai permintaan, diformat sebagai stempel waktu RFC 3339.

  • END_TIME: waktu berakhir periode pemesanan Anda, yang diformat sebagai stempel waktu RFC 3339. Jika Anda ingin menentukan durasi, dalam detik, untuk periode pemesanan, bukan waktu berakhir, maka ganti kolom endTime dengan kolom duration.

Langkah berikutnya