Opsi penggunaan Cloud TPU

Dokumen ini memberikan deskripsi opsi penggunaan yang didukung untuk Cloud TPU. Opsi pemakaian adalah metode yang digunakan untuk meminta kapasitas. Saat memilih opsi penggunaan, pertimbangkan faktor-faktor berikut:

  • Seberapa cepat Anda memerlukan kapasitas
  • Berapa lama Anda membutuhkan kapasitas tersebut
  • Apakah Anda memerlukan kapasitas untuk jangka waktu tetap atau fleksibel
  • Apakah kapasitas Anda dapat didahului
  • Harga

Jika Anda menggunakan Cloud TPU API, untuk setiap metode penggunaan, Anda memerlukan kuota sesuai permintaan atau kuota yang dapat diakhiri untuk jumlah core Cloud TPU yang ingin Anda gunakan. Ada kuota default on-demand dan preemptible yang berbeda untuk setiap versi TPU. Untuk mengetahui informasi selengkapnya, lihat kuota Cloud TPU.

Jika Anda menggunakan TPU dengan Google Kubernetes Engine (GKE), Anda menggunakan kuota Compute Engine API, yang merupakan kuota yang berbeda. Untuk mengetahui informasi selengkapnya tentang kuota yang Anda gunakan untuk TPU di GKE, lihat Pastikan Anda memiliki kuota TPU.

Opsi konsumsi Cara kerjanya Paling baik digunakan untuk Versi dan zona TPU yang didukung Jenis kuota untuk Cloud TPU API
Reservasi jangka panjang

Anda meminta resource TPU di muka selama satu tahun atau lebih. Resource ini dicadangkan untuk penggunaan eksklusif Anda selama jangka waktu tersebut.

Reservasi memberikan tingkat jaminan tertinggi untuk kapasitas dan hemat biaya, dengan harga yang lebih rendah daripada resource on-demand.

Pemesanan TPU jangka panjang memiliki diskon abonemen (CUD) yang dilampirkan. CUD memberikan harga diskon sebagai imbalan atas pembelian kontrak abonemen. Untuk mengetahui informasi selengkapnya, lihat Meminta reservasi jangka panjang.

Reservasi jangka panjang ideal untuk tugas pelatihan yang berjalan lama dan beban kerja inferensi. Semua versi TPU: Lihat Region dan zona TPU Kuota sesuai permintaan
Reservasi jangka pendek (reservasi mendatang dalam mode kalender) (Pratinjau)

Anda meminta resource TPU untuk waktu mulai dan durasi tertentu, antara 1 dan 90 hari. Resource ini dicadangkan untuk penggunaan eksklusif Anda selama jangka waktu tersebut.

Reservasi memberikan tingkat jaminan tertinggi untuk kapasitas dan hemat biaya, dengan harga yang lebih rendah daripada resource on-demand.

Untuk mengetahui informasi selengkapnya, lihat Meminta reservasi jangka pendek menggunakan mode kalender.

Reservasi jangka pendek cocok untuk beban kerja pelatihan dan eksperimen yang memerlukan waktu mulai yang tepat dan memiliki durasi yang ditentukan.

v6e (Trillium) untuk pelatihan dan penayangan: asia-northeast1-b, us-east5-a

v5p untuk pelatihan dan penayangan: us-east5-a

v5e untuk pelatihan: us-west4-a

v5e untuk penayangan: us-central1-a

Tidak memerlukan kuota
On demand

Anda meminta resource TPU untuk digunakan sesegera mungkin, selama yang Anda inginkan.

Sesuai permintaan menawarkan fleksibilitas tertinggi. Resource sesuai permintaan tidak akan dihentikan, tetapi tidak ada jaminan bahwa akan ada cukup resource TPU yang tersedia untuk memenuhi permintaan Anda. On-demand adalah default saat Anda membuat resource TPU. Untuk mengetahui informasi selengkapnya tentang cara membuat dan menggunakan TPU on-demand, lihat Mengelola resource TPU.

Sesuai permintaan cocok untuk tugas mendesak dan workload yang memerlukan waktu berakhir yang fleksibel. Semua versi TPU: Lihat Region dan zona TPU Kuota sesuai permintaan
Flex-start (Pratinjau)

Anda meminta resource TPU untuk jangka waktu tertentu, hingga 7 hari, tanpa perlu memesan kapasitas terlebih dahulu.

Resource mulai fleksibel dikirimkan dari kumpulan kapasitas khusus, sehingga ketersediaan resource ini lebih tinggi daripada resource sesuai permintaan. Untuk mengetahui informasi selengkapnya tentang penggunaan Mulai fleksibel dengan TPU, lihat Meminta Cloud TPU menggunakan Mulai fleksibel.

Untuk mengetahui informasi selengkapnya tentang cara menggunakan Mulai Fleksibel dengan Google Kubernetes Engine (GKE), lihat Tentang penyediaan GPU dan TPU dengan mode penyediaan mulai fleksibel.

Mulai fleksibel ideal untuk eksperimen, pengujian skala kecil, penyediaan dinamis TPU untuk workload inferensi, penyesuaian model, dan menjalankan workload yang membutuhkan waktu kurang dari 7 hari.

v6e (Trillium): asia-northeast1-b, us-east5-a

v5p: us-east5-a

v5e: us-west4-a

Kuota yang dapat di-preempt
Spot

Anda meminta resource TPU yang dapat di-preempt.

Spot VM tersedia dengan harga yang jauh lebih rendah daripada resource on-demand. Spot VM mungkin lebih mudah didapatkan daripada resource on-demand, tetapi dapat di-preempt (dimatikan) kapan saja. Tidak ada batasan durasi runtime. Untuk mengetahui informasi selengkapnya tentang TPU Spot VM, lihat Mengelola TPU Spot VM.

Spot cocok untuk menjadwalkan beban kerja dengan prioritas lebih rendah seperti pra-pelatihan model, penyesuaian model, dan tugas simulasi yang toleran terhadap gangguan ketersediaan. Semua versi TPU: Lihat Region dan zona TPU Kuota yang dapat di-preempt

Langkah berikutnya

Mulai menggunakan TPU dengan: