Halaman ini diterjemahkan oleh Cloud Translation API.

Opsi penggunaan Cloud TPU

Dokumen ini memberikan deskripsi opsi penggunaan yang didukung untuk Cloud TPU. Opsi pemakaian adalah metode yang digunakan untuk meminta kapasitas. Saat memilih opsi penggunaan, pertimbangkan faktor-faktor berikut:

Seberapa cepat Anda memerlukan kapasitas
Berapa lama Anda membutuhkan kapasitas tersebut
Apakah Anda memerlukan kapasitas untuk jangka waktu tetap atau fleksibel
Apakah kapasitas Anda dapat didahului
Harga

Jika Anda menggunakan Cloud TPU API, untuk setiap metode penggunaan, Anda memerlukan kuota sesuai permintaan atau kuota yang dapat diakhiri untuk jumlah core Cloud TPU yang ingin Anda gunakan. Ada kuota default on-demand dan preemptible yang berbeda untuk setiap versi TPU. Untuk mengetahui informasi selengkapnya, lihat kuota Cloud TPU.

Jika Anda menggunakan TPU dengan Google Kubernetes Engine (GKE), Anda menggunakan kuota Compute Engine API, yang merupakan kuota yang berbeda. Untuk mengetahui informasi selengkapnya tentang kuota yang Anda gunakan untuk TPU di GKE, lihat Pastikan Anda memiliki kuota TPU.

Opsi konsumsi	Cara kerjanya	Paling baik digunakan untuk	Versi dan zona TPU yang didukung	Jenis kuota untuk Cloud TPU API
Pemesanan untuk masa mendatang selama satu tahun atau lebih	Anda meminta resource TPU di muka selama satu tahun atau lebih. Resource ini dicadangkan untuk penggunaan eksklusif Anda selama jangka waktu tersebut. Reservasi memberikan tingkat jaminan tertinggi untuk kapasitas dan hemat biaya, dengan harga yang lebih rendah daripada resource on-demand. Pemesanan TPU untuk masa mendatang memiliki diskon abonemen (CUD) yang dilampirkan. CUD memberikan harga diskon sebagai imbalan atas pembelian kontrak abonemen. Untuk mengetahui informasi selengkapnya, lihat Meminta pemesanan untuk masa mendatang selama satu tahun atau lebih.	Reservasi mendatang selama satu tahun atau lebih ideal untuk tugas pelatihan yang berjalan lama dan workload inferensi.	Semua versi TPU: Lihat Region dan zona TPU	Kuota sesuai permintaan
Pemesanan mendatang hingga 90 hari (dalam mode kalender) (Pratinjau)	Anda meminta resource TPU untuk waktu mulai dan durasi tertentu, antara 1 dan 90 hari. Resource ini dicadangkan untuk penggunaan eksklusif Anda selama jangka waktu tersebut. Reservasi memberikan tingkat jaminan tertinggi untuk kapasitas dan hemat biaya, dengan harga yang lebih rendah daripada resource on-demand. Untuk mengetahui informasi selengkapnya, lihat Meminta pemesanan untuk masa mendatang hingga 90 hari dalam mode kalender.	Reservasi mendatang dalam mode kalender cocok untuk workload pelatihan dan eksperimen yang memerlukan waktu mulai yang tepat dan memiliki durasi yang ditentukan.	v6e (Trillium) untuk pelatihan dan penayangan: asia-northeast1-b, us-east5-a v5p untuk pelatihan dan penayangan: us-east5-a v5e untuk pelatihan: us-west4-a v5e untuk penayangan: us-central1-a	Tidak memerlukan kuota
On demand	Anda meminta resource TPU untuk digunakan sesegera mungkin, selama yang Anda inginkan. Sesuai permintaan menawarkan fleksibilitas tertinggi. Resource sesuai permintaan tidak akan dihentikan, tetapi tidak ada jaminan bahwa akan ada cukup resource TPU yang tersedia untuk memenuhi permintaan Anda. On demand adalah default saat Anda membuat resource TPU. Untuk mengetahui informasi selengkapnya tentang cara membuat dan menggunakan TPU on-demand, lihat Mengelola resource TPU.	Sesuai permintaan cocok untuk tugas mendesak dan workload yang memerlukan waktu berakhir yang fleksibel.	Semua versi TPU: Lihat Region dan zona TPU	Kuota sesuai permintaan
Flex-start (Pratinjau)	Anda meminta resource TPU untuk jangka waktu tertentu, hingga 7 hari, tanpa perlu memesan kapasitas terlebih dahulu. VM TPU Flex-start dikirimkan dari kumpulan kapasitas khusus, sehingga ketersediaan resource ini lebih tinggi daripada on-demand. Untuk mengetahui informasi selengkapnya tentang cara menggunakan VM TPU dengan fitur mulai fleksibel, lihat Meminta VM TPU dengan fitur mulai fleksibel. Untuk mengetahui informasi selengkapnya tentang cara menggunakan VM dengan fitur mulai fleksibel TPU dengan Google Kubernetes Engine (GKE), lihat Tentang penyediaan GPU dan TPU dengan mode penyediaan mulai fleksibel.	Mulai fleksibel ideal untuk eksperimen, pengujian skala kecil, penyediaan dinamis TPU untuk workload inferensi, penyesuaian model, dan menjalankan workload yang membutuhkan waktu kurang dari 7 hari.	v6e (Trillium): asia-northeast1-b, us-east5-a v5p: us-east5-a v5e: us-west4-a	Kuota yang dapat di-preempt
Spot	Anda meminta resource TPU yang dapat di-preempt. Spot VM tersedia dengan harga yang jauh lebih rendah daripada resource on-demand. Spot VM mungkin lebih mudah didapatkan daripada resource on-demand, tetapi dapat di-preempt (dimatikan) kapan saja. Tidak ada batasan durasi runtime. Untuk mengetahui informasi selengkapnya tentang TPU Spot VM, lihat Mengelola TPU Spot VM.	Spot cocok untuk menjadwalkan beban kerja dengan prioritas lebih rendah seperti pra-pelatihan model, penyesuaian model, dan tugas simulasi yang toleran terhadap gangguan ketersediaan.	Semua versi TPU: Lihat Region dan zona TPU	Kuota yang dapat di-preempt

Langkah berikutnya

Mulai menggunakan TPU dengan: