Kuota
Dokumen ini mencantumkan kuota yang berlaku untuk Cloud TPU. Untuk mengetahui informasi tentang harga Cloud TPU, lihat Harga Cloud TPU.
Kuota membatasi jumlah resource Google Cloud bersama yang dapat digunakan project Google Cloud Anda, termasuk komponen hardware, software, dan jaringan. Oleh karena itu, kuota adalah bagian dari sistem yang melakukan hal berikut:
- Memantau penggunaan atau pemakaian produk dan layanan Google Cloud oleh Anda.
- Membatasi Anda konsumsi resource tersebut, karena alasan yang mencakup memastikan keadilan dan mengurangi lonjakan penggunaan.
- Mempertahankan konfigurasi yang secara otomatis menerapkan pembatasan yang telah ditentukan.
- Menyediakan sarana untuk meminta atau membuat perubahan pada kuota.
Pada umumnya, jika kuota terlampaui, sistem akan langsung memblokir akses ke resource Google yang relevan, dan tugas yang Anda coba lakukan akan gagal. Pada umumnya, kuota berlaku untuk setiap project Google Cloud serta digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project Google Cloud tersebut.
Jenis kuota
Jika Anda menggunakan GKE, lihat Pastikan kuota yang memadai untuk mengetahui informasi lebih lanjut tentang kuota GKE. Jika Anda memiliki kuota Cloud TPU API, ada kuota terpisah untuk resource Cloud TPU yang dipesan, sesuai permintaan, dan yang dapat dihentikan. Tabel berikut membandingkan setiap jenis kuota.
Jenis kuota | Deskripsi | Nilai default | Cara meminta | Tanda untuk pembuatan TPU |
---|---|---|---|---|
Dipesan | Jumlah resource Cloud TPU yang aksesnya Anda miliki. Anda harus memiliki perjanjian reservasi untuk mengakses resource yang dicadangkan. Resource yang dicadangkan terlindungi dari kehabisan stok tetapi dapat terganggu. | 0 | Untuk meminta kuota yang dicadangkan, hubungi perwakilan akun Google Cloud Anda. |
Gunakan flag
--reserved .
|
Sesuai permintaan | Jumlah resource on-demand yang dapat Anda akses. Resource on-demand tidak akan di-preempt, tetapi kuota on demand tidak menjamin akan ada cukup resource Cloud TPU untuk memenuhi permintaan Anda. |
v3-8 dan v2-8: 16 TensorCores Lainnya: 0 |
Lihat bagian Meminta kuota tambahan. | Tanda tidak diperlukan, dipilih secara default. |
Preemptible | Jumlah resource Cloud TPU yang dapat dihentikan dan dapat Anda akses. Resource yang dapat dihentikan mungkin di-preempt untuk memberi ruang bagi tugas dengan prioritas yang lebih tinggi. Kuota yang dapat dihentikan tidak menjamin bahwa akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. Untuk mengetahui informasi selengkapnya, lihat TPU yang dapat dihentikan. |
v3-8 dan v2-8: 48 TensorCores Lainnya: 0 |
Lihat bagian Meminta kuota tambahan. |
Gunakan flag
--preemptible atau flag
--best-effort untuk permintaan
resource dalam antrean. |
Alokasi kuota
Kuota Cloud TPU diberikan secara berbeda berdasarkan versi TPU yang Anda gunakan.
TPU v4 dan v5p
Untuk TPU v4 dan v5p, kuota dapat ditentukan dalam hal chip TPU atau TensorCore. Anda dapat menggunakan kuota dalam kombinasi bagian apa pun. Misalnya, jika memiliki kuota untuk slice v4-32, Anda dapat menggunakan kuota ini untuk membuat empat slice v4-8.
TPU v5e (pelatihan dan inferensi)
v5e mendukung pelatihan dan inferensi. Slice v5e yang digunakan untuk inferensi mencakup TPU dengan jenis akselerator v5litepod-1
, v5litepod-4
, atau v5litepod-8
.
Anda memerlukan kuota tpu-v5s-litepod-serving
untuk Cloud TPU on-demand, tpu-v5s-litepod-serving-preemptible
untuk Cloud TPU yang dapat dihentikan, dan tpu-v5s-litepod-serving-reserved
untuk Cloud TPU yang dipesan.
TPU v2 dan v3
Kuota TPU v2 dan v3 ditentukan dalam kaitannya dengan TensorCore. Satu perangkat TPU berisi empat chip TPU dan delapan TensorCore (dua TensorCore per chip). TPU v2 dan v3 memiliki kuota terpisah untuk satu perangkat TPU dan Pod TPU. Anda tidak dapat menggunakan kuota Pod TPU v2 atau v3 untuk TPU v2-8 atau v3-8. Misalnya, jika memiliki kuota untuk slice v3-32, Anda tidak dapat menggunakannya untuk membuat empat TPU v3-8.
Untuk mengetahui informasi selengkapnya tentang chip TPU dan TensorCore, lihat arsitektur Sistem TPU.
Melihat dan meminta kuota tambahan
Anda dapat melihat kuota yang dialokasikan untuk project Google Cloud di halaman Kuota di Google Cloud Console. Jika memerlukan kuota Cloud TPU tambahan, Anda dapat memintanya dari halaman Kuota. Untuk mengetahui informasi selengkapnya, lihat Meminta batas kuota yang lebih tinggi.