Kuota Cloud TPU
Dokumen ini mencantumkan kuota yang berlaku untuk Cloud TPU. Untuk mengetahui informasi tentang harga Cloud TPU, lihat Harga Cloud TPU.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian Google Cloud produk dan layanan oleh Anda
- Membatasi pemakaian resource tersebut
- Memberikan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di Google Cloud level project. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan di semua aplikasi dan alamat IP.
Kuota TPU
Kuota TPU adalah batas jumlah core Cloud TPU yang dapat Anda gunakan dengan projectGoogle Cloud . Setiap versi TPU dikaitkan dengan kuotanya sendiri. Selain itu, setiap kuota versi Cloud TPU dibagi menjadi kuota on-demand dan kuota preemptible (atau spot).
Saat membuat resource Cloud TPU, secara default Anda membuat resource on-demand. Anda dapat membuat resource yang dapat di-preempt menggunakan parameter --spot
saat membuat resource dengan perintah gcloud
. Untuk mengetahui informasi selengkapnya, lihat
Mengelola resource TPU.
Kuota Cloud TPU default
Tabel berikut menunjukkan nilai default untuk kuota on-demand dan preemptible untuk setiap zona yang tersedia. Nilai ini menentukan jumlah maksimum core TPU yang dapat Anda gunakan dalam project.
Kuota preemptible
Versi TPU | Kuota default (jumlah core) | Nama kuota |
---|---|---|
v6e | 1.536 core | Core TPU v6e yang dapat diakhiri per project per zona |
v5p | 768 core | Core TPU v5p yang dapat diakhiri per project per zona |
v5e | 1.536 core | Core pod TPU v5 lite yang dapat dihentikan per project per zona |
v4 | 0 core | Core pod TPU v4 yang dapat diakhiri per project per zona |
Pod v3 | 32 core | Core pod TPU v3 yang dapat diakhiri per project per zona |
v3 | 120 core | Core TPU v3 yang dapat diakhiri per project per zona |
Pod v2 | 32 core | Core pod TPU v2 yang dapat diakhiri per project per zona |
v2 | 120 core | Core TPU v2 yang dapat diakhiri per project per zona |
Kuota on-demand
Versi TPU | Kuota default (jumlah core) | Nama kuota |
---|---|---|
v6e | 512 core | Core TPU v6e per project per zona |
v5p | 128 core | Core TPU v5p per project per zona |
v5e | 512 core | Core pod TPU v5 lite per project per zone |
v4 | 0 core | Core pod TPU v4 per project per zona |
Pod v3 | 32 core | Core pod TPU v3 per project per zona |
v3 | 40 core | Core TPU v3 per project per zone |
Pod v2 | 32 core | Core pod TPU v2 per project per zona |
v2 | 40 core | Core TPU v2 per project per zone |
Melihat dan meminta kuota tambahan
Anda dapat melihat kuota yang dialokasikan untuk Google Cloud project di halaman Kuota di Google Cloud konsol.
Anda dapat meminta kuota Cloud TPU tambahan dari halaman Kuota. Temukan kuota yang ingin ditambah, klik tiga titik vertikal, lalu pilih Edit kuota. Untuk mengetahui informasi selengkapnya, lihat Meminta batas kuota yang lebih tinggi. Jika Anda meminta kuota di bawah nilai minimum persetujuan otomatis, permintaan Anda akan disetujui secara otomatis.
Kuota preemptible
Versi TPU | Nilai minimum persetujuan otomatis | Nama kuota |
---|---|---|
v6e | Semua zona: 0 core | Core TPU v6e yang dapat diakhiri per project per zona |
v5p | Semua zona: 0 core | Core TPU v5p yang dapat diakhiri per project per zona |
v5e |
|
Core pod TPU v5 lite yang dapat dihentikan per project per zona |
v4 | Semua zona: 0 core | Core pod TPU v4 yang dapat diakhiri per project per zona |
Pod v3 |
|
Core pod TPU v3 yang dapat diakhiri per project per zona |
v3 |
|
Core TPU v3 yang dapat diakhiri per project per zona |
Pod v2 |
|
Core pod TPU v2 yang dapat diakhiri per project per zona |
v2 |
|
Core TPU v2 yang dapat diakhiri per project per zona |
Kuota on-demand
Versi TPU | Nilai minimum persetujuan otomatis | Nama kuota |
---|---|---|
v6e | Semua zona: 0 core | Core TPU v6e per project per zona |
v5p | us-east5-a: 64 core | Core TPU v5p per project per zona |
v5e | Semua zona: 64 core | Core pod TPU v5 lite per project per zone |
v4 | Semua zona: 0 core | Core pod TPU v4 per project per zona |
Pod v3 |
|
Core pod TPU v3 per project per zona |
v3 |
|
Core TPU v3 per project per zone |
Pod v2 |
|
Core pod TPU v2 per project per zona |
v2 |
|
Core TPU v2 per project per zone |
Anda akan menerima email yang menyatakan apakah permintaan kuota Anda disetujui atau ditolak. Google Cloud Penambahan kuota layanan dilakukan secara bertahap. Hal ini dapat mengakibatkan peluncuran yang sedang berlangsung di berbagai region atau resource. Selama peluncuran, nilai kuota yang muncul di konsol Google Cloud atau Cloud Quotas API tidak akan mencerminkan nilai kuota baru yang ditingkatkan hingga peluncuran selesai. Untuk mengetahui informasi selengkapnya, lihat Melihat peluncuran yang sedang berlangsung.