Google Cloud menggunakan kuota untuk membatasi jumlah resource bersama Google Cloud tertentu yang dapat Anda gunakan. Setiap kuota mewakili resource tertentu yang dapat dihitung, seperti panggilan API ke layanan tertentu, jumlah byte yang dikirim ke layanan tertentu, atau jumlah koneksi streaming yang digunakan secara bersamaan oleh project Anda.
Banyak layanan juga memiliki batasan yang tidak terkait dengan sistem kuota. Ini adalah batasan tetap, seperti ukuran pesan maksimum atau jumlah resource Pub/Sub yang dapat Anda buat dalam project, yang tidak dapat ditingkatkan atau diturunkan.
Melihat dan mengelola kuota
Untuk project tertentu, Anda dapat menggunakan dasbor kuota IAM & admin untuk melihat batas dan penggunaan kuota saat ini. Anda juga dapat menggunakan dasbor ini untuk melakukan hal berikut:
- Mengurangi batas kuota
- Mulai proses untuk mengajukan batas kuota yang lebih tinggi
Untuk mengetahui informasi selengkapnya tentang pemantauan dan pemberitahuan terkait penggunaan kuota, lihat Pemantauan.
Atribusi penggunaan kuota
Untuk throughput pelanggan push, penggunaan kuota ditagihkan ke project yang berisi langganan push. Project ini adalah project yang muncul dalam nama langganan.
Untuk semua kuota lainnya, penggunaan akan ditagihkan ke project yang terkait dengan kredensial yang ditentukan dalam permintaan. Penggunaan kuota tidak ditagihkan ke project yang berisi resource yang diminta.
Misalnya: Jika akun layanan di project A mengirim permintaan publikasi untuk memublikasikan ke topik di project B, kuota akan ditagih ke project A.
Dalam beberapa kasus, Anda mungkin ingin penggunaan kuota ditagih ke project lain. Anda dapat menggunakan parameter sistem X-Goog-User-Project
untuk
mengubah project untuk atribusi kuota. Untuk mengetahui informasi selengkapnya tentang X-Goog-User-Project
, lihat Parameter sistem.
Anda dapat menggunakan gcloud CLI untuk menetapkan project untuk atribusi kuota
untuk permintaan tertentu. gcloud CLI mengirim
header permintaan X-Goog-User-Project
.
Anda harus memiliki peran roles/serviceusage.serviceUsageConsumer
atau peran kustom dengan izin serviceusage.services.use
di project
yang akan Anda gunakan untuk atribusi kuota.
Contoh berikut menunjukkan cara mendapatkan daftar langganan dalam project RESOURCE_PROJECT sambil mengenakan biaya kuota operasi Administrator terhadap project QUOTA_PROJECT. Jalankan perintah berikut di terminal Google Cloud CLI Anda:
gcloud pubsub subscriptions list --project=
RESOURCE_PROJECT --billing-project=
QUOTA_PROJECT
Ganti QUOTA_PROJECT
dengan ID project Google Cloud yang ingin Anda kenai biaya kuotanya.
Perhatikan bahwa di Pub/Sub, project yang ditagih selalu merupakan project yang berisi resource. Anda hanya dapat mengubah project untuk atribusi kuota.
Kuota Pub/Sub
Kuota yang tercantum dalam tabel berikut dapat dilihat dan diedit berdasarkan per project di dasbor kuota API dan layanan.
Kuota regional dibagi menjadi 3 jenis:
- Wilayah besar:
europe-west1
,europe-west4
,us-central1
,us-east1
,us-east4
,us-west1
,us-west2
- Wilayah sedang:
asia-east1
,asia-northeast1
,asia-southeast1
,europe-west2
,europe-west3
- Wilayah kecil: semua wilayah lainnya
Kuota pengiriman tepat satu kali khusus untuk wilayah tertentu. Periksa detail untuk setiap wilayah dalam tabel berikut.
Kuota | Batas kuota default | Deskripsi |
---|---|---|
Throughput penayang per wilayah |
|
Penggunaan kuota didasarkan pada ukuran
Beberapa pesan dapat disertakan dalam satu
permintaan publikasi, dan tidak ada biaya kuota tambahan per pesan. Ukuran pesan, sebagaimana dihitung untuk
tujuan penggunaan kuota, juga mencakup kolom |
Throughput pelanggan pull per region |
|
Penggunaan kuota didasarkan pada ukuran
Ukuran pesan, sebagaimana dihitung untuk tujuan penggunaan kuota, juga mencakup kolom |
Throughput pengirim konfirmasi per region |
|
Penggunaan kuota didasarkan pada ukuran permintaan
|
Throughput langganan push per region |
|
Untuk permintaan penayangan push yang dibuat ke
endpoint push, penggunaan kuota didasarkan pada ukuran
|
Throughput langganan BigQuery per region |
|
Untuk permintaan yang dibuat ke BigQuery,
penggunaan kuota didasarkan pada ukuran |
Throughput langganan Cloud Storage per region |
|
Untuk permintaan yang dikirim ke Cloud Storage,
penggunaan kuota didasarkan pada ukuran |
Throughput pelanggan StreamingPull per region |
|
Penggunaan kuota didasarkan pada ukuran
Library Klien menggunakan operasi StreamingPull jika memungkinkan. |
Jumlah koneksi StreamingPull terbuka per region |
|
Jumlah koneksi StreamingPull terbuka pada waktu tertentu. Lihat StreamingPull. |
Operasi administrator | 6.000 per menit (100 operasi/dtk) |
Setiap operasi administrator, seperti GetTopicRequest, dikenai biaya satu unit berdasarkan kuota ini.
|
Jumlah pesan yang digunakan dari langganan dengan pengiriman sekali saja yang diaktifkan per region |
|
Penggunaan kuota didasarkan pada jumlah
|
Jumlah pesan yang dikonfirmasi atau yang batas waktunya diperpanjang saat menggunakan langganan dengan pengiriman tepat satu kali yang diaktifkan per region |
|
Penggunaan kuota didasarkan pada jumlah ID pengakuan dalam permintaan
|
Unit kuota throughput
Penggunaan kuota throughput diukur dalam unit 1 kB. 1 kB adalah 1000 byte. Misalnya, dalam PublishRequest
dengan 105 pesan yang masing-masing berukuran 50 byte, ukuran data pengguna adalah 105 * 50 bytes = 5250 bytes
, sehingga penggunaan kuota adalah max(1kB, ceil(5250 bytes/1000)) = 6kB
.
Batas resource
Resource | Batas |
---|---|
Project |
10.000 topik 10.000 langganan yang terlampir atau tidak terlampir 5.000 snapshot 10.000 skema |
Topik |
10.000 langganan terlampir 5.000 snapshot terlampir Jika retensi pesan topik dikonfigurasi, pesan yang dipublikasikan ke topik dapat dipertahankan dalam penyimpanan persisten hingga 31 hari sejak waktu publikasi. |
Langganan |
Secara default, mempertahankan pesan yang tidak terkonfirmasi
dalam penyimpanan persisten selama 7
hari sejak waktu publikasi. Tidak ada batasan pada
jumlah pesan yang dipertahankan. Jika pelanggan tidak menggunakan langganan, langganan tersebut akan berakhir. Periode habis masa berlaku default adalah 31 hari. |
Skema | Ukuran skema (kolom definition ): 300 KBRevisi per skema: 20 |
Permintaan publikasi |
10 MB (total ukuran) 1.000 pesan |
Pesan |
Ukuran pesan (kolom data ): 10 MBAtribut per pesan: 100 Ukuran kunci atribut: 256 byte Ukuran nilai atribut: 1024 byte |
StreamingPull streams | 10 MBps per streaming terbuka |
Respons Tarik Unary |
Jumlah maksimum pesan dalam respons Pull: 1000 Ukuran maksimum respons Pull: 10 MB |
Menarik/StreamingPull pesan | Layanan ini dapat menerapkan batas pada jumlah total pesan StreamingPull yang belum diproses per koneksi. Jika Anda mengalami batas tersebut, tingkatkan kecepatan Anda dalam mengonfirmasi pesan dan jumlah koneksi yang Anda gunakan. |
Mengonfirmasi dan mengubah permintaan batas waktu pengakuan |
512 KB (ukuran total) |
Mengurutkan kunci | Jika pesan memiliki kunci pengurutan, throughput maksimum penayang adalah 1 MBps untuk setiap kunci pengurutan. |
Objek bucket Cloud Storage | Saat menggunakan topik impor Cloud Storage, batas untuk jumlah objek dalam bucket adalah 50 juta. |
Menggunakan akun layanan untuk kuota yang lebih tinggi
Jika Anda menggunakan alat Google Cloud CLI dengan akun pengguna biasa (yaitu, akun non-layanan), operasi Pub/Sub dibatasi pada kecepatan yang sesuai untuk operasi manual. Kecepatan yang melebihi batas ini akan menyebabkan error RESOURCE_EXHAUSTED. Solusinya adalah memastikan bahwa Anda menggunakan kredensial akun layanan. Jika Anda ingin menggunakan kredensial dari gcloud CLI untuk otomatisasi, aktifkan akun layanan untuk operasi Pub/Sub Anda.
Menggunakan endpoint lokasi untuk merutekan permintaan
Jika memiliki kuota tambahan di wilayah tertentu, Anda dapat merutekan permintaan ke wilayah tersebut menggunakan endpoint Pub/Sub berbasis lokasi. Saat Anda memublikasikan pesan ke endpoint global, layanan Pub/Sub mungkin merutekan traffic ke region yang tidak memiliki kuota yang cukup.
Ketidakcocokan kuota
Ketidakcocokan kuota dapat terjadi saat pesan yang dipublikasikan atau diterima lebih kecil dari 1000 byte. Contoh:
Jika Anda memublikasikan 10 pesan berukuran 500 byte dalam permintaan terpisah, penggunaan kuota penayang Anda adalah 10.000 byte. Hal ini karena pesan yang berukuran kurang dari 1.000 byte akan otomatis dibulatkan ke atas ke peningkatan 1.000 byte berikutnya.
Jika Anda menerima 10 pesan tersebut dalam satu respons pull, penggunaan kuota pelanggan Anda mungkin hanya 5 kB, karena ukuran sebenarnya setiap pesan digabungkan untuk menentukan kuota keseluruhan.
Hal sebaliknya juga berlaku. Penggunaan kuota pelanggan mungkin lebih besar daripada penggunaan kuota penayang jika Anda memublikasikan beberapa pesan dalam satu permintaan publikasi atau menerima pesan dalam permintaan Pull terpisah.