Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Kuota
Dokumen ini menjelaskan batas kuota untuk fungsi Cloud Run.
Kuota untuk Cloud Run Functions mencakup 4 area:
Batas Resource
Batas ini memengaruhi jumlah total resource yang dapat digunakan oleh fungsi Anda.
Batas Waktu
Batas ini memengaruhi berapa lama operasi bisa berjalan.
Batas Kapasitas
Batas ini memengaruhi tingkat panggilan ke Cloud Run Functions API
untuk mengelola fungsi Anda.
Batas Jaringan
Batas ini memengaruhi batas instance dan koneksi keluar.
Jenis-jenis batas tersebut dijelaskan secara lebih mendetail di bawah ini.
Perbedaan antara batas untuk fungsi Cloud Run (generasi ke-1) dan fungsi Cloud Run (generasi ke-2) dinyatakan, jika ada.
Batas Resource
Batas resource memengaruhi jumlah total resource yang dapat digunakan oleh fungsi Anda.
Cakupan regional bersifat per project, dan setiap project memiliki batasnya sendiri.
Kuota
Deskripsi
Batas (generasi ke-1)
Batas (generasi ke-2)
Bisa ditingkatkan
Cakupan
Jumlah fungsi
Jumlah total fungsi yang dapat di-deploy per region
1.000
1.000 dikurangi jumlah layanan Cloud Run yang di-deploy
Tidak
per region
Ukuran deployment maksimum
Ukuran maksimum deployment fungsi tunggal
100 MB (terkompresi) untuk sumber. 500 MB (tidak terkompresi) untuk sumber dan modul.
T/A
Tidak
per fungsi
Ukuran permintaan HTTP maksimal yang tidak dikompresi
Data yang dikirim ke fungsi HTTP dalam permintaan HTTP
10 MB
32 MB
Tidak
per pemanggilan
Ukuran respons HTTP maksimal yang tidak dikompresi
Data yang dikirim dari fungsi HTTP dalam respons HTTP
10 MB
10 MB untuk respons streaming.
32 MB untuk respons non-streaming.
Tidak
per pemanggilan
Ukuran peristiwa maksimum untuk fungsi yang dipicu oleh peristiwa
Data yang dikirim dalam peristiwa ke fungsi latar belakang
10 MB
512 KB untuk peristiwa Eventarc.
10 MB untuk peristiwa lama.
Tidak
per peristiwa
Memori fungsi maks
Jumlah memori yang dapat digunakan oleh setiap instance fungsi
8 GiB
32 GiB
Tidak
per fungsi
Memori project maksimum
Jumlah memori, dalam By, yang dapat digunakan oleh project. Metrik ini diukur dengan jumlah total memori yang diminta pengguna di seluruh instance fungsi selama periode 1 menit.
Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka.
T/A
Ya
per project dan region
CPU project maksimum
Jumlah CPU, dalam milli vCPU, yang dapat digunakan project. Metrik ini diukur dengan jumlah total CPU yang diminta pengguna di seluruh instance fungsi selama periode 1 menit.
Bergantung pada region yang dipilih. Batas ini mungkin lebih besar di region dengan kapasitas tinggi atau lebih rendah di region yang baru dibuka.
T/A
Ya
per project dan region
Batas Waktu
Kuota
Deskripsi
Batas (generasi ke-1)
Batas (generasi ke-2)
Bisa ditingkatkan
Cakupan
Durasi fungsi maksimum
Durasi maksimum sebuah fungsi dapat dijalankan sebelum diakhiri secara paksa
540 detik
60 menit untuk fungsi HTTP.
9 menit untuk fungsi yang dipicu oleh peristiwa.
Tidak
per pemanggilan
Batas Kapasitas
Kuota
Deskripsi
Batas (generasi ke-1)
Batas (generasi ke-2)
Bisa ditingkatkan
Cakupan
Panggilan API (BACA)
Panggilan untuk mendeskripsikan atau membuat daftar fungsi melalui Cloud Run Functions API
5.000 per 100 detik
1.200 per 60 detik
Hanya untuk generasi ke-1
per project (generasi ke-1)
per region (generasi ke-2)
Panggilan API (TULIS)
Panggilan untuk men-deploy atau menghapus fungsi melalui Cloud Run Functions API
Untuk mengetahui informasi tentang permintaan jaringan dan batas bandwidth fungsi Cloud Run (generasi ke-2), lihat Batas jaringan.
Batas jaringan berikut berlaku untuk fungsi Cloud Run (generasi ke-1):
Koneksi keluar per detik per instance: 500 (tidak dapat ditingkatkan)
Resolusi DNS keluar per detik per instance: 100 (tidak dapat ditingkatkan)
Paket maksimum per detik per instance: 80.000
Bit maksimum per detik per instance: 100.000.000
Skalabilitas
Fungsi Cloud Run yang dipanggil oleh HTTP akan mengalami peningkatan skala dengan cepat untuk menangani traffic yang masuk, sedangkan fungsi latar belakang akan menyesuaikan skala secara bertahap. Kemampuan suatu fungsi untuk meningkatkan skala ditentukan oleh beberapa faktor, termasuk di antaranya:
Jumlah waktu yang diperlukan agar eksekusi fungsi dapat diselesaikan (fungsi jangka pendek umumnya dapat ditingkatkan skalanya untuk menangani permintaan serentak lainnya).
Jumlah waktu yang diperlukan agar fungsi dimulai saat melakukan cold start.
Tingkat error fungsi Anda.
Faktor transien, seperti beban regional dan kapasitas pusat data.
Fungsi latar belakang memiliki batas
tambahan, seperti yang dijelaskan di bawah ini. Batas ini tidak berlaku untuk fungsi HTTP
generasi ke-1. Batas
instance maksimum default untuk fungsi HTTP
generasi ke-2 adalah 100 dan dapat ditingkatkan menjadi 1.000. Tidak ada batas instance
maksimum default untuk fungsi HTTP generasi ke-1.
Untuk menghindari peristiwa penskalaan tak terbatas dengan fungsi HTTP generasi ke-1, sebaiknya
tetapkan batas,
misalnya, 3000.
Kuota tambahan untuk fungsi latar belakang
Kuota
Deskripsi
Batas
Bisa ditingkatkan
Cakupan
Versi produk
Pemanggilan serentak maks.
Pemanggilan serentak maksimum suatu fungsi tunggal Contoh: jika penanganan setiap peristiwa membutuhkan waktu 100 detik, tingkat pemanggilan akan dibatasi ke 30 per detik secara rata-rata
3.000
Ya
per fungsi
Hanya generasi ke-1
Tingkat pemanggilan maks.
Tingkat maksimum peristiwa yang ditangani oleh suatu fungsi tunggal Contoh: jika penanganan suatu peristiwa membutuhkan waktu 100 mdtk, tingkat pemanggilan akan dibatasi ke 1.000 per detik sekalipun secara rata-rata hanya ada 100 permintaan yang ditangani secara paralel
1.000 per detik
Tidak
per fungsi
Hanya generasi ke-1
Ukuran data peristiwa serentak maks.
Ukuran total maksimum peristiwa masuk ke pemanggilan serentak suatu fungsi tunggal Contoh: jika peristiwa berukuran 1 MB dan pemrosesannya membutuhkan waktu 10 detik, maka tingkat rata-ratanya adalah 1 peristiwa per detik, karena peristiwa ke-11 tidak akan diproses hingga pemrosesan salah satu dari 10 peristiwa pertama berhasil
10 MB
Tidak
per fungsi
generasi ke-1 dan generasi ke-2
Throughput peristiwa masuk maks.
Throughput maksimum peristiwa masuk ke fungsi tunggal Contoh: jika peristiwa berukuran 1 MB, maka tingkat pemanggilan maksimumnya adalah 10 per detik, meskipun fungsi selesai dalam 100 mdtk
10 MB per detik
Tidak
per fungsi
generasi ke-1 dan generasi ke-2
Jika batas kuota tercapai
Jika sebuah fungsi menghabiskan semua resource yang dialokasikan, resource tersebut tidak akan tersedia lagi sampai kuotanya dimuat ulang atau ditingkatkan. Hal ini dapat berarti bahwa fungsi Anda dan semua fungsi lain dalam project yang sama tidak akan berjalan hingga waktu tersebut.
Fungsi akan menampilkan kode error HTTP 500 ketika salah satu resource melebihi kuota dan fungsi tidak dapat berjalan.
Untuk meningkatkan kuota di atas batas default yang tercantum di sini, buka
Halaman Kuota fungsi Cloud Run, pilih kuota yang ingin diubah, klik
Edit quotas, masukkan informasi pengguna jika diminta, lalu masukkan batas kuota baru untuk setiap kuota yang Anda pilih.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-19 UTC."],[[["\u003cp\u003eCloud Run functions have various quota limits spanning resource, time, rate, and networking categories, which define the operational boundaries for these functions.\u003c/p\u003e\n"],["\u003cp\u003eResource limits, such as the number of functions, deployment size, memory, and CPU, constrain the total resources a project's functions can use, with some differences between 1st and 2nd generation functions.\u003c/p\u003e\n"],["\u003cp\u003eTime limits, such as the maximum function duration, dictate how long a function can run before being forcibly terminated, with different limits for HTTP and event-driven functions in 2nd generation.\u003c/p\u003e\n"],["\u003cp\u003eRate limits regulate the frequency of API calls for managing Cloud Run functions, with different limits for read, write, and call operations, and while write and call API quotas cannot be increased, it is possible for 1st gen to increase the READ quota.\u003c/p\u003e\n"],["\u003cp\u003eNetworking limits, including outbound connections, DNS resolutions, and data transfer rates, set the parameters for how Cloud Run functions can interact with external networks, and they vary between 1st and 2nd generation functions.\u003c/p\u003e\n"]]],[],null,["# Quotas\n======\n\nThis document describes the quota limits for Cloud Run functions.\n| To increase quotas above the defaults listed here, go to the [Cloud Run functions Quotas Page](https://console.cloud.google.com/iam-admin/quotas?service=cloudfunctions.googleapis.com&usage=ALL&project=_), select the quotas you want to modify, click **Edit quotas**, supply your user information if prompted, and enter the new quota limit for each quota you selected.\n\nQuotas for Cloud Run functions encompass 4 areas:\n\n- Resource Limits\n\n These affect the total amount of resources your functions can consume.\n- Time Limits\n\n These affect how long things can run.\n- Rate Limits\n\n These affect the rate at which you can call the Cloud Run functions API\n to manage your functions.\n- Networking Limits\n\n These affect outbound connection and instance limits.\n\nThe different types of limits are described in more detail below.\nDifferences between limits for Cloud Run functions (1st gen) and\nCloud Run functions (2nd gen) are noted where applicable.\n\nResource Limits\n---------------\n\nResource limits affect the total amount of resources your functions can consume.\nThe regional scope is per project, and each project maintains its own limits.\n\n| **Note:** If you are triggering a function using Pub/Sub, either via [event-driven functions](/functions/docs/writing#event-driven_functions) or as the [HTTP target](/functions/docs/writing#http_functions) of a push subscription, be aware that Pub/Sub messages are base64-encoded. A 10 MB Pub/Sub message - the [maximum size](/pubsub/quotas) supported - is larger than 10 MB once it is encoded, and can thus exceed the Cloud Run functions max size limit.\n\nTime Limits\n-----------\n\nRate Limits\n-----------\n\n| ^1^ You cannot increase the WRITE quota. Insufficient quota generally occurs due to one of the following:\n|\n| - Use of a CI/CD system that deploys many functions concurrently or sequentially at a high rate.\n| - Use of the Firebase CLI to deploy multiple functions simultaneously.\n|\n| In each case, you can avoid hitting this quota by changing the rate of\n| deployments. For example, if you are deploying using the Firebase CLI,\n| [use\n| the `--only` flag to deploy individual functions](https://firebase.google.com/docs/cli/#deploy_specific_functions).\n| ^2^ The CALL API only applies to Cloud Run functions (1st gen). You cannot increase the CALL quota. Insufficient quota generally occurs if you mistakenly use this API to invoke your functions in production. Please keep in mind that this API is meant for testing with the Google Cloud console or [`gcloud functions call`](//cloud.google.com/sdk/gcloud/reference/functions/call) CLI, and it cannot handle heavy traffic.\n\nNetworking limits\n-----------------\n\nFor information about Cloud Run functions (2nd gen) networking request and\nbandwidth limits, see [Networking limits](https://cloud.google.com/run/quotas#networking_limits).\n\nThe following networking limits apply to Cloud Run functions (1st gen):\n\n- Outbound connections per second per instance: 500 (cannot be increased)\n- Outbound DNS resolutions per second per instance: 100 (cannot be increased)\n- Maximum packets per second per instance: 80,000\n- Maximum bits per second per instance: 100,000,000\n\nScalability\n-----------\n\nCloud Run functions invoked by HTTP scale up quickly to handle incoming traffic,\nwhile background functions scale more gradually. A function's ability to scale\nup is dictated by a few factors, including:\n\n- The amount of time it takes for a function's execution to complete (short-running functions can generally scale up to handle more concurrent requests).\n- The amount of time it takes for a function to initialize on [cold start](/functions/docs/bestpractices/tips#use_dependencies_wisely).\n- Your function's error rate.\n- Transient factors, such as regional load and data center capacity.\n\n- Your configuration as defined by\n [minimum instances](/functions/docs/configuring/min-instances),\n [maximum instances](/functions/docs/configuring/max-instances), and\n [concurrency](/functions/docs/configuring/concurrency) (concurrency is 2nd gen\n only).\n\n[Background functions](/functions/docs/writing/background) have additional limits, as explained below. These limits do not apply to 1st gen [HTTP\nfunctions](/functions/docs/writing/http). The default [maximum instances limit](/functions/docs/configuring/max-instances) for 2nd gen HTTP functions is 100 and can be increased to 1,000. There is no default maximum instances limit for 1st gen HTTP functions. To avoid unbounded scaling events with 1st gen HTTP functions, we recommend [setting a limit](/functions/docs/configuring/max-instances#setting_maximum_instances_limits), for example, 3000.\n\n\u003cbr /\u003e\n\n### Additional quotas for background functions\n\nWhen you reach a quota limit\n----------------------------\n\nWhen a function consumes all of an allocated resource, the resource becomes\nunavailable until the quota is refreshed or increased. This may mean that your\nfunction and all other functions in the same project will not work until then.\nA function returns an HTTP 500 error code when one of the resources is\nover quota and the function cannot execute.\n\nTo increase quotas above the defaults listed here, go to the\n[Cloud Run functions Quotas page](https://console.cloud.google.com/iam-admin/quotas?service=cloudfunctions.googleapis.com&usage=ALL&project=_), select the quotas you want to modify, click\n**Edit quotas**, supply your user information if prompted, and enter the new\nquota limit for each quota you selected."]]