Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.
- Kuota menentukan jumlah resource bersama yang dapat dihitung yang dapat Anda gunakan. Kuota ditentukan oleh Google Cloud layanan seperti Gemini untuk Google Cloud.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Anda sendiri. Google Cloud
Sistem Kuota Cloud melakukan hal berikut:
- Memantau penggunaan Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource lebih banyak daripada yang diizinkan kuotanya, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.
Permintaan per detik
Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.
Kuota | Nilai |
---|---|
Permintaan per detik | 2 |
Permintaan per hari
Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.
Kuota | Nilai |
---|---|
Permintaan per hari untuk Gemini Code Assist atau permintaan kode Gemini di BigQuery, seperti pembuatan kode dan penyelesaian kode. | 6000 |
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, pembuatan metadata, penyiapan data, dan permintaan lainnya yang menampilkan respons di panel Cloud Assist di konsol dan IDE Google Cloud . | 960 |
Kuota untuk Gemini Code Assist
Gemini Code Assist menerapkan kuota untuk fitur tertentu.
Kuota | Nilai |
---|---|
Awareness codebase lokal | Jendela konteks 128.000 token |
Repositori penyesuaian kode | 20.000 |
Kuota untuk mode agen dan Gemini CLI
Kuota untuk permintaan dari mode agen Gemini Code Assist dan Gemini CLI digabungkan. Saat dalam mode agen atau saat menggunakan Gemini CLI, satu perintah dapat menghasilkan beberapa permintaan.
Kuota | Edisi Gemini Code Assist | Nilai |
---|---|---|
Permintaan per pengguna per menit | Standar | 120 |
Enterprise | 120 | |
Permintaan per pengguna per hari | Standar | 1500 |
Enterprise | 2000 |
Kuota untuk Gemini di BigQuery
Untuk fitur bantuan kode, kuota untuk permintaan kode Gemini Code Assist dan Gemini in BigQuery untuk fitur seperti penyelesaian kode dan pembuatan kode adalah sama.
Untuk pelanggan yang menggunakan Gemini in BigQuery dengan komputasi on-demand BigQuery atau dengan edisi Enterprise atau Enterprise Plus, kuota untuk fitur lanjutan seperti insight data disediakan berdasarkan penggunaan rata-rata harian TiB yang dipindai atau jam slot untuk bulan kalender penuh terakhir. Kuota ini berlaku untuk tingkat organisasi dan tersedia untuk semua project dalam organisasi tersebut. Kuota dibulatkan ke atas hingga penggunaan 100 slot-jam terdekat.
Kuota per 100 jam slot (penggunaan rata-rata harian edisi Enterprise atau Enterprise Plus) atau per TiB yang dipindai menggunakan model komputasi sesuai permintaan | Nilai |
---|---|
Permintaan per hari untuk chat, visualisasi, pemindaian tabel, dan permintaan lain yang menampilkan respons di panel Cloud Assist di konsol Google Cloud . | 5 |
Contoh: Organisasi yang memiliki reservasi edisi Enterprise dengan 100 slot sebagai dasar pengukurannya akan menggunakan rata-rata 2.400 jam slot setiap hari (100 slot * 24 jam = 2.400 jam slot). Akibatnya, pada bulan berikutnya, mereka mendapatkan kuota harian berikut:
- 120 pemindaian tabel insight data, visualisasi, dan chat, serta pembuatan metadata otomatis per hari
Jika organisasi Anda belum membeli slot edisi BigQuery Enterprise, edisi Enterprise Plus, atau komputasi sesuai permintaan (TiB) hingga saat ini, setelah penggunaan pertama, Anda akan menerima kuota default berikut untuk bulan kalender penuh pertama:
- 250 pemindaian tabel insight data, visualisasi, chat, dan pembuatan metadata otomatis per hari
Jika Anda mulai menggunakan komputasi sesuai permintaan, reservasi edisi Enterprise atau edisi Enterprise Plus di pertengahan bulan, kuota default akan berlaku hingga akhir bulan berikutnya.
Meminta penambahan kuota
Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.