Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.

  • Kuota menentukan jumlah resource bersama yang dapat dihitung yang dapat Anda gunakan. Kuota ditentukan oleh Google Cloud layanan seperti Gemini untuk Google Cloud.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Anda sendiri. Google Cloud

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource lebih banyak daripada yang diizinkan kuotanya, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project. Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.

Permintaan per detik

Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per detik 2

Permintaan per hari

Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per hari untuk Gemini Code Assist atau permintaan kode Gemini di BigQuery, seperti pembuatan kode dan penyelesaian kode. 6000
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, pembuatan metadata, penyiapan data, dan permintaan lainnya yang menampilkan respons di panel Cloud Assist di konsol dan IDE Google Cloud . 960

Kuota untuk Gemini Code Assist

Gemini Code Assist menerapkan kuota untuk fitur tertentu.

Kuota Nilai
Awareness codebase lokal Jendela konteks 128.000 token
Repositori penyesuaian kode 20.000

Kuota untuk mode agen dan Gemini CLI

Kuota untuk permintaan dari mode agen Gemini Code Assist dan Gemini CLI digabungkan. Saat dalam mode agen atau saat menggunakan Gemini CLI, satu perintah dapat menghasilkan beberapa permintaan.

Kuota Edisi Gemini Code Assist Nilai
Permintaan per pengguna per menit Standar 120
Enterprise 120
Permintaan per pengguna per hari Standar 1500
Enterprise 2000

Kuota untuk Gemini di BigQuery

Untuk fitur bantuan kode, kuota untuk permintaan kode Gemini Code Assist dan Gemini in BigQuery untuk fitur seperti penyelesaian kode dan pembuatan kode adalah sama.

Untuk pelanggan yang menggunakan Gemini in BigQuery dengan komputasi on-demand BigQuery atau dengan edisi Enterprise atau Enterprise Plus, kuota untuk fitur lanjutan seperti insight data disediakan berdasarkan penggunaan rata-rata harian TiB yang dipindai atau jam slot untuk bulan kalender penuh terakhir. Kuota ini berlaku untuk tingkat organisasi dan tersedia untuk semua project dalam organisasi tersebut. Kuota dibulatkan ke atas hingga penggunaan 100 slot-jam terdekat.

Kuota per 100 jam slot (penggunaan rata-rata harian edisi Enterprise atau Enterprise Plus) atau per TiB yang dipindai menggunakan model komputasi sesuai permintaan Nilai
Permintaan per hari untuk chat, visualisasi, pemindaian tabel, dan permintaan lain yang menampilkan respons di panel Cloud Assist di konsol Google Cloud . 5

Contoh: Organisasi yang memiliki reservasi edisi Enterprise dengan 100 slot sebagai dasar pengukurannya akan menggunakan rata-rata 2.400 jam slot setiap hari (100 slot * 24 jam = 2.400 jam slot). Akibatnya, pada bulan berikutnya, mereka mendapatkan kuota harian berikut:

  • 120 pemindaian tabel insight data, visualisasi, dan chat, serta pembuatan metadata otomatis per hari

Jika organisasi Anda belum membeli slot edisi BigQuery Enterprise, edisi Enterprise Plus, atau komputasi sesuai permintaan (TiB) hingga saat ini, setelah penggunaan pertama, Anda akan menerima kuota default berikut untuk bulan kalender penuh pertama:

  • 250 pemindaian tabel insight data, visualisasi, chat, dan pembuatan metadata otomatis per hari

Jika Anda mulai menggunakan komputasi sesuai permintaan, reservasi edisi Enterprise atau edisi Enterprise Plus di pertengahan bulan, kuota default akan berlaku hingga akhir bulan berikutnya.

Meminta penambahan kuota

Untuk menyesuaikan sebagian besar kuota, gunakan konsol Google Cloud . Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.