Questo documento elenca le quote e i limiti di sistema che si applicano a Gemini per Google Cloud.
- Le quote specificano la quantità di una risorsa condivisa e conteggiabile che puoi utilizzare. Le quote sono definite dai servizi Google Cloud, come Gemini per Google Cloud.
- I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per contribuire a garantire l'equità e ridurre gli picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una risorsa Google Cloud che può essere utilizzata nel progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di prodotti e servizi Google Cloud
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.
Esistono anche limiti di sistema per le risorse Gemini. I limiti di sistema non possono essere modificati.
Richieste al secondo
Gemini per Google Cloud applica le quote per le richieste al secondo per ogni utente di un progetto.
Quota | Valore |
---|---|
Richieste al secondo | 2 |
Richieste al giorno
Gemini per Google Cloud applica le quote per il numero totale di richieste al giorno per ciascun utente di un progetto.
Quota | Valore |
---|---|
Richieste al giorno per Gemini Code Assist o Gemini nelle richieste di codice BigQuery, come generazione e completamento del codice. | 6000 |
Richieste al giorno per chat, visualizzazione, scansioni di tabelle di insight sui dati e altre richieste che mostrano le risposte nel riquadro Gemini nella console Google Cloud e nelle IDE. | 240 |
Quote per Gemini Code Assist
Gemini Code Assist applica quote per determinate funzionalità.
Quota | Valore |
---|---|
Awareness del codebase locale | Finestra contestuale di 128.000 token |
Repository di personalizzazione del codice | 950 |
Quote per Gemini in BigQuery
Per i clienti che utilizzano Gemini in BigQuery con la versione BigQuery Enterprise Plus, le quote vengono fornite in base all'utilizzo medio giornaliero delle ore di slot Enterprise Plus per l'ultimo mese di calendario completo. Questa quota si applica a livello di organizzazione ed è disponibile per tutti i progetti dell'organizzazione a cui sono stati assegnati slot per la versione Enterprise Plus. Le quote vengono arrotondate per eccesso al numero di slot-ore più vicino.
Quote per 100 ore di slot (utilizzo medio giornaliero della versione Enterprise Plus) | Valore |
---|---|
Richieste di completamento del codice al giorno | 150 |
Richieste di generazione di codice al giorno | 10 |
Richieste al giorno per chat, visualizzazione, scansioni di tabelle e altre richieste che mostrano le risposte nel riquadro Gemini della console Google Cloud. | 5 |
Esempio: un'organizzazione che ha prenotato una versione Enterprise Plus con 100 slot come base di riferimento utilizzerà in media 2400 ore-slot ogni giorno (100 slot * 24 ore = 2400 ore-slot). Di conseguenza, nel mese successivo riceve le seguenti quote giornaliere:
- 3600 richieste di completamento del codice al giorno
- 240 richieste di generazione di codice al giorno
- 120 scansioni al giorno delle tabelle di chat, visualizzazione e approfondimenti sui dati
Se la tua organizzazione non ha ancora acquistato prenotazioni per la versione BigQuery Enterprise Plus, dopo aver effettuato l'acquisto di una prenotazione per la versione Enterprise Plus, riceverai la quota predefinita di quanto segue per il primo mese di calendario completo:
- 7500 richieste di completamento del codice al giorno
- 500 richieste di generazione di codice al giorno
- 250 scansioni al giorno di tabelle di chat, visualizzazioni e approfondimenti sui dati
Se inizi a utilizzare le prenotazioni della versione Enterprise Plus a metà mese, la quota predefinita viene applicata fino alla fine del mese successivo.
Richiedi un aumento della quota
Per modificare la maggior parte delle quote, utilizza la console Google Cloud. Per ulteriori informazioni, consulta Richiedere un aggiustamento della quota.