Quote e limiti

Questo documento elenca le quote e i limiti di sistema che si applicano a Gemini per Google Cloud.

  • Le quote specificano la quantità di una risorsa condivisa e conteggiabile che puoi utilizzare. Le quote sono definite dai servizi Google Cloud, come Gemini per Google Cloud.
  • I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per contribuire a garantire l'equità e ridurre gli picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una risorsa Google Cloud che può essere utilizzata nel progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

  • Monitora il tuo consumo di prodotti e servizi Google Cloud
  • Limita il consumo di queste risorse
  • Fornisce un modo per richiedere modifiche al valore della quota

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.

Esistono anche limiti di sistema per le risorse Gemini. I limiti di sistema non possono essere modificati.

Richieste al secondo

Gemini per Google Cloud applica le quote per le richieste al secondo per ogni utente di un progetto.

Quota Valore
Richieste al secondo 2

Richieste al giorno

Gemini per Google Cloud applica le quote per il numero totale di richieste al giorno per ciascun utente di un progetto.

Quota Valore
Richieste al giorno per Gemini Code Assist o Gemini nelle richieste di codice BigQuery, come generazione e completamento del codice. 6000
Richieste al giorno per chat, visualizzazione, scansioni di tabelle di insight sui dati e altre richieste che mostrano le risposte nel riquadro Gemini nella console Google Cloud e nelle IDE. 240

Quote per Gemini Code Assist

Gemini Code Assist applica quote per determinate funzionalità.

Quota Valore
Awareness del codebase locale Finestra contestuale di 128.000 token
Repository di personalizzazione del codice 950

Quote per Gemini in BigQuery

Per i clienti che utilizzano Gemini in BigQuery con la versione BigQuery Enterprise Plus, le quote vengono fornite in base all'utilizzo medio giornaliero delle ore di slot Enterprise Plus per l'ultimo mese di calendario completo. Questa quota si applica a livello di organizzazione ed è disponibile per tutti i progetti dell'organizzazione a cui sono stati assegnati slot per la versione Enterprise Plus. Le quote vengono arrotondate per eccesso al numero di slot-ore più vicino.

Quote per 100 ore di slot (utilizzo medio giornaliero della versione Enterprise Plus) Valore
Richieste di completamento del codice al giorno 150
Richieste di generazione di codice al giorno 10
Richieste al giorno per chat, visualizzazione, scansioni di tabelle e altre richieste che mostrano le risposte nel riquadro Gemini della console Google Cloud. 5

Esempio: un'organizzazione che ha prenotato una versione Enterprise Plus con 100 slot come base di riferimento utilizzerà in media 2400 ore-slot ogni giorno (100 slot * 24 ore = 2400 ore-slot). Di conseguenza, nel mese successivo riceve le seguenti quote giornaliere:

  • 3600 richieste di completamento del codice al giorno
  • 240 richieste di generazione di codice al giorno
  • 120 scansioni al giorno delle tabelle di chat, visualizzazione e approfondimenti sui dati

Se la tua organizzazione non ha ancora acquistato prenotazioni per la versione BigQuery Enterprise Plus, dopo aver effettuato l'acquisto di una prenotazione per la versione Enterprise Plus, riceverai la quota predefinita di quanto segue per il primo mese di calendario completo:

  • 7500 richieste di completamento del codice al giorno
  • 500 richieste di generazione di codice al giorno
  • 250 scansioni al giorno di tabelle di chat, visualizzazioni e approfondimenti sui dati

Se inizi a utilizzare le prenotazioni della versione Enterprise Plus a metà mese, la quota predefinita viene applicata fino alla fine del mese successivo.

Richiedi un aumento della quota

Per modificare la maggior parte delle quote, utilizza la console Google Cloud. Per ulteriori informazioni, consulta Richiedere un aggiustamento della quota.