Quote e limiti

Questo documento elenca le quote e i limiti di sistema che si applicano a Gemini per Google Cloud.

  • Le quote specificano la quantità di una risorsa condivisa e numerabile che puoi utilizzare. Le quote sono definite da servizi come Gemini in Google Cloud. Google Cloud
  • I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.

Esistono anche limiti di sistema per le risorse Gemini. I limiti di sistema non possono essere modificati.

Richieste al secondo

Gemini for Google Cloud applica quote alle richieste al secondo per ogni utente di un progetto.

Quota Valore
Richieste al secondo 2

Richieste al giorno

Gemini per Google Cloud applica quote per il numero totale di richieste al giorno per ogni utente di un progetto.

Quota Valore
Richieste al giorno per Gemini Code Assist o Gemini nelle richieste di codice BigQuery, come la generazione e il completamento del codice. 6000
Richieste al giorno per chat, visualizzazione, scansioni di tabelle di approfondimento dei dati, generazione di metadati, preparazione dei dati e altre richieste che mostrano le risposte nel riquadro Cloud Assist nella console Google Cloud e negli IDE. 960

Quote per Gemini Code Assist

Gemini Code Assist applica quote per determinate funzionalità.

Quota Valore
Awareness del codebase locale Finestra contestuale da 128.000 token
Repository di personalizzazione del codice 20.000

Quote per la modalità agente e la CLI Gemini

Le quote per le richieste dalla modalità agente di Gemini Code Assist e dalla CLI Gemini sono combinate. In modalità agente o quando utilizzi la CLI Gemini, un prompt potrebbe generare più richieste.

Quota Versione di Gemini Code Assist Valore
Richieste per utente al minuto Standard 120
Aziende 120
Richieste per utente al giorno Standard 1500
Aziende 2000

Quote per Gemini in BigQuery

Per le funzionalità di assistenza per il codice, la quota per Gemini Code Assist e Gemini in BigQuery per le richieste di codice per funzionalità come il completamento e la generazione del codice è la stessa.

Per i clienti che utilizzano Gemini in BigQuery con BigQuery on demand o con le versioni Enterprise o Enterprise Plus, le quote per le funzionalità avanzate come gli approfondimenti sui dati vengono fornite in base all'utilizzo medio giornaliero di TiB scansionati o alle ore di slot per l'ultimo mese di calendario completo. Questa quota si applica a livello di organizzazione ed è disponibile per tutti i progetti dell'organizzazione. Le quote vengono arrotondate per eccesso all'utilizzo di slot-ora più vicino.

Quote per 100 ore di slot (utilizzo medio giornaliero della versione Enterprise o Enterprise Plus) o per TiB scansionato utilizzando il modello di calcolo on demand Valore
Richieste al giorno per chat, visualizzazione, scansioni di tabelle e altre richieste che mostrano le risposte nel riquadro Cloud Assist nella console Google Cloud . 5

Esempio: un'organizzazione che ha una prenotazione di Enterprise Edition con 100 slot come base utilizzerà una media di 2400 ore di slot al giorno (100 slot * 24 ore = 2400 ore di slot). Di conseguenza, nel mese successivo ricevono le seguenti quote giornaliere:

  • 120 scansioni di chat, visualizzazioni, tabelle di approfondimenti sui dati e generazioni di metadati automatizzate al giorno

Se la tua organizzazione non ha acquistato fino ad ora slot BigQuery Enterprise, BigQuery Enterprise Plus o computing on demand (TiB), dopo il primo utilizzo riceverai la quota predefinita di quanto segue per il primo mese di calendario completo:

  • 250 chat, visualizzazioni, scansioni di tabelle di approfondimenti sui dati e generazioni di metadati automatizzate al giorno

Se inizi a utilizzare le prenotazioni di calcolo on demand o delle versioni Enterprise o Enterprise Plus a metà mese, la quota predefinita viene applicata fino alla fine del mese successivo.

Richiedi un aumento della quota

Per modificare la maggior parte delle quote, utilizza la Google Cloud console. Per ulteriori informazioni, consulta Richiedi un aggiustamento delle quote.