Quote e limiti

Questo documento elenca le quote e i limiti di sistema che si applicano a Vertex AI Agent Builder.

  • Le quote specificano la quantità di una risorsa condivisa e conteggiabile che puoi utilizzare. Le quote sono definite dai servizi Google Cloud come Vertex AI Agent Builder.
  • I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per contribuire a garantire l'equità e ridurre gli picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una risorsa Google Cloud che può essere utilizzata nel progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

  • Monitora il tuo consumo di prodotti e servizi Google Cloud
  • Limita il consumo di queste risorse
  • Fornisce un modo per richiedere modifiche al valore della quota

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.

Esistono anche limiti di sistema per le risorse di Vertex AI Agent Builder. I limiti di sistema non possono essere modificati.

quote di allocazione

Le seguenti quote non vengono reimpostate nel tempo, ma vengono rilasciate quando viene rilasciata la risorsa:

Quote Valore
Numero di documenti per progetto 1.000.000
Numero di documenti per organizzazione 5.000.000
Numero di operazioni di importazione a lunga esecuzione in sospeso per progetto 300
Numero di operazioni di importazione a lunga esecuzione in sospeso per organizzazione 1500
Numero di operazioni di eliminazione a lunga esecuzione dei documenti in sospeso per progetto 100
Numero di operazioni a lunga esecuzione per l'eliminazione di documenti in sospeso per organizzazione 500
Numero di controlli di pubblicazione per progetto 1000
Numero di controlli di pubblicazione con boost per configurazione di pubblicazione 100
Numero di controlli di pubblicazione dei filtri per configurazione di pubblicazione 100
Numero di controlli di pubblicazione dei reindirizzamenti per configurazione di pubblicazione 100
Numero di controlli di pubblicazione dei sinonimi per configurazione di pubblicazione 100
Numero di eventi utente per progetto 40.000.000.000
Numero di eventi utente per organizzazione 200.000.000.000

Quote per le richieste

Le seguenti quote si applicano alle richieste di Vertex AI Agent Builder:

Quote Valore
Richieste di query complete al minuto per progetto 300
Richieste di query complete al minuto per organizzazione 1500
Richieste di lettura della ricerca di conversazione al minuto per progetto 300
Richieste di lettura della ricerca di conversazione al minuto per organizzazione 500
Richieste di scrittura per la ricerca di conversazione al minuto per progetto 300
Richieste di scrittura per la ricerca di conversazione al minuto per organizzazione 500
Richieste batch di documenti al minuto per progetto 100
Richieste batch di documenti al minuto per organizzazione 500
Richieste di lettura dei documenti al minuto per progetto 300
Richieste di lettura dei documenti al minuto per organizzazione 1500
Richieste di scrittura dei documenti al minuto per progetto 12.000
Richieste di scrittura di documenti al minuto per organizzazione 60.000
Richieste di creazione di valutazioni al giorno per organizzazione 5
Richieste di creazione di valutazioni al giorno per progetto 5
Richieste di lettura di valutazione al minuto per organizzazione 500
Richieste di lettura di valutazione al minuto per progetto 100
Richieste di scrittura per la valutazione al minuto per organizzazione 500
Richieste di scrittura per la valutazione al minuto per progetto 100
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per progetto 15
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per organizzazione 75
Numero di scritture in streaming FHIR/BQ in attesa al minuto 6000
Numero di set di query di esempio per organizzazione 500
Numero di insiemi di query di esempio per progetto 100
Richieste API di ranking al minuto per progetto 500
Richieste di consigli al minuto per progetto 60.000
Richieste di consigli al minuto per organizzazione Illimitato
Richieste di lettura di query di esempio al minuto per organizzazione 1000
Richieste di lettura di query di esempio al minuto per progetto 200
Richieste di lettura del set di query di esempio al minuto per organizzazione 500
Richieste di lettura del set di query di esempio al minuto per progetto 100
Richieste di scrittura per set di query di esempio al minuto per organizzazione 500
Richieste di scrittura del set di query di esempio al minuto per progetto 100
Richieste di scrittura di query di esempio al minuto per organizzazione 1000
Richieste di scrittura di query di esempio al minuto per progetto 200
Richieste di lettura dello schema al minuto per progetto 100
Richieste di lettura dello schema al minuto per organizzazione 500
Richieste di scrittura dello schema al minuto per progetto 100
Richieste di scrittura dello schema al minuto per organizzazione 500
Richieste di ricerca al minuto per progetto 300
Richieste di ricerca al minuto per organizzazione Illimitato
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per progetto 100
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per organizzazione 500
Richieste di raccolta di eventi utente al minuto per progetto per utente 240
Richieste di raccolta di eventi utente al minuto per organizzazione per utente 1200
Richieste di scrittura di eventi utente al minuto per progetto 60.000
Richieste di scrittura di eventi utente al minuto per organizzazione 300.000

Quota per l'indicizzazione delle pagine web

Quando hai un datastore con l'Indicizzazione avanzata dei siti web attivata, ogni pagina web indicizzata viene conteggiata ai fini della quota "Numero di documenti per progetto" nell'elenco Quote di allocazione. Puoi anche visualizzare il numero di pagine nel progetto e la quota di pagine per il progetto nel campo Pagine del progetto rispetto alla quota nella pagina Dati per un datastore.

Se aggiungi siti web a un datastore in un progetto e le pagine web di questi siti web causano il superamento della quota per il progetto, i siti web non vengono indicizzati. Se nel tuo datastore sono presenti siti web già indicizzati, questi continueranno a essere indicizzati come prima. Puoi richiedere l'upgrade della quota in qualsiasi momento.

Richiedi un aumento della quota

Per modificare la maggior parte delle quote, utilizza la console Google Cloud. Per ulteriori informazioni, consulta Richiedere un aggiustamento della quota.