Questo documento elenca le quote e i limiti di sistema che si applicano alle applicazioni AI.
- Le quote specificano la quantità di una risorsa condivisa e numerabile che puoi utilizzare. Le quote sono definite dai servizi Google Cloud come AI Applications.
- I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di Google Cloud prodotti e servizi
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota e automatizzare gli aggiustamenti della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Esistono anche limiti di sistema per le risorse di AI Applications. I limiti di sistema non possono essere modificati.
quote di allocazione
Le seguenti quote non vengono reimpostate nel tempo. Vengono rilasciati quando rilasci la risorsa. Se la quota predefinita non è sufficiente, puoi richiedere un aumento della quota.
Quota | Valore |
---|---|
Numero di documenti per progetto | 10.000.000 |
Numero di datastore per progetto | 100* |
Numero di motori per progetto | 150† |
Numero di operazioni di importazione a lunga esecuzione in sospeso per progetto | 300 |
Numero di operazioni a lunga esecuzione di eliminazione di documenti in attesa per progetto | 100 |
Numero di controlli di pubblicazione per progetto | 1000 |
Numero di controlli di pubblicazione del boost per configurazione di pubblicazione | 100 |
Numero di controlli di pubblicazione dei filtri per configurazione di pubblicazione | 100 |
Numero di controlli di pubblicazione del reindirizzamento per configurazione di pubblicazione | 100 |
Numero di controlli di pubblicazione dei sinonimi per configurazione di pubblicazione | 100 |
Numero di eventi utente per progetto | 40.000.000.000 |
Numero regionale di datastore per progetto per località per globale o global |
100 |
Numero regionale di datastore per progetto per località per più regioni UE o eu |
100 |
Numero regionale di datastore per progetto per località per la protezione a più regioni degli Stati Uniti o us |
100 |
Numero regionale di documenti per progetto per località per Global o global |
10.000.000 |
Numero regionale di documenti per progetto per località per più regioni UE o eu |
10.000.000 |
Numero regionale di documenti per progetto per località per più regioni degli Stati Uniti o us |
10.000.000 |
Numero regionale di motori per progetto per località per global o globale |
150 |
Numero regionale di motori per progetto per località per la multiregione EU o eu |
150 |
Numero regionale di motori per progetto per località per la multiregione USA o us |
150 |
Numero regionale di eventi utente per progetto per località per global o globale |
40.000.000.000 |
Numero regionale di eventi utente per progetto per località per la multiregione UE o eu |
40.000.000.000 |
Numero regionale di eventi utente per progetto per località per la multiregione degli Stati Uniti o us |
40.000.000.000 |
* A causa di una limitazione tecnica, la quota massima per gli archivi dati è 500 per progetto. Se hai bisogno di più data store, utilizza nuovi progetti.
† A causa di una limitazione tecnica, la quota massima per i motori è 500 per progetto. Se hai bisogno di più motori, utilizza nuovi progetti.
Quote per le richieste
Le seguenti quote si applicano alle richieste API AI Applications. Se la quota predefinita non è sufficiente, puoi richiedere un aumento della quota.
Quota | Valore |
---|---|
Richieste di query complete al minuto per progetto | 300 |
Richieste di lettura della ricerca conversazionale al minuto per progetto | 300 |
Richieste di scrittura di ricerca conversazionale al minuto per progetto | 300 |
Richieste batch di documenti (ad esempio importazione e eliminazione in linea) al minuto per progetto | 100 |
Richieste di importazione asincrona di documenti (Cloud Storage, BigQuery e così via) al minuto per progetto | 5 |
Richieste di eliminazione dei documenti al minuto per progetto | 100 |
Richieste di lettura di documenti al minuto per progetto | 300 |
Richieste di scrittura di documenti al minuto per progetto | 12.000 |
Richieste di creazione della valutazione al giorno per progetto | 5 |
Richieste di lettura della valutazione al minuto per progetto | 100 |
Richieste di scrittura di valutazione al minuto per progetto | 100 |
Richieste di query LLM (riepilogo della ricerca, ricerca in più passaggi) al minuto per progetto | 60 |
Numero di scritture di streaming FHIR o BigQuery in attesa al minuto | 6000 |
Numero di set di query di esempio per progetto | 100 |
Richieste all'API Ranking al minuto per progetto | 500 |
Richieste di raccomandazione al minuto per progetto | 60.000 |
Richieste di lettura di query di esempio al minuto per progetto | 200 |
Richieste di lettura del set di query di esempio al minuto per progetto | 100 |
Richieste di scrittura di set di query di esempio al minuto per progetto | 100 |
Esempio di richieste di scrittura di query al minuto per progetto | 200 |
Richieste di lettura dello schema al minuto per progetto | 100 |
Richieste di scrittura dello schema al minuto per progetto | 100 |
Richieste di ricerca al minuto per progetto | 300 |
Richieste batch di eventi utente (ad esempio importazione ed eliminazione) al minuto per progetto | 100 |
Richieste di raccolta di eventi utente al minuto per progetto per utente | 240 |
Richieste di scrittura di eventi utente al minuto per progetto | 60.000 |
Quota per l'indicizzazione delle pagine web
Quando hai un datastore con l'indicizzazione avanzata dei siti web attivata, ogni pagina web che indicizzi viene conteggiata ai fini della quota "Numero di documenti per progetto" nell'elenco Quote di allocazione. Puoi anche visualizzare il numero di pagine del progetto e la quota di pagine per il progetto nel campo Pagine del progetto rispetto alla quota nella pagina Dati di un datastore.
Se aggiungi siti web a un datastore in un progetto e le pagine web di questi siti superano la quota del progetto, i siti web non vengono indicizzati. Se nel datastore sono presenti siti web già indicizzati, questi <x0A>continueranno a essere indicizzati come prima. Puoi richiedere l'upgrade della tua quota in qualsiasi momento.
Richiedi un aumento della quota
Per modificare la maggior parte delle quote, utilizza la Google Cloud console. Per ulteriori informazioni, consulta Richiedi un aggiustamento delle quote.