Questo documento elenca le quote e i limiti di sistema che si applicano a Document AI.
- Le quote hanno valori predefiniti, ma in genere puoi richiedere modifiche.
- I limiti di sistema sono valori fissi che non possono essere modificati.
Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utentiGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.
Il sistema delle quote di Cloud esegue le seguenti operazioni:
- Monitora il tuo consumo di Google Cloud prodotti e servizi
- Limita il consumo di queste risorse
- Fornisce un modo per richiedere modifiche al valore della quota e automatizzare gli aggiustamenti della quota
Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.
In genere, le quote si applicano a livello di Google Cloud progetto. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un Google Cloud progetto, le quote vengono condivise tra tutte le applicazioni e gli indirizzi IP.
Questo documento elenca le quote che si applicano a Document AI.
Livelli di servizio
Document AI supporta due livelli di servizio e le quote associate per le richieste di elaborazione online alle versioni del processore basate sull'AI generativa: livelli di provisioning e best effort.
La quota del livello di provisioning fornisce 120 pagine al minuto per le versioni di base del processore, come gli estrattori personalizzati v1.4 e v1.5, e 30 pagine al minuto per le versioni di base del processore come l'estrattore personalizzato v1.5 Pro.
La quota del livello Best effort fornisce 120 per le versioni di base del processore, come gli estrattori personalizzati v1.4 e v1.5, 60 per le versioni Pro del processore, come l'estrattore personalizzato v1.5 Pro, e viene utilizzata solo una volta esaurita la quota di provisioning. Ciò vale per
le quote BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(metrica best_effort_online_process_document_pages_us) e
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(metrica best_effort_online_process_document_pages_eu) nella console.
| Note | Custom Extractor v1.4 (basato su Gemini 2.0 Flash) | Custom Extractor v1.5 (basato su Gemini 2.5 Flash) | Custom Extractor v1.5 Pro (basato su Gemini 2.5 Pro) |
|---|---|---|---|
| Provisioning effettuato | 120 | 120 | 30 |
| Best effort | 120 | 120 | 60 |
| Provisioning a livello di organizzazione | 240 | 240 | 60 |
Se hai bisogno di quote superiori a quelle elencate per il best effort, puoi inviare una richiesta di aumento della quota (QIR) contattando il team di vendita.
Per assicurarti una maggiore capacità disponibile durante il traffico elevato, leggi la sezione su come inviare una richiesta di prenotazione della capacità.
Non è previsto un accordo sul livello del servizio per il livello Best Effort.
Elenco delle quote
Le seguenti quote si applicano a Document AI. Queste quote si applicano a ogni progetto della console Google Cloud e sono condivise tra tutte le applicazioni e gli indirizzi IP che utilizzano il progetto.
Se vuoi elaborare più richieste, invia una richiesta di quota di Document AI per il tuo progetto nella consoleGoogle Cloud .
Fornisci informazioni sulle tue esigenze specifiche e sul tuo caso d'uso nella richiesta.
| Quota per le richieste | Valore predefinito | Note |
|---|---|---|
| Richieste al minuto | 1800 per utente | Visualizza la quota nella console Google Cloud |
| Richieste di procedure online al minuto (Stati Uniti) | 120 per progetto per tipo di processore | Visualizza la quota nella console Google Cloud |
| Richieste di procedure online al minuto (UE) | 120 per progetto per tipo di processore | Visualizza la quota nella console Google Cloud |
| Numero di pagine di documenti di processi online (Stati Uniti) al minuto per tipo di processore e versione del modello (estrattore personalizzato v1.4 solo con Gemini 2.0 Flash) | 120 pagine al minuto* | Visualizza la quota nella console Google Cloud |
| Numero di pagine di documenti di processi online (UE) al minuto per tipo di processore e versione del modello (estrattore personalizzato v1.4 solo con Gemini 2.0 Flash) | 120 pagine al minuto* | Visualizza la quota nella console Google Cloud |
| Numero di pagine di documenti di processi online (Stati Uniti) al minuto per tipo di processore e versione del modello (estrattore personalizzato v1.5 solo con Gemini 2.5 Flash) | 120 pagine al minuto* | Visualizza la quota nella console Google Cloud |
| Numero di pagine di documenti di processi online (UE) al minuto per tipo di processore e versione del modello (Custom Extractor v1.5 solo con Gemini 2.5 Flash) | 120 pagine al minuto* | Visualizza la quota nella console Google Cloud |
| Richieste di elaborazione online al minuto (singola regione) | 6 per progetto per tipo di processore | Visualizza la quota nella console Google Cloud |
| Richieste di elaborazione batch simultanee per progetto e regione (Stati Uniti) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di elaborazione batch simultanee per progetto e regione (UE) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di elaborazione batch simultanee per processore (singola regione) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di addestramento simultanee della versione del processore (Stati Uniti) | 1 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di addestramento simultanee della versione del processore (UE) | 1 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di addestramento simultanee della versione del processore (singola regione) | 1 per progetto† | Visualizza la quota nella console Google Cloud |
| Versioni del processore personalizzato sottoposte a deployment (Stati Uniti) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Versioni del processore personalizzato di cui è stato eseguito il deployment (UE) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Versioni del processore personalizzato sottoposte a deployment (singola regione) | 5 per progetto | Visualizza la quota nella console Google Cloud |
| Versioni del processore generativo di cui è stato eseguito il deployment (Stati Uniti) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella console Google Cloud |
| Versioni del processore generativo di cui è stato eseguito il deployment (UE) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella console Google Cloud |
| Versioni del processore generativo di cui è stato eseguito il deployment (singola regione) | 100 per progetto per processore di estrazione personalizzato | Visualizza la quota nella console Google Cloud |
| Richieste di documenti di importazione simultanei (Stati Uniti) | 3 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di importazione simultanea di documenti (UE) | 3 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di documenti di importazione simultanea (singola regione) | 3 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di documenti di esportazione simultanee (Stati Uniti) | 1 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di esportazione di documenti simultanee (UE) | 1 per progetto | Visualizza la quota nella console Google Cloud |
| Richieste di esportazione simultanee di documenti (singola regione) | 1 per progetto | Visualizza la quota nella console Google Cloud |
* Le richieste di aggiustamento della quota non sono ancora supportate per questa versione.
† Supportato in australia-southeast1 con una richiesta di aggiustamento della quota.
Effettuare una richiesta di prenotazione di capacità
La prenotazione della capacità di Document AI fornisce capacità riservata per gestire il traffico di previsione in tempo reale e ad alto volume per il periodo di abbonamento, contribuendo a soddisfare i requisiti dell'accordo sul livello del servizio (SLA). Ogni unità corrisponde a una pagina al minuto aggiuntiva oltre alla quota predefinita.
La prenotazione della capacità è supportata e necessaria per aumentare le quote del livello di provisioning dei modelli estrattori personalizzati v1.4 e v1.5, incluse le versioni del processore ottimizzate basate su questi modelli.
Il prezzo per la prenotazione della capacità è di 300 $per ogni pagina al minuto al mese.
Per effettuare una richiesta di prenotazione di capacità:
Nella console Google Cloud , vai alla pagina IAM e amministrazione > Prenotazione di capacità:
Vicino all'intestazione della pagina, fai clic su Crea nuova prenotazione della capacità. Si aprirà un modulo di richiesta di due pagine.
Compila la pagina Configura con quanto segue:
- Inserisci un nome per l'ordine.
- Seleziona una regione.
- Seleziona la versione del processore dal menu a discesa.
- Scrivi il numero di pagine aggiuntive al minuto necessarie al mese.
- Seleziona il periodo di abbonamento mensile.
- Seleziona la data e l'ora di inizio.
- Seleziona un'opzione di rinnovo automatico dal menu a discesa.
Fai clic su Continua.
Nella seconda pagina, vedrai un costo mensile stimato. Per convalidare l'acquisto, inserisci Conferma.
Fai clic su Conferma e invia.
Potrai visualizzare lo stato della richiesta nella scheda Prenotazione di capacità.
I tre stati possibili sono:
- Inattivo: l'abbonamento non è ancora iniziato.
- Attivo: l'abbonamento è in corso.
- Completato: l'abbonamento è terminato.
Aspetti da considerare prima di acquistare la prenotazione della capacità
Per aiutarti a decidere se acquistare una prenotazione di capacità, considera quanto segue:
Non puoi annullare l'ordine a metà del periodo di validità.
L'acquisto della prenotazione della capacità è un impegno, il che significa che non puoi annullare l'ordine a metà del periodo. Tuttavia, puoi aumentare il numero di GSU acquistate. Se acquisti per errore un impegno o se si verifica un problema con la configurazione, contatta il tuo Google Cloud rappresentante dell'account per ricevere assistenza.
Puoi rinnovare automaticamente l'abbonamento.
Quando invii l'ordine, puoi scegliere di rinnovare automaticamente l'abbonamento al termine del periodo o di lasciarlo scadere. Puoi annullare la procedura di rinnovo automatico. Per annullare l'abbonamento prima del rinnovo automatico, annulla il rinnovo automatico 30 giorni prima dell'inizio del periodo successivo.
Puoi configurare gli abbonamenti mensili in modo che si rinnovino automaticamente ogni mese. I termini settimanali non supportano il rinnovo automatico.