Questa pagina è stata tradotta dall'API Cloud Translation.

Quote e limiti

Questo documento contiene le quote e i limiti più comuni per l'uso di Dialogflow. Di seguito sono riportate informazioni su come trovare un elenco completo di quote e limiti. Ci riserviamo il diritto di modificare questi vincoli e aggiorneremo la presente pagina ogniqualvolta effettueremo tali modifiche.

Quote

Le quote sono vincoli predefiniti applicati al tuo progetto. Quando utilizzi le funzionalità di IA generativa, ogni combinazione di modello e regione ha la propria quota generativa. Se utilizzi un'edizione a pagamento, puoi richiedere un aumento della quota. Le quote hanno lo scopo di limitare il carico di servizio per cliente, evitando di sovraccaricare i singoli servizi e di addebitare al cliente un utilizzo di risorse imprevisto.

Le quote di Dialogflow variano a seconda dell'edizione dell'agente. Le quote si applicano ai singoli progetti e vengono condivise fra tutti gli indirizzi IP e le applicazioni che utilizzano un progetto.

Dettagli sui limiti di tempo delle quote:

Le quote mensili vengono reintegrate il primo giorno di ogni mese alle ore 00:00 del fuso orario del Pacifico.
Le quote giornaliere vengono reintegrate giornalmente alle ore 00:00 del fuso orario del Pacifico. Quando il passaggio all'ora legale nel fuso orario del Pacifico aumenta la durata di un giorno, verrà concesso un bonus di quota proporzionale. Tuttavia, non è prevista alcuna deduzione equivalente nel caso di un giorno più breve dovuto al passaggio all'ora legale.
Le quote al minuto vengono aggiornate ogni 60 secondi allo scoccare del minuto.

Le quote elencate nella tabella delle quote sono quelle più comuni. Per esaminare tutte le quote, visita la pagina relativa alle quote di Dialogflow nella console diGoogle Cloud .

Quote generative

Quando l'agente utilizza le funzionalità generative di Conversational Agents (Dialogflow CX), ogni combinazione di modello e regione ha quote uniche.

Identificatore quota

La quota ConversationalAgentLlmTokenConsumption è una quota regionale che monitora l'utilizzo dei token per i modelli linguistici di grandi dimensioni (LLM) in Conversational Agents (Dialogflow CX). Questa quota viene misurata in base a diversi modelli di base LLM e attualmente supporta i seguenti modelli:

gemini-1.5-pro
gemini-1.5-pro-002
gemini-1.5-flash
gemini-1.5-flash-002
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-2.5-flash
gemini-2.5-flash-lite

La quota ConversationalAgentLlmTokenConsumption monitora l'utilizzo dei token LLM nelle seguenti funzionalità di Conversational Agents (Dialogflow CX):

Generatori
Generative Fallback
Playbook
Datastore

Il limite predefinito per la quota ConversationalAgentLlmTokenConsumption è di 600.000 token al minuto.

Richiesta di aumento della quota multiregionale

Se devi richiedere un aumento della quota per una regione multipla, invia la richiesta per una delle seguenti regioni specifiche:

Per gli agenti nelle multiregioni Stati Uniti e Globale, utilizza us-central1.
Per gli agenti nella multi-regione UE, utilizza europe-west4.

Visualizzare l'utilizzo dei token per regione e modello

Per ottenere approfondimenti sul consumo di token LLM in diverse regioni e modelli, segui questi passaggi utilizzando Esplora metriche:

Accedi a Esplora metriche: apri Esplora metriche.
Seleziona la metrica:scegli Conversational Agent LLM tokens quota usage come metrica da analizzare.
Configura l'aggregazione e l'allineamento:
- Imposta la funzione di aggregazione su Sum per ottenere l'utilizzo totale dei token.
- Fai clic su Configure Aligner per attivare il calcolo delle variazioni tra punti dati consecutivi nella serie temporale. Ciò consente di comprendere le tendenze di utilizzo nel tempo.
Definisci le dimensioni di aggregazione:per analizzare l'utilizzo dei token, seleziona location e base_model come dimensioni per l'aggregazione. In questo modo potrai vedere come varia il consumo di token in diverse regioni e modelli.
Funzione di allineamento impostata:scegli Sum come funzione di allineamento per calcolare la variazione totale nell'utilizzo dei token tra punti dati consecutivi.

Richiesta di aumento della quota

Se necessario, puoi richiedere un aggiustamento dell'aumento della quota.

Se utilizzi progetti diversi per gli agenti Dialogflow e per l'autenticazione con i service account, richiedi un aumento della quota per il progetto consumer. Per ulteriori informazioni, vedi Utilizzo di più progetti per Dialogflow ES o Utilizzo di più progetti per Conversational Agents (Dialogflow CX).

Per gli agenti Dialogflow ES, assicurati di eseguire l'upgrade dell'agente alla versione Dialogflow Essentials prima di richiedere un aumento della quota.

Tabella delle quote

I seguenti termini vengono utilizzati per descrivere prezzi e quote:

Richiesta: per richiesta si intende qualsiasi chiamata API al servizio Dialogflow, effettuata sia direttamente tramite API che indirettamente tramite integrazione o console. A seconda dell'attività e della struttura dell'agente, il numero delle richieste necessarie a un utente finale per eseguire un'attività con un agente Dialogflow può variare notevolmente.
Sessione: una sessione è una conversazione tra un utente finale e un agente Dialogflow. Una sessione rimane attiva e i suoi dati archiviati per 30 minuti dopo l'invio dell'ultima richiesta per la sessione. Può essere una sessione di chat o una sessione vocale.
- Sessione di chat: una sessione di chat utilizza solo testo per richieste e risposte.
- Sessione vocale: una sessione vocale utilizza l'audio per richieste, risposte o entrambe.
Progetti consumer e progetti di risorse: se utilizzi più progetti, è possibile che il progetto associato all'autenticazione della richiesta (progetto consumer) non coincida con quello associato all'agente nella richiesta (progetto di risorsa). In questo caso, il progetto consumer viene utilizzato per determinare i prezzi e le quote. Per ulteriori informazioni, vedi Utilizzo di più progetti per Dialogflow ES o Utilizzo di più progetti per Conversational Agents (Dialogflow CX).

Le seguenti tabelle permettono di confrontare le quote delle edizioni in base al tipo di agente. A meno che una funzionalità non sia indicata come inclusa, le quote sono cumulative per tutte le funzionalità utilizzate da una richiesta.

Agente Conversational Agents (Dialogflow CX)

Funzionalità	Conversational Agents (Dialogflow CX) Edition
Testo (include tutte le richieste DetectIntent, StreamingDetectIntent e FulfillIntent che non contengono audio)	1200 richieste al minuto
Input/output audio (riconoscimento vocale, conversione della voce in testo, STT, sintesi vocale, conversione del testo in voce, TTS, telefonia)	600 richieste al minuto
Operazioni di query audio con la voce HD di Chirp 3 (sintesi vocale, conversione del testo in voce, TTS, telefonia)	25 richieste al minuto
Funzionalità generative (playbook, datastore, generatori, fallback generativo)	600.000 token al minuto, vedi quote generative
Gateway di telefonia Dialogflow CX Include input e output audio.	100 minuti totali di conversazione telefonica al minuto‡
Richieste di scrittura in fase di progettazione Ad esempio, chiamate per la creazione o l'aggiornamento di un agente.	60 richieste al minuto
Richieste di lettura in fase di progettazione Ad esempio, chiamate per elencare o recuperare le risorse dell'agente.	300 richieste al minuto
Altre richieste di sessione Ad esempio, impostazione o recupero di entità sessione.	100 richieste al minuto

Simbolo	Descrizione
‡	"Minuti di conversazione telefonica al minuto" è la somma totale del tempo al minuto impiegato da tutti gli utenti che effettuano chiamate tramite il sistema telefonico. Ad esempio, in un periodo di 60 secondi un utente è attivo per 60 secondi, un secondo per 30 secondi e un terzo per 30 secondi. Questo periodo è calcolato come 2 minuti al minuto. Più minuti al minuto consentono a un numero maggiore di utenti di utilizzare il sistema contemporaneamente.

Simbolo

Descrizione

‡

"Minuti di conversazione telefonica al minuto" è la somma totale del tempo al minuto impiegato da tutti gli utenti che effettuano chiamate tramite il sistema telefonico. Ad esempio, in un periodo di 60 secondi un utente è attivo per 60 secondi, un secondo per 30 secondi e un terzo per 30 secondi. Questo periodo è calcolato come 2 minuti al minuto. Più minuti al minuto consentono a un numero maggiore di utenti di utilizzare il sistema contemporaneamente.

Agente Dialogflow ES

Funzionalità	Trial Edition	Essentials Edition
Testo (include tutte le richieste DetectIntent e StreamingDetectIntent che non contengono audio)	180 richieste al minuto ¶	600 richieste al minuto ¶
Input audio (anche denominato riconoscimento vocale, conversione della voce in testo, STT)	100 richieste al minuto † 1000 richieste al giorno † 15.000 richieste al mese † Massimo 60 secondi di durata audio per richiesta †	300 richieste al minuto † Massimo 60 secondi di durata audio per richiesta †
Output audio (anche denominato sintesi vocale, conversione del testo in voce, TTS)	Come per input audio	Come per input audio
Connettori di conoscenza (beta)	10 MB di dimensione massima totale del documento 1000 richieste al mese 100 richieste al giorno	Nessun limite #
Analisi del sentiment	Non disponibile	Nessun limite #
Gateway di telefonia Dialogflow ES Include input e output audio.	Numero verde: non disponibile 3 minuti totali di conversazione telefonica al minuto ‡ 30 minuti di telefono al giorno 500 minuti di telefono al mese Numero di telefono riservato per 30 giorni	100 minuti totali di conversazione telefonica al minuto‡
Mega-agente	1000 richieste al giorno	Nessun limite #
Richieste di scrittura in fase di progettazione Ad esempio, chiamate per la creazione o l'aggiornamento di un agente.	60 richieste al minuto	60 richieste al minuto
Richieste di lettura in fase di progettazione Ad esempio, chiamate per elencare o recuperare le risorse dell'agente.	60 richieste al minuto	60 richieste al minuto
Altre richieste di sessione Ad esempio, impostazione o recupero di entità sessione o aggiornamento/interrogazione del contesto.	100 richieste al minuto	100 richieste al minuto

Simbolo	Descrizione
†	Ogni flusso StreamingDetectIntent è considerato una singola richiesta, anche se può includere più frame di audio `StreamingDetectIntentRequest` all'interno del flusso.
‡	"Minuti di conversazione telefonica al minuto" è la somma totale del tempo al minuto impiegato da tutti gli utenti che effettuano chiamate tramite il sistema telefonico. Ad esempio, in un periodo di 60 secondi un utente è attivo per 60 secondi, un secondo per 30 secondi e un terzo per 30 secondi. Questo periodo è calcolato come 2 minuti al minuto. Più minuti al minuto consentono a un numero maggiore di utenti di utilizzare il sistema contemporaneamente.
#	Le funzionalità contrassegnate come illimitate sono comunque potenzialmente limitate dall'uso di altre funzionalità. Ad esempio, se la tua edizione fornisce una quota illimitata per i connettori di conoscenza, una richiesta di testo che utilizza tali connettori sarà comunque limitata dalla quota per le richieste di testo.
¶	L'input e l'output audio per Assistente Google sono considerati richieste di testo.

Agent Assist

Se utilizzi Assistente agente, si applicano anche le quote elencate nelle schede Agente Conversational Agents (Dialogflow CX) e Agente Dialogflow ES, a seconda del tipo di agente che utilizzi.

Funzionalità	Trial Edition	Essentials Edition
Altre operazioni di conversazione tramite Agent Assist Sono incluse tutte le richieste che gestiscono le conversazioni e i partecipanti.	Non disponibile	300 richieste al minuto
Operazioni di analisi testo/audio tramite Agent Assist Sono incluse tutte le richieste AnalyzeContent o StreamingAnalyzeContent per ogni fase della conversazione. Sono incluse tutte le richieste di questo tipo che coinvolgono testo, sintesi vocale e/o riconoscimento vocale.	Non disponibile	300 richieste al minuto
Sessioni di streaming bidirezionale simultanee Sono incluse tutte le richieste BidiStreamingAnalyzeContent per ogni fase della conversazione. Sono incluse tutte le richieste di questo tipo che coinvolgono la sintesi vocale e/o il riconoscimento vocale.	Non disponibile	50 richieste in parallelo
Richieste di polling per suggerimenti di riepilogo della conversazione di Agent Assist Sono incluse tutte le richieste per ottenere riepiloghi delle conversazioni.	Non disponibile	60 richieste al minuto
Richieste SearchKnowledge di Agent Assist Sono incluse tutte le richieste SearchKnowledge per ogni fase della conversazione.	Non disponibile	60 richieste al minuto

Limiti

I limiti sono vincoli fissi che non possono essere incrementati. Molti campi e risorse presentano limiti di numero, durata o lunghezza, che sono vincoli fissi per l'implementazione del servizio.

Nelle tabelle seguenti sono elencati i limiti più comuni. La documentazione specifica delle funzionalità e la documentazione di riferimento per le API possono specificare limiti aggiuntivi.

Limiti di numero

Agente Conversational Agents (Dialogflow CX)

Descrizione	Limite
Numero massimo di agenti per Google Cloud progetto	1000
Numero massimo di numeri di telefono per progetto (ad eccezione della regione `global`)	5
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione `global`)	5
Numero massimo di flussi per agente	50
Numero massimo di tipi di entità per agente	250
Numero massimo di webhook per agente	100
Numero massimo di ambienti per agente	20
Numero massimo di scenari di test per agente	2000
Numero massimo di log delle modifiche per agente	20.000
Numero massimo di pagine per flusso	250
Numero massimo di gruppi di route per flusso	100
Numero massimo di versioni per flusso	20
Numero massimo di intent per agente	10.000
Numero massimo di intent di riferimento per flusso	2000
Numero massimo di frasi di addestramento per intent e per lingua (eccetto "intent negativo predefinito")	2000
Numero massimo di frasi di addestramento per flusso e per lingua	100.000
Numero massimo di parametri per intent	20
Numero massimo di voci di entità per intent	30.000
Numero massimo di sinonimi per voce di entità	200
Numero massimo di valori di riferimento e sinonimi di entità per agente e per lingua	1.000.000
Numero massimo di parametri per pagina	20
Numero massimo di route per pagina	2000
Numero massimo di gestori di eventi per pagina	100
Numero massimo di route per gruppo di route	2000
Numero massimo di playbook per agente	50
Numero massimo di invocazioni di playbook in un turno conversazionale	3
Numero massimo di chiamate LLM per invocazione del playbook nello stesso turno conversazionale	10
Numero massimo di esempi di playbook per agente	Con la strategia di recupero degli esempi predefinita, il sistema limiterà automaticamente il numero di esempi per rientrare nel limite di token del modello utilizzato, in base alla pertinenza degli esempi per il contesto della sessione.
Numero massimo di versioni per playbook	100
Numero massimo di strumenti per agente	100

Agente Dialogflow ES

Descrizione	Limite
Numero massimo di agenti per regione e per progetto Google Cloud ¶	1
Numero massimo di numeri di telefono per progetto (ad eccezione della regione `global`)	5
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione `global`)	5
Numero massimo di intent	2000
Numero massimo di tipi di entità	250
Numero massimo di frasi di addestramento per intent e per lingua	2000
Numero massimo di frasi di addestramento per agente e per lingua	100.000
Numero massimo di voci di entità	30000
Numero massimo di sinonimi per voce di entità	200
Numero massimo di valori di riferimento e sinonimi di entità per agente e per lingua	1.000.000
Numero massimo di parametri per intent	20
Numero massimo di contesti di input per intent	5
Numero massimo di contesti di output per intent	30
Numero massimo di risposte di testo per intent e per lingua	30
Numero massimo di prompt per parametro e per lingua	30
Numero massimo di ambienti per agente	10
Numero massimo di versioni per agente	1000

Agent Assist

Se utilizzi Agent Assist, si applicano anche i limiti elencati nelle schede Agente Conversational Agents (Dialogflow CX) e Dialogflow ES, a seconda del tipo di agente che utilizzi.

Descrizione	Limite
Numero minimo di conversazioni richieste per l'addestramento del modello	30.000
Numero massimo di modelli addestrati contemporaneamente per progetto	1
Numero massimo di numeri di telefono per progetto (ad eccezione della regione `global`)	5
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione `global`)	5
Numero massimo di ore GPU dei nodi di addestramento al mese	4200
Numero massimo di profili di conversazione	100

Limiti di durata

Agente Conversational Agents (Dialogflow CX)

Descrizione	Limite
Timeout massimo per webhook	30 secondi
Durata massima dell'input audio	120 secondi

Agente Dialogflow ES

Descrizione	Limite
Timeout massimo del webhook	5 secondi
Durata massima per chiamate telefoniche	3,5 ore

Limiti di lunghezza

Agente Conversational Agents (Dialogflow CX)

Descrizione	Limite
Lunghezza massima della frase di addestramento	768 caratteri
Lunghezza massima della risposta testuale	4000 caratteri
Lunghezza massima dell'input di testo per il rilevamento dell'intent corrispondente a intent non generativi o parametri	256 caratteri

Agente Dialogflow ES

Descrizione	Limite
Lunghezza minima nome agente	1 carattere
Lunghezza massima nome agente	150 caratteri
Lunghezza massima descrizione agente	500 caratteri
Lunghezza massima del nome dell'intent	100 caratteri
Lunghezza massima del tipo di entità	30 caratteri
Lunghezza massima della frase di addestramento	768 caratteri
Lunghezza massima del nome dell'azione	250 caratteri
Lunghezza massima del nome del contesto	250 caratteri
Lunghezza massima del valore della voce	512 caratteri
Lunghezza massima del nome del parametro	30 caratteri
Lunghezza massima della risposta testuale	4000 caratteri
Lunghezza massima dell'input di testo per il rilevamento dell'intent*	256 caratteri
Lunghezza massima del nome evento	150 caratteri

Limiti di dimensioni

Agente Conversational Agents (Dialogflow CX)

Descrizione	Limite
Dimensioni massime della richiesta di sintesi vocale	Consulta i limiti dei contenuti dell'API TTS
Dimensioni massime delle specifiche dello strumento	20 kB

Agente Dialogflow ES

Descrizione	Limite
Dimensione massima dell'agente (contenuti non compressi) per l'importazione/il ripristino dell'agente	50 MB
Dimensioni massime della richiesta di sintesi vocale	Consulta i limiti dei contenuti dell'API TTS