Questo documento contiene le quote e i limiti più comuni per l'uso di Dialogflow. Di seguito sono riportate informazioni su come trovare un elenco completo di quote e limiti. Ci riserviamo il diritto di modificare questi vincoli e aggiorneremo la presente pagina ogniqualvolta effettueremo tali modifiche.
Quote
Le quote sono vincoli predefiniti applicati al tuo progetto. Quando utilizzi le funzionalità di IA generativa, ogni combinazione di modello e regione ha la propria quota generativa. Se utilizzi un'edizione a pagamento, puoi richiedere un aumento della quota. Le quote hanno lo scopo di limitare il carico di servizio per cliente, evitando di sovraccaricare i singoli servizi e di addebitare al cliente un utilizzo di risorse imprevisto.
Le quote di Dialogflow variano a seconda dell'edizione dell'agente. Le quote si applicano ai singoli progetti e vengono condivise fra tutti gli indirizzi IP e le applicazioni che utilizzano un progetto.
Dettagli sui limiti di tempo delle quote:
- Le quote mensili vengono reintegrate il primo giorno di ogni mese alle ore 00:00 del fuso orario del Pacifico.
- Le quote giornaliere vengono reintegrate giornalmente alle ore 00:00 del fuso orario del Pacifico. Quando il passaggio all'ora legale nel fuso orario del Pacifico aumenta la durata di un giorno, verrà concesso un bonus di quota proporzionale. Tuttavia, non è prevista alcuna deduzione equivalente nel caso di un giorno più breve dovuto al passaggio all'ora legale.
- Le quote al minuto vengono aggiornate ogni 60 secondi allo scoccare del minuto.
Le quote elencate nella tabella delle quote sono quelle più comuni. Per esaminare tutte le quote, visita la pagina relativa alle quote di Dialogflow nella console diGoogle Cloud .
Quote generative
Quando l'agente utilizza le funzionalità generative di Conversational Agents (Dialogflow CX), ogni combinazione di modello e regione ha quote uniche.
Identificatore quota
La quota ConversationalAgentLlmTokenConsumption
è una quota regionale
che monitora l'utilizzo dei token per i modelli linguistici di grandi dimensioni (LLM) in Conversational Agents (Dialogflow CX).
Questa quota viene misurata in base a diversi modelli di base LLM
e attualmente supporta i seguenti modelli:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
La quota ConversationalAgentLlmTokenConsumption
monitora l'utilizzo dei token LLM
nelle seguenti funzionalità di Conversational Agents (Dialogflow CX):
- Generatori
- Generative Fallback
- Playbook
- Datastore
Il limite predefinito per la quota ConversationalAgentLlmTokenConsumption
è di 600.000 token al minuto.
Richiesta di aumento della quota multiregionale
Se devi richiedere un aumento della quota per una regione multipla, invia la richiesta per una delle seguenti regioni specifiche:
- Per gli agenti nelle multiregioni Stati Uniti e Globale, utilizza us-central1.
- Per gli agenti nella multi-regione UE, utilizza europe-west4.
Visualizzare l'utilizzo dei token per regione e modello
Per ottenere approfondimenti sul consumo di token LLM in diverse regioni e modelli, segui questi passaggi utilizzando Esplora metriche:
- Accedi a Esplora metriche: apri Esplora metriche.
- Seleziona la metrica:scegli
Conversational Agent LLM tokens quota usage
come metrica da analizzare. - Configura l'aggregazione e l'allineamento:
- Imposta la funzione di aggregazione su
Sum
per ottenere l'utilizzo totale dei token. - Fai clic su
Configure Aligner
per attivare il calcolo delle variazioni tra punti dati consecutivi nella serie temporale. Ciò consente di comprendere le tendenze di utilizzo nel tempo.
- Imposta la funzione di aggregazione su
- Definisci le dimensioni di aggregazione:per analizzare l'utilizzo dei token, seleziona
location
ebase_model
come dimensioni per l'aggregazione. In questo modo potrai vedere come varia il consumo di token in diverse regioni e modelli. - Funzione di allineamento impostata:scegli
Sum
come funzione di allineamento per calcolare la variazione totale nell'utilizzo dei token tra punti dati consecutivi.
Richiesta di aumento della quota
Se necessario, puoi richiedere un aggiustamento dell'aumento della quota.
Se utilizzi progetti diversi per gli agenti Dialogflow e per l'autenticazione con i service account, richiedi un aumento della quota per il progetto consumer. Per ulteriori informazioni, vedi Utilizzo di più progetti per Dialogflow ES o Utilizzo di più progetti per Conversational Agents (Dialogflow CX).
Per gli agenti Dialogflow ES, assicurati di eseguire l'upgrade dell'agente alla versione Dialogflow Essentials prima di richiedere un aumento della quota.
Tabella delle quote
I seguenti termini vengono utilizzati per descrivere prezzi e quote:
- Richiesta: per richiesta si intende qualsiasi chiamata API al servizio Dialogflow, effettuata sia direttamente tramite API che indirettamente tramite integrazione o console. A seconda dell'attività e della struttura dell'agente, il numero delle richieste necessarie a un utente finale per eseguire un'attività con un agente Dialogflow può variare notevolmente.
- Sessione:
una sessione è una conversazione tra un utente finale e un agente Dialogflow.
Una sessione rimane attiva e i suoi dati archiviati per 30 minuti
dopo l'invio dell'ultima richiesta per la sessione.
Può essere una sessione di chat o una sessione vocale.
- Sessione di chat: una sessione di chat utilizza solo testo per richieste e risposte.
- Sessione vocale: una sessione vocale utilizza l'audio per richieste, risposte o entrambe.
- Progetti consumer e progetti di risorse: se utilizzi più progetti, è possibile che il progetto associato all'autenticazione della richiesta (progetto consumer) non coincida con quello associato all'agente nella richiesta (progetto di risorsa). In questo caso, il progetto consumer viene utilizzato per determinare i prezzi e le quote. Per ulteriori informazioni, vedi Utilizzo di più progetti per Dialogflow ES o Utilizzo di più progetti per Conversational Agents (Dialogflow CX).
Le seguenti tabelle permettono di confrontare le quote delle edizioni in base al tipo di agente. A meno che una funzionalità non sia indicata come inclusa, le quote sono cumulative per tutte le funzionalità utilizzate da una richiesta.
Agente Conversational Agents (Dialogflow CX)
Funzionalità | Conversational Agents (Dialogflow CX) Edition |
---|---|
Testo (include tutte le richieste DetectIntent, StreamingDetectIntent e FulfillIntent che non contengono audio) |
1200 richieste al minuto |
Input/output audio (riconoscimento vocale, conversione della voce in testo, STT, sintesi vocale, conversione del testo in voce, TTS, telefonia) |
600 richieste al minuto |
Operazioni di query audio con la voce HD di Chirp 3 (sintesi vocale, conversione del testo in voce, TTS, telefonia) |
25 richieste al minuto |
Funzionalità generative (playbook, datastore, generatori, fallback generativo) |
600.000 token al minuto, vedi quote generative |
Gateway di telefonia Dialogflow CX Include input e output audio. |
100 minuti totali di conversazione telefonica al minuto‡ |
Richieste di scrittura in fase di progettazione Ad esempio, chiamate per la creazione o l'aggiornamento di un agente. |
60 richieste al minuto |
Richieste di lettura in fase di progettazione Ad esempio, chiamate per elencare o recuperare le risorse dell'agente. |
300 richieste al minuto |
Altre richieste di sessione Ad esempio, impostazione o recupero di entità sessione. |
100 richieste al minuto |
Simbolo | Descrizione |
---|---|
‡ | "Minuti di conversazione telefonica al minuto" è la somma totale del tempo al minuto impiegato da tutti gli utenti che effettuano chiamate tramite il sistema telefonico. Ad esempio, in un periodo di 60 secondi un utente è attivo per 60 secondi, un secondo per 30 secondi e un terzo per 30 secondi. Questo periodo è calcolato come 2 minuti al minuto. Più minuti al minuto consentono a un numero maggiore di utenti di utilizzare il sistema contemporaneamente. |
Agente Dialogflow ES
Funzionalità | Trial Edition | Essentials Edition |
---|---|---|
Testo (include tutte le richieste DetectIntent e StreamingDetectIntent che non contengono audio) |
180 richieste al minuto ¶ | 600 richieste al minuto ¶ |
Input audio (anche denominato riconoscimento vocale, conversione della voce in testo, STT) |
100 richieste al minuto † 1000 richieste al giorno † 15.000 richieste al mese † Massimo 60 secondi di durata audio per richiesta † |
300 richieste al minuto † Massimo 60 secondi di durata audio per richiesta † |
Output audio (anche denominato sintesi vocale, conversione del testo in voce, TTS) |
Come per input audio | Come per input audio |
Connettori di conoscenza (beta) | 10 MB di dimensione massima totale del documento 1000 richieste al mese 100 richieste al giorno |
Nessun limite # |
Analisi del sentiment | Non disponibile | Nessun limite # |
Gateway di telefonia Dialogflow ES Include input e output audio. |
Numero verde: non disponibile 3 minuti totali di conversazione telefonica al minuto ‡ 30 minuti di telefono al giorno 500 minuti di telefono al mese Numero di telefono riservato per 30 giorni |
100 minuti totali di conversazione telefonica al minuto‡ |
Mega-agente | 1000 richieste al giorno | Nessun limite # |
Richieste di scrittura in fase di progettazione Ad esempio, chiamate per la creazione o l'aggiornamento di un agente. |
60 richieste al minuto | 60 richieste al minuto |
Richieste di lettura in fase di progettazione Ad esempio, chiamate per elencare o recuperare le risorse dell'agente. |
60 richieste al minuto | 60 richieste al minuto |
Altre richieste di sessione Ad esempio, impostazione o recupero di entità sessione o aggiornamento/interrogazione del contesto. |
100 richieste al minuto | 100 richieste al minuto |
Simbolo | Descrizione |
---|---|
† | Ogni flusso StreamingDetectIntent è considerato una singola richiesta, anche se può includere più frame di audio StreamingDetectIntentRequest all'interno del flusso. |
‡ | "Minuti di conversazione telefonica al minuto" è la somma totale del tempo al minuto impiegato da tutti gli utenti che effettuano chiamate tramite il sistema telefonico. Ad esempio, in un periodo di 60 secondi un utente è attivo per 60 secondi, un secondo per 30 secondi e un terzo per 30 secondi. Questo periodo è calcolato come 2 minuti al minuto. Più minuti al minuto consentono a un numero maggiore di utenti di utilizzare il sistema contemporaneamente. |
# | Le funzionalità contrassegnate come illimitate sono comunque potenzialmente limitate dall'uso di altre funzionalità. Ad esempio, se la tua edizione fornisce una quota illimitata per i connettori di conoscenza, una richiesta di testo che utilizza tali connettori sarà comunque limitata dalla quota per le richieste di testo. |
¶ | L'input e l'output audio per Assistente Google sono considerati richieste di testo. |
Agent Assist
Se utilizzi Assistente agente, si applicano anche le quote elencate nelle schede Agente Conversational Agents (Dialogflow CX) e Agente Dialogflow ES, a seconda del tipo di agente che utilizzi.
Funzionalità | Trial Edition | Essentials Edition |
---|---|---|
Altre operazioni di conversazione tramite Agent Assist Sono incluse tutte le richieste che gestiscono le conversazioni e i partecipanti. |
Non disponibile | 300 richieste al minuto |
Operazioni di analisi testo/audio tramite Agent Assist Sono incluse tutte le richieste AnalyzeContent o StreamingAnalyzeContent per ogni fase della conversazione. Sono incluse tutte le richieste di questo tipo che coinvolgono testo, sintesi vocale e/o riconoscimento vocale. |
Non disponibile | 300 richieste al minuto |
Richieste di polling per suggerimenti di riepilogo della conversazione di Agent Assist Sono incluse tutte le richieste per ottenere riepiloghi delle conversazioni. |
Non disponibile | 60 richieste al minuto |
Richieste SearchKnowledge di Agent Assist Sono incluse tutte le richieste SearchKnowledge per ogni fase della conversazione. |
Non disponibile | 60 richieste al minuto |
Limiti
I limiti sono vincoli fissi che non possono essere incrementati. Molti campi e risorse presentano limiti di numero, durata o lunghezza, che sono vincoli fissi per l'implementazione del servizio.
Nelle tabelle seguenti sono elencati i limiti più comuni. La documentazione specifica delle funzionalità e la documentazione di riferimento per le API possono specificare limiti aggiuntivi.
Limiti di numero
Agente Conversational Agents (Dialogflow CX)
Descrizione | Limite |
---|---|
Numero massimo di agenti per Google Cloud progetto | 1000 |
Numero massimo di numeri di telefono per progetto (ad eccezione della regione global ) |
5 |
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione global ) |
5 |
Numero massimo di flussi per agente | 50 |
Numero massimo di tipi di entità per agente | 250 |
Numero massimo di webhook per agente | 100 |
Numero massimo di ambienti per agente | 20 |
Numero massimo di scenari di test per agente | 2000 |
Numero massimo di log delle modifiche per agente | 20.000 |
Numero massimo di pagine per flusso | 250 |
Numero massimo di gruppi di route per flusso | 100 |
Numero massimo di versioni per flusso | 20 |
Numero massimo di intent per agente | 10.000 |
Numero massimo di intent di riferimento per flusso | 2000 |
Numero massimo di frasi di addestramento per intent e per lingua (eccetto "intent negativo predefinito") | 2000 |
Numero massimo di frasi di addestramento per flusso e per lingua | 100.000 |
Numero massimo di parametri per intent | 20 |
Numero massimo di voci di entità per intent | 30.000 |
Numero massimo di sinonimi per voce di entità | 200 |
Numero massimo di valori di riferimento e sinonimi di entità per agente e per lingua | 1.000.000 |
Numero massimo di parametri per pagina | 20 |
Numero massimo di route per pagina | 2000 |
Numero massimo di gestori di eventi per pagina | 100 |
Numero massimo di route per gruppo di route | 2000 |
Numero massimo di playbook per agente | 50 |
Numero massimo di invocazioni di playbook in un turno conversazionale | 3 |
Numero massimo di chiamate LLM per invocazione del playbook nello stesso turno conversazionale | 10 |
Numero massimo di esempi di playbook per agente | Con la strategia di recupero degli esempi predefinita, il sistema limiterà automaticamente il numero di esempi per rientrare nel limite di token del modello utilizzato, in base alla pertinenza degli esempi per il contesto della sessione. |
Numero massimo di versioni per playbook | 100 |
Numero massimo di strumenti per agente | 100 |
Agente Dialogflow ES
Descrizione | Limite |
---|---|
Numero massimo di agenti per regione e per progetto Google Cloud ¶ | 1 |
Numero massimo di numeri di telefono per progetto (ad eccezione della regione global ) |
5 |
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione global ) |
5 |
Numero massimo di intent | 2000 |
Numero massimo di tipi di entità | 250 |
Numero massimo di frasi di addestramento per intent e per lingua | 2000 |
Numero massimo di frasi di addestramento per agente e per lingua | 100.000 |
Numero massimo di voci di entità | 30000 |
Numero massimo di sinonimi per voce di entità | 200 |
Numero massimo di valori di riferimento e sinonimi di entità per agente e per lingua | 1.000.000 |
Numero massimo di parametri per intent | 20 |
Numero massimo di contesti di input per intent | 5 |
Numero massimo di contesti di output per intent | 30 |
Numero massimo di risposte di testo per intent e per lingua | 30 |
Numero massimo di prompt per parametro e per lingua | 30 |
Numero massimo di ambienti per agente | 10 |
Numero massimo di versioni per agente | 1000 |
¶ | Il numero massimo di agenti per account dipende dal numero di progetti Google che puoi creare nel tuo account. Scopri come richiedere altri progetti. |
Agent Assist
Se utilizzi Agent Assist, si applicano anche i limiti elencati nelle schede Agente Conversational Agents (Dialogflow CX) e Dialogflow ES, a seconda del tipo di agente che utilizzi.
Descrizione | Limite |
---|---|
Numero minimo di conversazioni richieste per l'addestramento del modello | 30.000 |
Numero massimo di modelli addestrati contemporaneamente per progetto | 1 |
Numero massimo di numeri di telefono per progetto (ad eccezione della regione global ) |
5 |
Numero massimo di numeri di telefono per progetto per regione (ad eccezione della regione global ) |
5 |
Numero massimo di ore GPU dei nodi di addestramento al mese | 4200 |
Numero massimo di profili di conversazione | 100 |
Limiti di durata
Agente Conversational Agents (Dialogflow CX)
Descrizione | Limite |
---|---|
Timeout massimo per webhook | 30 secondi |
Durata massima dell'input audio | 120 secondi |
Agente Dialogflow ES
Descrizione | Limite |
---|---|
Timeout massimo del webhook | 5 secondi |
Durata massima per chiamate telefoniche | 3,5 ore |
Limiti di lunghezza
Agente Conversational Agents (Dialogflow CX)
Descrizione | Limite |
---|---|
Lunghezza massima della frase di addestramento | 768 caratteri |
Lunghezza massima della risposta testuale | 4000 caratteri |
Lunghezza massima dell'input di testo per il rilevamento dell'intent corrispondente a intent non generativi o parametri | 256 caratteri |
Agente Dialogflow ES
Descrizione | Limite |
---|---|
Lunghezza minima nome agente | 1 carattere |
Lunghezza massima nome agente | 150 caratteri |
Lunghezza massima descrizione agente | 500 caratteri |
Lunghezza massima del nome dell'intent | 100 caratteri |
Lunghezza massima del tipo di entità | 30 caratteri |
Lunghezza massima della frase di addestramento | 768 caratteri |
Lunghezza massima del nome dell'azione | 250 caratteri |
Lunghezza massima del nome del contesto | 250 caratteri |
Lunghezza massima del valore della voce | 512 caratteri |
Lunghezza massima del nome del parametro | 30 caratteri |
Lunghezza massima della risposta testuale | 4000 caratteri |
Lunghezza massima dell'input di testo per il rilevamento dell'intent* | 256 caratteri |
Lunghezza massima del nome evento | 150 caratteri |
* | Questo limite viene applicato dal servizio Dialogflow. Se utilizzi un'integrazione, la piattaforma di integrazione può presentare un limite inferiore. Verifica i dettagli relativi all'integrazione in uso. |
Limiti di dimensioni
Agente Conversational Agents (Dialogflow CX)
Descrizione | Limite |
---|---|
Dimensioni massime della richiesta di sintesi vocale | Consulta i limiti dei contenuti dell'API TTS. |
Dimensioni massime delle specifiche dello strumento | 20 kB |
Agente Dialogflow ES
Descrizione | Limite |
---|---|
Dimensione massima dell'agente (contenuti non compressi) per l'importazione/il ripristino dell'agente | 50 MB |
Dimensioni massime della richiesta di sintesi vocale | Consulta i limiti dei contenuti dell'API TTS. |