Este documento contém as quotas e os limites encontrados com frequência para a utilização do Dialogflow. Abaixo, encontra informações sobre como encontrar uma lista completa de quotas e limites. Reservamo-nos o direito de alterar estas restrições, e esta página será atualizada para refletir quaisquer alterações.
Quotas
As quotas são restrições predefinidas aplicadas ao seu projeto. Quando usa funcionalidades generativas, cada combinação de modelo e região tem a sua própria quota generativa. Se estiver a usar uma edição paga, pode pedir um aumento da quota. O objetivo das quotas é limitar o carregamento do serviço por cliente, o que protege um serviço contra sobrecarga e um cliente contra uma utilização inesperada de recursos.
As quotas do Dialogflow variam consoante a edição do seu agente. As quotas aplicam-se a cada projeto e são partilhadas por todas as aplicações e endereços IP que usam um projeto.
Detalhes do limite de tempo da quota:
- As quotas mensais são repostas no dia 1 de cada mês às 00:00 (Hora do Pacífico).
- As quotas diárias são repostas diariamente às 00:00 (Hora do Pacífico). Quando uma transição do horário de verão do fuso horário do Pacífico aumenta a duração de um dia, é concedido um bónus de quota proporcional. No entanto, não existe uma dedução equivalente quando ocorre um dia mais curto devido à transição para a hora de verão.
- As quotas por minuto são atualizadas a cada 60 segundos.
As quotas apresentadas na tabela de quotas são as quotas encontradas com frequência. Para rever todas as quotas, consulte a página Google Cloud Quotas do Dialogflow na consola.
Quotas generativas
Quando o seu agente usa agentes conversacionais (Dialogflow CX) funcionalidades generativas, cada combinação de modelo e região tem quotas únicas.
Identificador de quota
A quota ConversationalAgentLlmTokenConsumption é uma quota regional que acompanha a utilização de tokens para grandes modelos de linguagem (GMLs) em agentes conversacionais (Dialogflow CX).
Esta quota é medida em diferentes modelos base de MDIs/CEs e, atualmente, suporta os seguintes modelos:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
A quota ConversationalAgentLlmTokenConsumption monitoriza a utilização de tokens do MDG em todas as seguintes funcionalidades de agentes conversacionais (Dialogflow CX):
- Geradores
- Alternativa generativa
- Guia interativo
- Armazenamento de dados
O limite predefinido para a quota é de 600 000 tokens por minuto.ConversationalAgentLlmTokenConsumption
Pedido de aumento da quota em várias regiões
Se precisar de pedir um aumento da quota para uma região múltipla, envie o seu pedido para uma das seguintes regiões específicas:
- Para agentes nas multirregiões US e Global, use us-central1.
- Para agentes na multirregião da UE, use europe-west4.
Visualize a utilização de tokens por região e modelo
Para obter estatísticas sobre o consumo de tokens do MDG em diferentes regiões e modelos, siga estes passos através do Explorador de métricas:
- Aceda ao Metrics Explorer: abra o Metrics Explorer.
- Selecione a métrica:
escolha
Conversational Agent LLM tokens quota usagecomo a métrica que quer analisar. - Configure a agregação e o alinhador:
- Defina a função de agregação como
Sumpara obter a utilização total de tokens. - Clique em
Configure Alignerpara ativar o cálculo das alterações entre pontos de dados consecutivos na sua série cronológica. Isto ajuda a compreender as tendências de utilização ao longo do tempo.
- Defina a função de agregação como
- Defina as dimensões de agregação:
para discriminar a utilização de tokens, selecione
locationebase_modelcomo as dimensões de agregação. Isto permite-lhe ver como o consumo de tokens varia em diferentes regiões e modelos. - Definir função de alinhamento:
escolha
Sumcomo função de alinhamento para calcular a alteração total na utilização de tokens entre pontos de dados consecutivos.
Pedido de aumento da quota
Se necessário, pode pedir um ajuste do aumento da quota.
Se usar projetos diferentes para agentes do Dialogflow e para autenticação com contas de serviço, peça um aumento da quota para o projeto de consumidor. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).
Para agentes do Dialogflow ES, certifique-se de que atualiza o agente para a edição do Dialogflow Essentials antes de pedir um aumento da quota.
Tabela de quotas
Os seguintes termos são usados para descrever os preços e as quotas:
- Pedido: Um pedido é definido como qualquer chamada API para o serviço Dialogflow, seja direta com a utilização da API ou indireta com a utilização da integração ou da consola. Consoante a tarefa e a conceção do agente, o número de pedidos necessários para um utilizador final realizar uma tarefa com um agente do Dialogflow pode variar muito.
- Sessão:
Uma sessão é uma conversa entre um utilizador final e um agente do Dialogflow.
Uma sessão permanece ativa e os respetivos dados são armazenados durante 30 minutos após o envio do último pedido para a sessão.
Uma sessão pode ser uma sessão de chat ou uma sessão de voz.
- Sessão de chat: uma sessão de chat usa apenas texto para pedidos e respostas.
- Sessão de voz: Uma sessão de voz usa áudio para pedidos, respostas ou ambos.
- Projetos de consumidor e projetos de recursos: se usar vários projetos, é possível que o projeto associado à autenticação do seu pedido (projeto de consumidor) não seja o mesmo projeto associado ao agente no pedido (projeto de recursos). Neste caso, o projeto de consumidor é usado para determinar os preços e as quotas. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).
As tabelas seguintes apresentam uma comparação de quotas para edições por tipo de agente. Salvo indicação em contrário, as quotas são cumulativas para todas as funcionalidades usadas por um pedido.
Agente de agentes conversacionais (Dialogflow CX)
| Funcionalidade | Edição de agentes de conversação (Dialogflow CX) |
|---|---|
|
Texto (inclui todos os pedidos DetectIntent, StreamingDetectIntent e FulfillIntent que não contêm áudio) |
1200 pedidos por minuto |
|
Entrada/saída de áudio (reconhecimento de voz, voz para texto, STT, síntese de voz, conversão de texto em voz, TTS, telefonia) |
600 pedidos por minuto |
|
Operações de consulta de áudio com a voz HD do Chirp3 (síntese de voz, conversão de texto em voz, TTS, telefonia) |
25 pedidos por minuto |
|
Funcionalidades generativas (guias interativos, repositórios de dados, geradores, alternativa generativa) |
600 000 tokens por minuto. Consulte as quotas generativas |
|
Dialogflow CX Phone Gateway Inclui entrada e saída de áudio. |
100 minutos de chamadas no telemóvel por minuto ‡ |
|
Pedidos de escrita em tempo de conceção Por exemplo, chamadas para criar ou atualizar um agente. |
60 pedidos por minuto |
|
Pedidos de leitura no momento da conceção Por exemplo, chamadas para listar ou obter recursos de agentes. |
300 pedidos por minuto |
|
Outros pedidos de sessões Por exemplo, definir ou obter entidades de sessões. |
100 pedidos por minuto |
| Símbolo | Descrição |
|---|---|
| ‡ | "Minutos de telefone por minuto" é a soma total do tempo por minuto usado por todos os utilizadores que fazem chamadas através do sistema telefónico. Por exemplo: num período de 60 segundos, um utilizador está online durante 60 segundos, um segundo durante 30 segundos e um terceiro durante 30 segundos. É calculado como 2 minutos por minuto. Mais minutos por minuto permitem que mais utilizadores usem o sistema em simultâneo. |
Agente do Dialogflow ES
| Funcionalidade | Edição de avaliação | Edição Essentials |
|---|---|---|
|
Texto (inclui todos os pedidos DetectIntent e StreamingDetectIntent que não contêm áudio) |
180 pedidos por minuto ¶ | 600 pedidos por minuto ¶ |
|
Entrada de áudio (também conhecida como reconhecimento de voz, voz para texto, STT) |
100 pedidos por minuto † 1000 pedidos por dia † 15 000 pedidos por mês † Máximo de 60 segundos de duração do áudio por pedido † |
300 pedidos por minuto † Duração máxima de 60 segundos de áudio por pedido † |
|
Saída de áudio (também conhecida como síntese de voz, conversão de texto em voz, TTS) |
Igual à entrada de áudio | Igual à entrada de áudio |
| Conetores de conhecimento (beta) | Tamanho máximo total do documento de 10 MB 1000 pedidos por mês 100 pedidos por dia |
Número ilimitado |
| Análise de sensação geral | Não disponível | Número ilimitado |
|
Dialogflow ES phone gateway Inclui entrada e saída de áudio. |
Número gratuito: não disponível 3 minutos de telefone no total por minuto ‡ 30 minutos de telefone por dia 500 minutos de telefone por mês Número de telefone reservado durante 30 dias |
100 minutos de chamadas no telemóvel por minuto ‡ |
| Mega-agente | 1000 pedidos por dia | Número ilimitado |
|
Pedidos de escrita em tempo de conceção Por exemplo, chamadas para criar ou atualizar um agente. |
60 pedidos por minuto | 60 pedidos por minuto |
|
Pedidos de leitura no momento da conceção Por exemplo, chamadas para listar ou obter recursos de agentes. |
60 pedidos por minuto | 60 pedidos por minuto |
|
Outros pedidos de sessão Por exemplo, definir ou obter entidades de sessão ou atualizar/consultar o contexto. |
100 pedidos por minuto | 100 pedidos por minuto |
| Símbolo | Descrição |
|---|---|
| † | Cada stream StreamingDetectIntent é considerada um único pedido, mesmo que a stream possa incluir vários frames de StreamingDetectIntentRequest áudio na stream. |
| ‡ | "Minutos de telefone por minuto" é a soma total do tempo por minuto usado por todos os utilizadores que fazem chamadas através do sistema telefónico. Por exemplo: num período de 60 segundos, um utilizador está online durante 60 segundos, um segundo durante 30 segundos e um terceiro durante 30 segundos. É calculado como 2 minutos por minuto. Mais minutos por minuto permitem que mais utilizadores usem o sistema em simultâneo. |
| # | As funcionalidades marcadas como ilimitadas continuam potencialmente limitadas pela utilização de outras funcionalidades. Por exemplo, se a sua edição fornecer uma quota ilimitada para conectores de conhecimentos, um pedido de texto que use conectores de conhecimentos continua limitado pela quota de pedidos de texto. |
| ¶ | A entrada e a saída de áudio do Assistente Google são consideradas um pedido de texto. |
Agent Assist
Se estiver a usar o Agent Assist, as quotas indicadas nos separadores Agente de agentes conversacionais (Dialogflow CX) e Agente do Dialogflow ES também se aplicam, consoante o tipo de agente que estiver a usar.
| Funcionalidade | Edição de avaliação | Edição Essentials |
|---|---|---|
|
Agent Assist conversation other operations Inclui todos os pedidos que gerem conversas e participantes. |
Não disponível | 300 pedidos por minuto |
|
O Agent Assist analisa operações de texto/áudio Inclui todos os pedidos AnalyzeContent ou StreamingAnalyzeContent para qualquer fase da conversa. Isto inclui todos os pedidos que envolvam texto, conversão de texto em voz e/ou reconhecimento de voz. |
Não disponível | 300 pedidos por minuto |
|
Sessões de streaming bidirecional concorrentes Inclui todos os pedidos BidiStreamingAnalyzeContent para qualquer fase de conversa. Isto inclui todos os pedidos que envolvam a síntese de voz e/ou o reconhecimento de voz. |
Não disponível | 50 pedidos simultâneos |
|
Pedidos de sondagem de sugestões de resumo de conversas do Agent Assist Inclui todos os pedidos para obter resumos de conversas. |
Não disponível | 60 pedidos por minuto |
|
Pedidos SearchKnowledge do Agent Assist Inclui todos os pedidos SearchKnowledge para qualquer fase da conversa. |
Não disponível | 60 pedidos por minuto |
Limites
Os limites são restrições fixas que não podem ser aumentadas. Muitos recursos e campos têm limitações de contagem, duração ou comprimento, que são restrições fixas para a implementação do serviço.
As tabelas seguintes apresentam os limites encontrados com frequência. A documentação específica das funcionalidades e a documentação de referência da API podem fornecer limites adicionais.
Limites de contagem
Agente de agentes conversacionais (Dialogflow CX)
| Descrição | Limite |
|---|---|
| Número máximo de agentes por Google Cloud projeto | 1000 |
Número máximo de números de telefone por projeto (exceto para a região global) |
5 |
Número máximo de números de telefone por projeto por região (exceto para a região global) |
5 |
| Número máximo de fluxos por agente | 50 |
| Número máximo de tipos de entidades por agente | 250 |
| Número máximo de webhooks por agente | 100 |
| Número máximo de ambientes por agente | 20 |
| Número máximo de exemplos de teste por agente | 2000 |
| Número máximo de registos de alterações por agente | 20 000 |
| Número máximo de páginas por fluxo | 250 |
| Número máximo de grupos de rotas por fluxo | 100 |
| Número máximo de versões por fluxo | 20 |
| Número máximo de intenções por agente | 10 000 |
| Número máximo de intenções referenciadas por fluxo | 2000 |
| Número máximo de expressões de preparação por intenção e por idioma (exceto "Intenção negativa predefinida") | 2000 |
| Número máximo de expressões de preparação por fluxo e por idioma | 100 000 |
| Número máximo de parâmetros por intenção | 20 |
| Número máximo de entradas de entidades por entidade | 30 000 |
| Número máximo de sinónimos de entidades por entrada de entidade | 200 |
| Número máximo de valores de referência de entidades e sinónimos por agente e por idioma | 1 000 000 |
| Número máximo de parâmetros por página | 20 |
| Número máximo de trajetos por página | 2000 |
| Número máximo de controladores de eventos por página | 100 |
| Número máximo de rotas por grupo de rotas | 2000 |
| Número máximo de manuais de soluções por agente | 50 |
| Número máximo de invocações de manuais num turno de conversa | 3 |
| Número máximo de chamadas de MDG por invocação de guião no mesmo turno de conversa | 10 |
| Número máximo de exemplos de guias por agente | Com a estratégia de obtenção de exemplos predefinida, o sistema limita automaticamente o número de exemplos para se ajustar ao limite de tokens do modelo que está a ser usado, com base na relevância dos exemplos para o contexto da sessão. |
| Número máximo de versões por manual de soluções | 100 |
| Número máximo de ferramentas por agente | 100 |
Agente do Dialogflow ES
| Descrição | Limite |
|---|---|
| Número máximo de agentes por região e por projeto do Google Cloud ¶ | 1 |
Número máximo de números de telefone por projeto (exceto para a região global) |
5 |
Número máximo de números de telefone por projeto por região (exceto para a região global) |
5 |
| Número máximo de intenções | 2000 |
| Número máximo de tipos de entidades | 250 |
| Número máximo de expressões de preparação por intenção e por idioma | 2000 |
| Número máximo de expressões de preparação por agente e por idioma | 100 000 |
| Número máximo de entradas de entidades | 30000 |
| Número máximo de sinónimos de entidades por entrada de entidade | 200 |
| Número máximo de valores de referência de entidades e sinónimos por agente e por idioma | 1 000 000 |
| Número máximo de parâmetros por intenção | 20 |
| Número máximo de contextos de entrada por intenção | 5 |
| Número máximo de contextos de saída por intenção | 30 |
| Número máximo de respostas de texto por intenção e por idioma | 30 |
| Número máximo de comandos por parâmetro e por idioma | 30 |
| Número máximo de ambientes por agente | 10 |
| Número máximo de versões por agente | 1000 |
| ¶ | O número máximo de agentes por conta depende do número de projetos Google que pode criar na sua conta. Veja como pedir mais projetos. |
Agent Assist
Se estiver a usar o Agent Assist, os limites indicados nos separadores Agentes conversacionais (Dialogflow CX) Agente e Dialogflow ES também se aplicam consoante o tipo de agente que estiver a usar.
| Descrição | Limite |
|---|---|
| Número mínimo de conversas necessárias para a preparação do modelo | 30 000 |
| Número máximo de modelos preparados em simultâneo por projeto | 1 |
Número máximo de números de telefone por projeto (exceto para a região global) |
5 |
Número máximo de números de telefone por projeto por região (exceto para a região global) |
5 |
| Número máximo de horas de GPU do nó de preparação por mês | 4200 |
| Número máximo de perfis de conversa | 100 |
Limites de duração
Agente de agentes conversacionais (Dialogflow CX)
| Descrição | Limite |
|---|---|
| Limite de tempo máximo por webhook | 30 segundos |
| Duração máxima da entrada de áudio | 120 segundos |
Agente do Dialogflow ES
| Descrição | Limite |
|---|---|
| Limite de tempo máximo do webhook | 5 segundos |
| Duração máxima da chamada de telefonia | 3,5 horas |
Limites de comprimento
Agente de agentes conversacionais (Dialogflow CX)
| Descrição | Limite |
|---|---|
| Comprimento máximo da expressão de treino | 768 carateres |
| Comprimento máximo da resposta de texto | 4000 carateres |
| Comprimento máximo de entrada de texto para a intenção de deteção correspondente a intenções não generativas ou parâmetros | 256 carateres |
Agente do Dialogflow ES
| Descrição | Limite |
|---|---|
| Comprimento mínimo do nome do agente | 1 caráter |
| Comprimento máximo do nome do agente | 150 carateres |
| Comprimento máximo da descrição do agente | 500 carateres |
| Comprimento máximo do nome da intenção | 100 carateres |
| Comprimento máximo do nome do tipo de entidade | 30 carateres |
| Comprimento máximo da expressão de treino | 768 carateres |
| Comprimento máximo do nome da ação | 250 carateres |
| Comprimento máximo do nome do contexto | 250 carateres |
| Comprimento máximo do valor de entrada | 512 carateres |
| Comprimento máximo do nome do parâmetro | 30 carateres |
| Comprimento máximo da resposta de texto | 4000 carateres |
| Comprimento máximo de entrada de texto de intenção de deteção * | 256 carateres |
| Comprimento máximo do nome do evento | 150 carateres |
| * | Este limite é aplicado pelo serviço Dialogflow. Se estiver a usar uma integração, a plataforma de integração pode ter um limite inferior. Veja os detalhes da sua integração. |
Limites de tamanho
Agente de agentes conversacionais (Dialogflow CX)
| Descrição | Limite |
|---|---|
| Tamanho máximo do pedido de síntese de voz | Consulte os limites de conteúdo da API TTS |
| Tamanho máximo das especificações da ferramenta | 20KB |
Agente do Dialogflow ES
| Descrição | Limite |
|---|---|
| Tamanho máximo do agente (conteúdo descomprimido) para a importação/restauro do agente | 50 MB |
| Tamanho máximo do pedido de síntese de voz | Consulte os limites de conteúdo da API TTS |