Esta página foi traduzida pela API Cloud Translation.

Quotas e limites

Este documento contém as quotas e os limites encontrados com frequência para a utilização do Dialogflow. Abaixo, encontra informações sobre como encontrar uma lista completa de quotas e limites. Reservamo-nos o direito de alterar estas restrições, e esta página será atualizada para refletir quaisquer alterações.

Quotas

As quotas são restrições predefinidas aplicadas ao seu projeto. Quando usa funcionalidades generativas, cada combinação de modelo e região tem a sua própria quota generativa. Se estiver a usar uma edição paga, pode pedir um aumento da quota. O objetivo das quotas é limitar o carregamento do serviço por cliente, o que protege um serviço contra sobrecarga e um cliente contra uma utilização inesperada de recursos.

As quotas do Dialogflow variam consoante a edição do seu agente. As quotas aplicam-se a cada projeto e são partilhadas por todas as aplicações e endereços IP que usam um projeto.

Detalhes do limite de tempo da quota:

As quotas mensais são repostas no dia 1 de cada mês às 00:00 (Hora do Pacífico).
As quotas diárias são repostas diariamente às 00:00 (Hora do Pacífico). Quando uma transição do horário de verão do fuso horário do Pacífico aumenta a duração de um dia, é concedido um bónus de quota proporcional. No entanto, não existe uma dedução equivalente quando ocorre um dia mais curto devido à transição para a hora de verão.
As quotas por minuto são atualizadas a cada 60 segundos.

As quotas apresentadas na tabela de quotas são as quotas encontradas com frequência. Para rever todas as quotas, consulte a página Google Cloud Quotas do Dialogflow na consola.

Quotas generativas

Quando o seu agente usa agentes conversacionais (Dialogflow CX) funcionalidades generativas, cada combinação de modelo e região tem quotas únicas.

Identificador de quota

A quota ConversationalAgentLlmTokenConsumption é uma quota regional que acompanha a utilização de tokens para grandes modelos de linguagem (GMLs) em agentes conversacionais (Dialogflow CX). Esta quota é medida em diferentes modelos base de MDIs/CEs e, atualmente, suporta os seguintes modelos:

gemini-1.5-pro
gemini-1.5-pro-002
gemini-1.5-flash
gemini-1.5-flash-002
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-2.5-flash
gemini-2.5-flash-lite

A quota ConversationalAgentLlmTokenConsumption monitoriza a utilização de tokens do MDG em todas as seguintes funcionalidades de agentes conversacionais (Dialogflow CX):

Geradores
Alternativa generativa
Guia interativo
Armazenamento de dados

O limite predefinido para a quota é de 600 000 tokens por minuto.ConversationalAgentLlmTokenConsumption

Pedido de aumento da quota em várias regiões

Se precisar de pedir um aumento da quota para uma região múltipla, envie o seu pedido para uma das seguintes regiões específicas:

Para agentes nas multirregiões US e Global, use us-central1.
Para agentes na multirregião da UE, use europe-west4.

Visualize a utilização de tokens por região e modelo

Para obter estatísticas sobre o consumo de tokens do MDG em diferentes regiões e modelos, siga estes passos através do Explorador de métricas:

Aceda ao Metrics Explorer: abra o Metrics Explorer.
Selecione a métrica: escolha Conversational Agent LLM tokens quota usage como a métrica que quer analisar.
Configure a agregação e o alinhador:
- Defina a função de agregação como Sum para obter a utilização total de tokens.
- Clique em Configure Aligner para ativar o cálculo das alterações entre pontos de dados consecutivos na sua série cronológica. Isto ajuda a compreender as tendências de utilização ao longo do tempo.
Defina as dimensões de agregação: para discriminar a utilização de tokens, selecione location e base_model como as dimensões de agregação. Isto permite-lhe ver como o consumo de tokens varia em diferentes regiões e modelos.
Definir função de alinhamento: escolha Sum como função de alinhamento para calcular a alteração total na utilização de tokens entre pontos de dados consecutivos.

Pedido de aumento da quota

Se necessário, pode pedir um ajuste do aumento da quota.

Se usar projetos diferentes para agentes do Dialogflow e para autenticação com contas de serviço, peça um aumento da quota para o projeto de consumidor. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).

Para agentes do Dialogflow ES, certifique-se de que atualiza o agente para a edição do Dialogflow Essentials antes de pedir um aumento da quota.

Tabela de quotas

Os seguintes termos são usados para descrever os preços e as quotas:

Pedido: Um pedido é definido como qualquer chamada API para o serviço Dialogflow, seja direta com a utilização da API ou indireta com a utilização da integração ou da consola. Consoante a tarefa e a conceção do agente, o número de pedidos necessários para um utilizador final realizar uma tarefa com um agente do Dialogflow pode variar muito.
Sessão: Uma sessão é uma conversa entre um utilizador final e um agente do Dialogflow. Uma sessão permanece ativa e os respetivos dados são armazenados durante 30 minutos após o envio do último pedido para a sessão. Uma sessão pode ser uma sessão de chat ou uma sessão de voz.
- Sessão de chat: uma sessão de chat usa apenas texto para pedidos e respostas.
- Sessão de voz: Uma sessão de voz usa áudio para pedidos, respostas ou ambos.
Projetos de consumidor e projetos de recursos: se usar vários projetos, é possível que o projeto associado à autenticação do seu pedido (projeto de consumidor) não seja o mesmo projeto associado ao agente no pedido (projeto de recursos). Neste caso, o projeto de consumidor é usado para determinar os preços e as quotas. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).

As tabelas seguintes apresentam uma comparação de quotas para edições por tipo de agente. Salvo indicação em contrário, as quotas são cumulativas para todas as funcionalidades usadas por um pedido.

Agente de agentes conversacionais (Dialogflow CX)

Funcionalidade	Edição de agentes de conversação (Dialogflow CX)
Texto (inclui todos os pedidos DetectIntent, StreamingDetectIntent e FulfillIntent que não contêm áudio)	1200 pedidos por minuto
Entrada/saída de áudio (reconhecimento de voz, voz para texto, STT, síntese de voz, conversão de texto em voz, TTS, telefonia)	600 pedidos por minuto
Operações de consulta de áudio com a voz HD do Chirp3 (síntese de voz, conversão de texto em voz, TTS, telefonia)	25 pedidos por minuto
Funcionalidades generativas (guias interativos, repositórios de dados, geradores, alternativa generativa)	600 000 tokens por minuto. Consulte as quotas generativas
Dialogflow CX Phone Gateway Inclui entrada e saída de áudio.	100 minutos de chamadas no telemóvel por minuto ‡
Pedidos de escrita em tempo de conceção Por exemplo, chamadas para criar ou atualizar um agente.	60 pedidos por minuto
Pedidos de leitura no momento da conceção Por exemplo, chamadas para listar ou obter recursos de agentes.	300 pedidos por minuto
Outros pedidos de sessões Por exemplo, definir ou obter entidades de sessões.	100 pedidos por minuto

Símbolo	Descrição
‡	"Minutos de telefone por minuto" é a soma total do tempo por minuto usado por todos os utilizadores que fazem chamadas através do sistema telefónico. Por exemplo: num período de 60 segundos, um utilizador está online durante 60 segundos, um segundo durante 30 segundos e um terceiro durante 30 segundos. É calculado como 2 minutos por minuto. Mais minutos por minuto permitem que mais utilizadores usem o sistema em simultâneo.

Símbolo

Descrição

‡

"Minutos de telefone por minuto" é a soma total do tempo por minuto usado por todos os utilizadores que fazem chamadas através do sistema telefónico. Por exemplo: num período de 60 segundos, um utilizador está online durante 60 segundos, um segundo durante 30 segundos e um terceiro durante 30 segundos. É calculado como 2 minutos por minuto. Mais minutos por minuto permitem que mais utilizadores usem o sistema em simultâneo.

Agente do Dialogflow ES

Funcionalidade	Edição de avaliação	Edição Essentials
Texto (inclui todos os pedidos DetectIntent e StreamingDetectIntent que não contêm áudio)	180 pedidos por minuto ¶	600 pedidos por minuto ¶
Entrada de áudio (também conhecida como reconhecimento de voz, voz para texto, STT)	100 pedidos por minuto † 1000 pedidos por dia † 15 000 pedidos por mês † Máximo de 60 segundos de duração do áudio por pedido †	300 pedidos por minuto † Duração máxima de 60 segundos de áudio por pedido †
Saída de áudio (também conhecida como síntese de voz, conversão de texto em voz, TTS)	Igual à entrada de áudio	Igual à entrada de áudio
Conetores de conhecimento (beta)	Tamanho máximo total do documento de 10 MB 1000 pedidos por mês 100 pedidos por dia	Número ilimitado
Análise de sensação geral	Não disponível	Número ilimitado
Dialogflow ES phone gateway Inclui entrada e saída de áudio.	Número gratuito: não disponível 3 minutos de telefone no total por minuto ‡ 30 minutos de telefone por dia 500 minutos de telefone por mês Número de telefone reservado durante 30 dias	100 minutos de chamadas no telemóvel por minuto ‡
Mega-agente	1000 pedidos por dia	Número ilimitado
Pedidos de escrita em tempo de conceção Por exemplo, chamadas para criar ou atualizar um agente.	60 pedidos por minuto	60 pedidos por minuto
Pedidos de leitura no momento da conceção Por exemplo, chamadas para listar ou obter recursos de agentes.	60 pedidos por minuto	60 pedidos por minuto
Outros pedidos de sessão Por exemplo, definir ou obter entidades de sessão ou atualizar/consultar o contexto.	100 pedidos por minuto	100 pedidos por minuto

Símbolo	Descrição
†	Cada stream StreamingDetectIntent é considerada um único pedido, mesmo que a stream possa incluir vários frames de `StreamingDetectIntentRequest` áudio na stream.
‡	"Minutos de telefone por minuto" é a soma total do tempo por minuto usado por todos os utilizadores que fazem chamadas através do sistema telefónico. Por exemplo: num período de 60 segundos, um utilizador está online durante 60 segundos, um segundo durante 30 segundos e um terceiro durante 30 segundos. É calculado como 2 minutos por minuto. Mais minutos por minuto permitem que mais utilizadores usem o sistema em simultâneo.
#	As funcionalidades marcadas como ilimitadas continuam potencialmente limitadas pela utilização de outras funcionalidades. Por exemplo, se a sua edição fornecer uma quota ilimitada para conectores de conhecimentos, um pedido de texto que use conectores de conhecimentos continua limitado pela quota de pedidos de texto.
¶	A entrada e a saída de áudio do Assistente Google são consideradas um pedido de texto.

Agent Assist

Se estiver a usar o Agent Assist, as quotas indicadas nos separadores Agente de agentes conversacionais (Dialogflow CX) e Agente do Dialogflow ES também se aplicam, consoante o tipo de agente que estiver a usar.

Funcionalidade	Edição de avaliação	Edição Essentials
Agent Assist conversation other operations Inclui todos os pedidos que gerem conversas e participantes.	Não disponível	300 pedidos por minuto
O Agent Assist analisa operações de texto/áudio Inclui todos os pedidos AnalyzeContent ou StreamingAnalyzeContent para qualquer fase da conversa. Isto inclui todos os pedidos que envolvam texto, conversão de texto em voz e/ou reconhecimento de voz.	Não disponível	300 pedidos por minuto
Sessões de streaming bidirecional concorrentes Inclui todos os pedidos BidiStreamingAnalyzeContent para qualquer fase de conversa. Isto inclui todos os pedidos que envolvam a síntese de voz e/ou o reconhecimento de voz.	Não disponível	50 pedidos simultâneos
Pedidos de sondagem de sugestões de resumo de conversas do Agent Assist Inclui todos os pedidos para obter resumos de conversas.	Não disponível	60 pedidos por minuto
Pedidos SearchKnowledge do Agent Assist Inclui todos os pedidos SearchKnowledge para qualquer fase da conversa.	Não disponível	60 pedidos por minuto

Limites

Os limites são restrições fixas que não podem ser aumentadas. Muitos recursos e campos têm limitações de contagem, duração ou comprimento, que são restrições fixas para a implementação do serviço.

As tabelas seguintes apresentam os limites encontrados com frequência. A documentação específica das funcionalidades e a documentação de referência da API podem fornecer limites adicionais.

Limites de contagem

Agente de agentes conversacionais (Dialogflow CX)

Descrição	Limite
Número máximo de agentes por Google Cloud projeto	1000
Número máximo de números de telefone por projeto (exceto para a região `global`)	5
Número máximo de números de telefone por projeto por região (exceto para a região `global`)	5
Número máximo de fluxos por agente	50
Número máximo de tipos de entidades por agente	250
Número máximo de webhooks por agente	100
Número máximo de ambientes por agente	20
Número máximo de exemplos de teste por agente	2000
Número máximo de registos de alterações por agente	20 000
Número máximo de páginas por fluxo	250
Número máximo de grupos de rotas por fluxo	100
Número máximo de versões por fluxo	20
Número máximo de intenções por agente	10 000
Número máximo de intenções referenciadas por fluxo	2000
Número máximo de expressões de preparação por intenção e por idioma (exceto "Intenção negativa predefinida")	2000
Número máximo de expressões de preparação por fluxo e por idioma	100 000
Número máximo de parâmetros por intenção	20
Número máximo de entradas de entidades por entidade	30 000
Número máximo de sinónimos de entidades por entrada de entidade	200
Número máximo de valores de referência de entidades e sinónimos por agente e por idioma	1 000 000
Número máximo de parâmetros por página	20
Número máximo de trajetos por página	2000
Número máximo de controladores de eventos por página	100
Número máximo de rotas por grupo de rotas	2000
Número máximo de manuais de soluções por agente	50
Número máximo de invocações de manuais num turno de conversa	3
Número máximo de chamadas de MDG por invocação de guião no mesmo turno de conversa	10
Número máximo de exemplos de guias por agente	Com a estratégia de obtenção de exemplos predefinida, o sistema limita automaticamente o número de exemplos para se ajustar ao limite de tokens do modelo que está a ser usado, com base na relevância dos exemplos para o contexto da sessão.
Número máximo de versões por manual de soluções	100
Número máximo de ferramentas por agente	100

Agente do Dialogflow ES

Descrição	Limite
Número máximo de agentes por região e por projeto do Google Cloud ¶	1
Número máximo de números de telefone por projeto (exceto para a região `global`)	5
Número máximo de números de telefone por projeto por região (exceto para a região `global`)	5
Número máximo de intenções	2000
Número máximo de tipos de entidades	250
Número máximo de expressões de preparação por intenção e por idioma	2000
Número máximo de expressões de preparação por agente e por idioma	100 000
Número máximo de entradas de entidades	30000
Número máximo de sinónimos de entidades por entrada de entidade	200
Número máximo de valores de referência de entidades e sinónimos por agente e por idioma	1 000 000
Número máximo de parâmetros por intenção	20
Número máximo de contextos de entrada por intenção	5
Número máximo de contextos de saída por intenção	30
Número máximo de respostas de texto por intenção e por idioma	30
Número máximo de comandos por parâmetro e por idioma	30
Número máximo de ambientes por agente	10
Número máximo de versões por agente	1000

Agent Assist

Se estiver a usar o Agent Assist, os limites indicados nos separadores Agentes conversacionais (Dialogflow CX) Agente e Dialogflow ES também se aplicam consoante o tipo de agente que estiver a usar.

Descrição	Limite
Número mínimo de conversas necessárias para a preparação do modelo	30 000
Número máximo de modelos preparados em simultâneo por projeto	1
Número máximo de números de telefone por projeto (exceto para a região `global`)	5
Número máximo de números de telefone por projeto por região (exceto para a região `global`)	5
Número máximo de horas de GPU do nó de preparação por mês	4200
Número máximo de perfis de conversa	100

Limites de duração

Agente de agentes conversacionais (Dialogflow CX)

Descrição	Limite
Limite de tempo máximo por webhook	30 segundos
Duração máxima da entrada de áudio	120 segundos

Agente do Dialogflow ES

Descrição	Limite
Limite de tempo máximo do webhook	5 segundos
Duração máxima da chamada de telefonia	3,5 horas

Limites de comprimento

Agente de agentes conversacionais (Dialogflow CX)

Descrição	Limite
Comprimento máximo da expressão de treino	768 carateres
Comprimento máximo da resposta de texto	4000 carateres
Comprimento máximo de entrada de texto para a intenção de deteção correspondente a intenções não generativas ou parâmetros	256 carateres

Agente do Dialogflow ES

Descrição	Limite
Comprimento mínimo do nome do agente	1 caráter
Comprimento máximo do nome do agente	150 carateres
Comprimento máximo da descrição do agente	500 carateres
Comprimento máximo do nome da intenção	100 carateres
Comprimento máximo do nome do tipo de entidade	30 carateres
Comprimento máximo da expressão de treino	768 carateres
Comprimento máximo do nome da ação	250 carateres
Comprimento máximo do nome do contexto	250 carateres
Comprimento máximo do valor de entrada	512 carateres
Comprimento máximo do nome do parâmetro	30 carateres
Comprimento máximo da resposta de texto	4000 carateres
Comprimento máximo de entrada de texto de intenção de deteção *	256 carateres
Comprimento máximo do nome do evento	150 carateres

Limites de tamanho

Agente de agentes conversacionais (Dialogflow CX)

Descrição	Limite
Tamanho máximo do pedido de síntese de voz	Consulte os limites de conteúdo da API TTS
Tamanho máximo das especificações da ferramenta	20KB

Agente do Dialogflow ES

Descrição	Limite
Tamanho máximo do agente (conteúdo descomprimido) para a importação/restauro do agente	50 MB
Tamanho máximo do pedido de síntese de voz	Consulte os limites de conteúdo da API TTS