Quotas e limites

Este documento contém as quotas e os limites encontrados com frequência para a utilização do Dialogflow. Abaixo, encontra informações sobre como encontrar uma lista completa de quotas e limites. Reservamo-nos o direito de alterar estas restrições, e esta página será atualizada para refletir quaisquer alterações.

Quotas

As quotas são restrições predefinidas aplicadas ao seu projeto. Quando usa funcionalidades generativas, cada combinação de modelo e região tem a sua própria quota generativa. Se estiver a usar uma edição paga, pode pedir um aumento da quota. O objetivo das quotas é limitar o carregamento do serviço por cliente, o que protege um serviço contra sobrecarga e um cliente contra uma utilização inesperada de recursos.

As quotas do Dialogflow variam consoante a edição do seu agente. As quotas aplicam-se a cada projeto e são partilhadas por todas as aplicações e endereços IP que usam um projeto.

Detalhes do limite de tempo da quota:

  • As quotas mensais são repostas no dia 1 de cada mês às 00:00 (Hora do Pacífico).
  • As quotas diárias são repostas diariamente às 00:00 (Hora do Pacífico). Quando uma transição do horário de verão do fuso horário do Pacífico aumenta a duração de um dia, é concedido um bónus de quota proporcional. No entanto, não existe uma dedução equivalente quando ocorre um dia mais curto devido à transição para a hora de verão.
  • As quotas por minuto são atualizadas a cada 60 segundos.

As quotas apresentadas na tabela de quotas são as quotas encontradas com frequência. Para rever todas as quotas, consulte a página Google Cloud Quotas do Dialogflow na consola.

Quotas generativas

Quando o seu agente usa agentes conversacionais (Dialogflow CX) funcionalidades generativas, cada combinação de modelo e região tem quotas únicas.

Identificador de quota

A quota ConversationalAgentLlmTokenConsumption é uma quota regional que acompanha a utilização de tokens para grandes modelos de linguagem (GMLs) em agentes conversacionais (Dialogflow CX). Esta quota é medida em diferentes modelos base de MDIs/CEs e, atualmente, suporta os seguintes modelos:

  • gemini-1.5-pro
  • gemini-1.5-pro-002
  • gemini-1.5-flash
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-2.5-flash
  • gemini-2.5-flash-lite

A quota ConversationalAgentLlmTokenConsumption monitoriza a utilização de tokens do MDG em todas as seguintes funcionalidades de agentes conversacionais (Dialogflow CX):

  • Geradores
  • Alternativa generativa
  • Guia interativo
  • Armazenamento de dados

O limite predefinido para a quota é de 600 000 tokens por minuto.ConversationalAgentLlmTokenConsumption

Pedido de aumento da quota em várias regiões

Se precisar de pedir um aumento da quota para uma região múltipla, envie o seu pedido para uma das seguintes regiões específicas:

  • Para agentes nas multirregiões US e Global, use us-central1.
  • Para agentes na multirregião da UE, use europe-west4.

Visualize a utilização de tokens por região e modelo

Para obter estatísticas sobre o consumo de tokens do MDG em diferentes regiões e modelos, siga estes passos através do Explorador de métricas:

  1. Aceda ao Metrics Explorer: abra o Metrics Explorer.
  2. Selecione a métrica: escolha Conversational Agent LLM tokens quota usage como a métrica que quer analisar.
  3. Configure a agregação e o alinhador:
    • Defina a função de agregação como Sum para obter a utilização total de tokens.
    • Clique em Configure Aligner para ativar o cálculo das alterações entre pontos de dados consecutivos na sua série cronológica. Isto ajuda a compreender as tendências de utilização ao longo do tempo.
  4. Defina as dimensões de agregação: para discriminar a utilização de tokens, selecione location e base_model como as dimensões de agregação. Isto permite-lhe ver como o consumo de tokens varia em diferentes regiões e modelos.
  5. Definir função de alinhamento: escolha Sum como função de alinhamento para calcular a alteração total na utilização de tokens entre pontos de dados consecutivos.

Pedido de aumento da quota

Se necessário, pode pedir um ajuste do aumento da quota.

Se usar projetos diferentes para agentes do Dialogflow e para autenticação com contas de serviço, peça um aumento da quota para o projeto de consumidor. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).

Para agentes do Dialogflow ES, certifique-se de que atualiza o agente para a edição do Dialogflow Essentials antes de pedir um aumento da quota.

Tabela de quotas

Os seguintes termos são usados para descrever os preços e as quotas:

  • Pedido: Um pedido é definido como qualquer chamada API para o serviço Dialogflow, seja direta com a utilização da API ou indireta com a utilização da integração ou da consola. Consoante a tarefa e a conceção do agente, o número de pedidos necessários para um utilizador final realizar uma tarefa com um agente do Dialogflow pode variar muito.
  • Sessão: Uma sessão é uma conversa entre um utilizador final e um agente do Dialogflow. Uma sessão permanece ativa e os respetivos dados são armazenados durante 30 minutos após o envio do último pedido para a sessão. Uma sessão pode ser uma sessão de chat ou uma sessão de voz.
    • Sessão de chat: uma sessão de chat usa apenas texto para pedidos e respostas.
    • Sessão de voz: Uma sessão de voz usa áudio para pedidos, respostas ou ambos.
  • Projetos de consumidor e projetos de recursos: se usar vários projetos, é possível que o projeto associado à autenticação do seu pedido (projeto de consumidor) não seja o mesmo projeto associado ao agente no pedido (projeto de recursos). Neste caso, o projeto de consumidor é usado para determinar os preços e as quotas. Para mais informações, consulte os artigos Usar vários projetos para o Dialogflow ES ou Usar vários projetos para agentes conversacionais (Dialogflow CX).

As tabelas seguintes apresentam uma comparação de quotas para edições por tipo de agente. Salvo indicação em contrário, as quotas são cumulativas para todas as funcionalidades usadas por um pedido.

Agente de agentes conversacionais (Dialogflow CX)

Funcionalidade Edição de agentes de conversação (Dialogflow CX)
Texto
(inclui todos os pedidos DetectIntent, StreamingDetectIntent e FulfillIntent que não contêm áudio)
1200 pedidos por minuto
Entrada/saída de áudio
(reconhecimento de voz, voz para texto, STT, síntese de voz, conversão de texto em voz, TTS, telefonia)
600 pedidos por minuto
Operações de consulta de áudio com a voz HD do Chirp3
(síntese de voz, conversão de texto em voz, TTS, telefonia)
25 pedidos por minuto
Funcionalidades generativas
(guias interativos, repositórios de dados, geradores, alternativa generativa)
600 000 tokens por minuto. Consulte as quotas generativas
Dialogflow CX Phone Gateway
Inclui entrada e saída de áudio.
100 minutos de chamadas no telemóvel por minuto ‡
Pedidos de escrita em tempo de conceção
Por exemplo, chamadas para criar ou atualizar um agente.
60 pedidos por minuto
Pedidos de leitura no momento da conceção
Por exemplo, chamadas para listar ou obter recursos de agentes.
300 pedidos por minuto
Outros pedidos de sessões
Por exemplo, definir ou obter entidades de sessões.
100 pedidos por minuto

Agente do Dialogflow ES

Funcionalidade Edição de avaliação Edição Essentials
Texto
(inclui todos os pedidos DetectIntent e StreamingDetectIntent que não contêm áudio)
180 pedidos por minuto ¶ 600 pedidos por minuto ¶
Entrada de áudio
(também conhecida como reconhecimento de voz, voz para texto, STT)
100 pedidos por minuto †

1000 pedidos por dia †

15 000 pedidos por mês †

Máximo de 60 segundos de duração do áudio por pedido †
300 pedidos por minuto †

Duração máxima de 60 segundos de áudio por pedido †
Saída de áudio
(também conhecida como síntese de voz, conversão de texto em voz, TTS)
Igual à entrada de áudio Igual à entrada de áudio
Conetores de conhecimento (beta) Tamanho máximo total do documento de 10 MB

1000 pedidos por mês

100 pedidos por dia
Número ilimitado
Análise de sensação geral Não disponível Número ilimitado
Dialogflow ES phone gateway
Inclui entrada e saída de áudio.
Número gratuito: não disponível

3 minutos de telefone no total por minuto ‡

30 minutos de telefone por dia

500 minutos de telefone por mês

Número de telefone reservado durante 30 dias
100 minutos de chamadas no telemóvel por minuto ‡
Mega-agente 1000 pedidos por dia Número ilimitado
Pedidos de escrita em tempo de conceção
Por exemplo, chamadas para criar ou atualizar um agente.
60 pedidos por minuto 60 pedidos por minuto
Pedidos de leitura no momento da conceção
Por exemplo, chamadas para listar ou obter recursos de agentes.
60 pedidos por minuto 60 pedidos por minuto
Outros pedidos de sessão
Por exemplo, definir ou obter entidades de sessão ou atualizar/consultar o contexto.
100 pedidos por minuto 100 pedidos por minuto

Agent Assist

Se estiver a usar o Agent Assist, as quotas indicadas nos separadores Agente de agentes conversacionais (Dialogflow CX) e Agente do Dialogflow ES também se aplicam, consoante o tipo de agente que estiver a usar.

Funcionalidade Edição de avaliação Edição Essentials
Agent Assist conversation other operations
Inclui todos os pedidos que gerem conversas e participantes.
Não disponível 300 pedidos por minuto
O Agent Assist analisa operações de texto/áudio
Inclui todos os pedidos AnalyzeContent ou StreamingAnalyzeContent para qualquer fase da conversa. Isto inclui todos os pedidos que envolvam texto, conversão de texto em voz e/ou reconhecimento de voz.
Não disponível 300 pedidos por minuto
Sessões de streaming bidirecional concorrentes
Inclui todos os pedidos BidiStreamingAnalyzeContent para qualquer fase de conversa. Isto inclui todos os pedidos que envolvam a síntese de voz e/ou o reconhecimento de voz.
Não disponível 50 pedidos simultâneos
Pedidos de sondagem de sugestões de resumo de conversas do Agent Assist
Inclui todos os pedidos para obter resumos de conversas.
Não disponível 60 pedidos por minuto
Pedidos SearchKnowledge do Agent Assist
Inclui todos os pedidos SearchKnowledge para qualquer fase da conversa.
Não disponível 60 pedidos por minuto

Limites

Os limites são restrições fixas que não podem ser aumentadas. Muitos recursos e campos têm limitações de contagem, duração ou comprimento, que são restrições fixas para a implementação do serviço.

As tabelas seguintes apresentam os limites encontrados com frequência. A documentação específica das funcionalidades e a documentação de referência da API podem fornecer limites adicionais.

Limites de contagem

Agente de agentes conversacionais (Dialogflow CX)

Descrição Limite
Número máximo de agentes por Google Cloud projeto 1000
Número máximo de números de telefone por projeto (exceto para a região global) 5
Número máximo de números de telefone por projeto por região (exceto para a região global) 5
Número máximo de fluxos por agente 50
Número máximo de tipos de entidades por agente 250
Número máximo de webhooks por agente 100
Número máximo de ambientes por agente 20
Número máximo de exemplos de teste por agente 2000
Número máximo de registos de alterações por agente 20 000
Número máximo de páginas por fluxo 250
Número máximo de grupos de rotas por fluxo 100
Número máximo de versões por fluxo 20
Número máximo de intenções por agente 10 000
Número máximo de intenções referenciadas por fluxo 2000
Número máximo de expressões de preparação por intenção e por idioma (exceto "Intenção negativa predefinida") 2000
Número máximo de expressões de preparação por fluxo e por idioma 100 000
Número máximo de parâmetros por intenção 20
Número máximo de entradas de entidades por entidade 30 000
Número máximo de sinónimos de entidades por entrada de entidade 200
Número máximo de valores de referência de entidades e sinónimos por agente e por idioma 1 000 000
Número máximo de parâmetros por página 20
Número máximo de trajetos por página 2000
Número máximo de controladores de eventos por página 100
Número máximo de rotas por grupo de rotas 2000
Número máximo de manuais de soluções por agente 50
Número máximo de invocações de manuais num turno de conversa 3
Número máximo de chamadas de MDG por invocação de guião no mesmo turno de conversa 10
Número máximo de exemplos de guias por agente Com a estratégia de obtenção de exemplos predefinida, o sistema limita automaticamente o número de exemplos para se ajustar ao limite de tokens do modelo que está a ser usado, com base na relevância dos exemplos para o contexto da sessão.
Número máximo de versões por manual de soluções 100
Número máximo de ferramentas por agente 100

Agente do Dialogflow ES

Descrição Limite
Número máximo de agentes por região e por projeto do Google Cloud ¶ 1
Número máximo de números de telefone por projeto (exceto para a região global) 5
Número máximo de números de telefone por projeto por região (exceto para a região global) 5
Número máximo de intenções 2000
Número máximo de tipos de entidades 250
Número máximo de expressões de preparação por intenção e por idioma 2000
Número máximo de expressões de preparação por agente e por idioma 100 000
Número máximo de entradas de entidades 30000
Número máximo de sinónimos de entidades por entrada de entidade 200
Número máximo de valores de referência de entidades e sinónimos por agente e por idioma 1 000 000
Número máximo de parâmetros por intenção 20
Número máximo de contextos de entrada por intenção 5
Número máximo de contextos de saída por intenção 30
Número máximo de respostas de texto por intenção e por idioma 30
Número máximo de comandos por parâmetro e por idioma 30
Número máximo de ambientes por agente 10
Número máximo de versões por agente 1000

Agent Assist

Se estiver a usar o Agent Assist, os limites indicados nos separadores Agentes conversacionais (Dialogflow CX) Agente e Dialogflow ES também se aplicam consoante o tipo de agente que estiver a usar.

Descrição Limite
Número mínimo de conversas necessárias para a preparação do modelo 30 000
Número máximo de modelos preparados em simultâneo por projeto 1
Número máximo de números de telefone por projeto (exceto para a região global) 5
Número máximo de números de telefone por projeto por região (exceto para a região global) 5
Número máximo de horas de GPU do nó de preparação por mês 4200
Número máximo de perfis de conversa 100

Limites de duração

Agente de agentes conversacionais (Dialogflow CX)

Descrição Limite
Limite de tempo máximo por webhook 30 segundos
Duração máxima da entrada de áudio 120 segundos

Agente do Dialogflow ES

Descrição Limite
Limite de tempo máximo do webhook 5 segundos
Duração máxima da chamada de telefonia 3,5 horas

Limites de comprimento

Agente de agentes conversacionais (Dialogflow CX)

Descrição Limite
Comprimento máximo da expressão de treino 768 carateres
Comprimento máximo da resposta de texto 4000 carateres
Comprimento máximo de entrada de texto para a intenção de deteção correspondente a intenções não generativas ou parâmetros 256 carateres

Agente do Dialogflow ES

Descrição Limite
Comprimento mínimo do nome do agente 1 caráter
Comprimento máximo do nome do agente 150 carateres
Comprimento máximo da descrição do agente 500 carateres
Comprimento máximo do nome da intenção 100 carateres
Comprimento máximo do nome do tipo de entidade 30 carateres
Comprimento máximo da expressão de treino 768 carateres
Comprimento máximo do nome da ação 250 carateres
Comprimento máximo do nome do contexto 250 carateres
Comprimento máximo do valor de entrada 512 carateres
Comprimento máximo do nome do parâmetro 30 carateres
Comprimento máximo da resposta de texto 4000 carateres
Comprimento máximo de entrada de texto de intenção de deteção * 256 carateres
Comprimento máximo do nome do evento 150 carateres

Limites de tamanho

Agente de agentes conversacionais (Dialogflow CX)

Descrição Limite
Tamanho máximo do pedido de síntese de voz Consulte os limites de conteúdo da API TTS
Tamanho máximo das especificações da ferramenta 20KB

Agente do Dialogflow ES

Descrição Limite
Tamanho máximo do agente (conteúdo descomprimido) para a importação/restauro do agente 50 MB
Tamanho máximo do pedido de síntese de voz Consulte os limites de conteúdo da API TTS