Cuotas y límites

En este documento, se indican las cuotas y los límites que se suelen encontrar al usar Dialogflow. A continuación, se proporciona información para encontrar una lista completa de las cuotas y los límites. Nos reservamos el derecho de cambiar estas restricciones. La página se actualizará para reflejar estos cambios.

Cuotas

Las cuotas son restricciones predeterminadas que se aplican a tu proyecto. Cuando usas funciones basadas en IA generativa, cada combinación de modelo y región tiene su propia cuota generativa. Si usas una edición pagada, puedes solicitar un aumento de cuota. El fin de estas cuotas es limitar la carga del servicio por cliente para, de esta manera, proteger el servicio de una sobrecarga y al cliente del uso inesperado de recursos.

Las cuotas de Dialogflow varían según la edición de tu agente. Estas se aplican a cada proyecto y se comparten en todas las aplicaciones y direcciones IP que usa un proyecto.

Detalles del límite de tiempo de la cuota:

  • Las cuotas mensuales se reabastecen el primer día de cada mes a las 12:00 a.m. hora del Pacífico.
  • Las cuotas por día se reabastecen a las 12:00 a.m. (hora del Pacífico). Cuando una transición al horario de verano del Pacífico aumenta la duración de un día, se otorga un bono de cuota proporcional. Sin embargo, no hay una deducción equivalente cuando se produce un día más corto debido a la transición del horario de verano.
  • Las cuotas por minuto se actualizan cada 60 segundos por minuto.

Las cuotas que se indican en la tabla de cuotas son las que se suelen encontrar. Para revisar todas las cuotas, consulta la página de cuotas de Dialogflow de la consola deGoogle Cloud .

Cuotas generativas

Cuando tu agente usa las funciones basadas en IA generativa de Conversational Agents (Dialogflow CX), cada combinación de modelo y región tiene cuotas únicas.

Identificador de cuota

La cuota de ConversationalAgentLlmTokenConsumption es una cuota regional que hace un seguimiento del uso de tokens para los modelos de lenguaje grandes (LLM) en los agentes conversacionales (Dialogflow CX). Esta cuota se mide en diferentes modelos base de LLM y, actualmente, admite los siguientes modelos:

  • gemini-1.5-pro
  • gemini-1.5-pro-002
  • gemini-1.5-flash
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-2.5-flash
  • gemini-2.5-flash-lite

La cuota de ConversationalAgentLlmTokenConsumption hace un seguimiento del uso de tokens de LLM en las siguientes funciones de Conversational Agents (Dialogflow CX):

  • Generadores
  • Respuesta generativa de respaldo
  • Guía
  • Datastore

El límite predeterminado para la cuota de ConversationalAgentLlmTokenConsumption es de 600,000 tokens por minuto.

Solicitud de aumento de cuota para varias regiones

Si necesitas solicitar un aumento de cuota para una región múltiple, envía tu solicitud para una de las siguientes regiones específicas:

  • Para los agentes en las multirregiones EE.UU. y Global, usa us-central1.
  • Para los agentes en la multirregión de la UE, usa europe-west4.

Visualiza el uso de tokens por región y modelo

Para obtener estadísticas sobre el consumo de tokens de tu LLM en diferentes regiones y modelos, sigue estos pasos con el Explorador de métricas:

  1. Accede al Explorador de métricas: Abre el Explorador de métricas.
  2. Selecciona la métrica: Elige Conversational Agent LLM tokens quota usage como la métrica que deseas analizar.
  3. Configura la agregación y el alineador:
    • Establece la función de agregación en Sum para obtener el uso total de tokens.
    • Haz clic en Configure Aligner para habilitar el cálculo de los cambios entre los puntos de datos consecutivos de tu serie temporal. Esto ayuda a comprender las tendencias de uso a lo largo del tiempo.
  4. Define dimensiones de agregación: Para desglosar el uso de tokens, selecciona location y base_model como las dimensiones de agregación. Esto te permitirá ver cómo varía el consumo de tokens en diferentes regiones y modelos.
  5. Establece la función de alineación: Elige Sum como la función de alineación para calcular el cambio total en el uso de tokens entre puntos de datos consecutivos.

Solicitud de aumento de cuota

Puedes solicitar un ajuste del incremento de la cuota si es necesario.

Si usas proyectos diferentes para los agentes de Dialogflow y para autenticar con cuentas de servicio, solicita un aumento de cuota para el proyecto de consumidor. Para obtener más información, consulta Usa varios proyectos para Dialogflow ES o Usa varios proyectos para Conversational Agents (Dialogflow CX).

En el caso de los agentes de Dialogflow ES, asegúrate de actualizar el agente a la edición de Dialogflow Essentials antes de solicitar un aumento de cuota.

Tabla de cuotas

Estos términos se usan para describir los precios y las cuotas:

  • Solicitud: Una solicitud se define como cualquier llamada a la API del servicio de Dialogflow, ya sea directa mediante el uso de la API o indirecta mediante la integración o el uso de la consola. La cantidad de solicitudes necesarias para que un usuario final realice una tarea con un agente de Dialogflow puede variar mucho según la tarea y el diseño del agente.
  • Sesión: Una sesión es una conversación entre un usuario final y un agente de Dialogflow. Una sesión permanece activa, y sus datos se almacenan por 30 minutos después de que se envía la última solicitud para la sesión. Esta puede ser en chat o por voz.
    • Sesión de chat: Una sesión de chat solo usa texto para las solicitudes y las respuestas.
    • Sesión de voz: Una sesión de voz usa el audio para las solicitudes, las respuestas o ambas.
  • Proyectos de consumidor y de recursos: Si usas varios proyectos, es posible que el proyecto asociado con tu autenticación por solicitud (proyecto de consumidor) no sea el mismo que el asociado con el agente en la solicitud (proyecto de recursos). En este caso, el proyecto de consumidor se usa para determinar los precios y las cuotas. Si quieres obtener más información, consulta Usa varios proyectos para Dialogflow ES o Usa varios proyectos para Conversational Agents (Dialogflow CX).

En las siguientes tablas se muestra una comparación de las cuotas para ediciones según el tipo de agente. A menos que se indique que se incluye una característica, las cuotas son acumulativas para todas las características que use una solicitud.

Agente de Conversational Agents (Dialogflow CX)

Función Edición de Conversational Agents (Dialogflow CX)
Text
(incluye todas las solicitudes de DetectIntent, StreamingDetectIntent y FulfillIntent que no contienen audio)
1,200 solicitudes por minuto
Entrada/salida de audio
(reconocimiento de voz, voz a texto o STT, síntesis de voz, texto a voz o TTS, telefonía)
600 solicitudes por minuto
Operaciones de consultas de audio con la voz en HD de Chirp3
(síntesis de voz, texto a voz o TTS, telefonía)
25 solicitudes por minuto
Funciones generativas
(guías, almacenes de datos, generadores, respuesta generativa de respaldo)
600,000 tokens por minuto (consulta las cuotas generativas)
Puerta de enlace telefónica de Dialogflow CX
Incluye entrada y salida de audio.
100 minutos de teléfono totales por minuto‡
Solicitudes de escritura de tiempo de diseño
Por ejemplo, llamadas para compilar o actualizar un agente.
60 solicitudes por minuto
Solicitudes de lectura de tiempo de diseño
Por ejemplo, llamadas para enumerar o obtener recursos del agente.
300 solicitudes por minuto
Otras solicitudes de sesión
Por ejemplo, configuración o obtención de entidades de sesión
100 solicitudes por minuto

Agente de Dialogflow ES

Función Edición de prueba Edición Essentials
Text
(incluye todas las solicitudes de DetectIntent y StreamingDetectIntent que no contienen audio)
180 solicitudes por minuto 600 solicitudes por minuto
Entrada de audio
(también conocida como reconocimiento de voz, o voz a texto o STT)
100 solicitudes por minuto †

1,000 solicitudes por día †

15,000 solicitudes por mes †

Máximo de 60 segundos de duración de audio por solicitud †
300 solicitudes por minuto †

Máximo de 60 segundos de duración de audio por solicitud †
Salida de audio
(también conocida como síntesis de voz, o texto a voz o TTS)
Igual que la entrada de audio Igual que la entrada de audio
Conectores de conocimiento (beta) Tamaño máximo total del documento: 10 MB

1,000 solicitudes por mes

100 solicitudes por día
Sin límite#
Análisis de opiniones No disponible Sin límite#
Dialogflow Phone Gateway ES
Incluye entrada y salida de audio.
Números de llamada gratuita: no disponible

3 minutos de teléfono totales por minuto ‡

30 minutos de teléfono por día

500 minutos de teléfono por mes

Número de teléfono reservado por un plazo de 30 días
100 minutos de teléfono totales por minuto‡
Agente combinado 1,000 solicitudes por día Sin límite#
Solicitudes de escritura de tiempo de diseño
Por ejemplo, llamadas para compilar o actualizar un agente.
60 solicitudes por minuto 60 solicitudes por minuto
Solicitudes de lectura de tiempo de diseño
Por ejemplo, llamadas para enumerar o obtener recursos del agente.
60 solicitudes por minuto 60 solicitudes por minuto
Otras solicitudes de sesión
Por ejemplo, configuración o obtención de entidades de sesión, o actualización o búsqueda de contexto
100 solicitudes por minuto 100 solicitudes por minuto

Agent Assist

Si usas Agent Assist, las cuotas que se encuentran en las pestañas Agente de agentes conversacionales (Dialogflow CX) y Agente de Dialogflow ES también se aplican según el tipo de agente que uses.

Función Edición de prueba Edición Essentials
Otras operaciones de conversación de Agent Assist
Incluye todas las solicitudes que administran las conversaciones y los participantes.
No disponible 300 solicitudes por minuto
Operaciones de análisis de texto o audio de Agent Assist
Incluye todas las solicitudes de AnalyzeContent o StreamingAnalyzeContent para cualquier etapa de conversación. Esto incluye todas las solicitudes de este tipo que involucren texto, síntesis de voz o reconocimiento de voz.
No disponible 300 solicitudes por minuto
Solicitudes de sondeo de sugerencias de resumen de conversaciones de Agent Assist
Incluye todas las solicitudes para obtener resúmenes de conversaciones.
No disponible 60 solicitudes por minuto
Solicitudes de Agent Assist SearchKnowledge
Incluye todas las solicitudes de SearchKnowledge para cualquier etapa de conversación.
No disponible 60 solicitudes por minuto

Límites

Los límites son restricciones fijas que no se pueden incrementar. Muchos recursos y campos tienen restricciones de recuento, duración o longitud para la implementación del servicio.

En las siguientes tablas, aparecen los límites que se suelen encontrar. Es posible que se proporcionen límites adicionales según la documentación específica tanto de la función como de la referencia de la API.

Límites de recuento

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Cantidad máxima de agentes por proyecto Google Cloud 1000
Cantidad máxima de números de teléfono por proyecto (excepto en la región de global) 5
Cantidad máxima de números de teléfono por proyecto y por región (excepto la región de global) 5
Cantidad máxima de flujos por agente 50
Cantidad máxima de tipos de entidad por agente 250
Cantidad máxima de webhooks por agente 100
Cantidad máxima de entornos por agente 20
Cantidad máxima de casos de prueba por agente 2000
Cantidad máxima de registros de cambios por agente 20,000
Cantidad máxima de páginas por flujo 250
Cantidad máxima de grupos de ruta por flujo 100
Cantidad máxima de versiones por flujo 20
Cantidad máxima de intents por agente 10,000
Cantidad máxima de intents referidos por flujo 2,000
Cantidad máxima de frases de entrenamiento por idioma y por intent (excepto el “intent negativo predeterminado”) 2000
Cantidad máxima de frases de entrenamiento por flujo y por idioma 100,000
Cantidad máxima de parámetros por intent 20
Cantidad máxima de entradas por entidad 30,000
Cantidad máxima de sinónimos por entrada de entidad 200
Cantidad máxima de sinónimos y valores de referencia de entidad por agente y por idioma 1,000,000
Cantidad máxima de parámetros por página 20
Cantidad máxima de rutas por página 2000
Cantidad máxima de controladores de evento por página 100
Cantidad máxima de rutas por grupo de rutas 2000
Cantidad máxima de guiones por agente 50
Cantidad máxima de invocaciones de la guía en un turno de conversación 3
Cantidad máxima de llamadas a LLM por invocación de playbook en el mismo turno de conversación 10
Cantidad máxima de ejemplos de guiones por agente Con la estrategia de recuperación de ejemplos predeterminada, el sistema limitará automáticamente la cantidad de ejemplos para que quepan en el límite de tokens del modelo que se usa, según la relevancia de los ejemplos para el contexto de la sesión.
Cantidad máxima de versiones por guía 100
Cantidad máxima de herramientas por agente 100

Agente de Dialogflow ES

Descripción Límite
Cantidad máxima de agentes por región y por proyecto de Google Cloud 1
Cantidad máxima de números de teléfono por proyecto (excepto en la región de global) 5
Cantidad máxima de números de teléfono por proyecto y por región (excepto la región de global) 5
Cantidad máxima de intents 2,000
Cantidad máxima de tipos de entidades 250
Cantidad máxima de frases de entrenamiento por intent y por idioma 2000
Cantidad máxima de frases de entrenamiento por agente y por idioma 100,000
Cantidad máxima de entradas de entidades 30,000
Cantidad máxima de sinónimos por entrada de entidad 200
Cantidad máxima de sinónimos y valores de referencia de entidad por agente y por idioma 1,000,000
Cantidad máxima de parámetros por intent 20
Cantidad máxima de contextos de entrada por intent 5
Cantidad máxima de contextos de salida por intent 30
Cantidad máxima de respuestas de texto por intent y por idioma 30
Cantidad máxima de mensajes por parámetro y por idioma 30
Cantidad máxima de entornos por agente 10
Cantidad máxima de versiones por agente 1000

Agent Assist

Si usas Agent Assist, los límites que se muestran en las pestañas Agente de agentes conversacionales (Dialogflow CX) y Dialogflow ES también se aplican según el tipo de agente que uses.

Descripción Límite
Cantidad mínima de conversaciones necesarias para el entrenamiento del modelo 30,000
Cantidad máxima de modelos entrenados simultáneamente por proyecto 1
Cantidad máxima de números de teléfono por proyecto (excepto en la región de global) 5
Cantidad máxima de números de teléfono por proyecto y por región (excepto la región de global) 5
Cantidad máxima de horas de GPU por nodo de entrenamiento por mes 4200
Cantidad máxima de perfiles de conversación 100

Límites de duración

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Tiempo de espera máximo por webhook 30 segundos
Duración máxima de la entrada de audio 120 segundos

Agente de Dialogflow ES

Descripción Límite
Tiempo de espera máximo del webhook 5 segundos
Duración máxima de llamadas telefónicas 3.5 horas

Límites de longitud

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Longitud máxima de las frases de entrenamiento 768 caracteres
Longitud máxima de las respuestas de texto 4,000 caracteres
Longitud máxima de la entrada de texto para la detección de intents que coinciden con intents no generativos o parámetros 256 caracteres

Agente de Dialogflow ES

Descripción Límite
Longitud mínima de los nombres de agentes 1 carácter
Longitud máxima de los nombres de agentes 150 caracteres
Longitud máxima de las descripciones de agentes 500 caracteres
Longitud máxima de los nombres de intents 100 caracteres
Longitud máxima de los nombres de los tipos de entidad 30 caracteres
Longitud máxima de las frases de entrenamiento 768 caracteres
Longitud máxima de los nombres de acciones 250 caracteres
Longitud máxima de los nombres de contextos 250 caracteres
Longitud máxima de los valores de entrada 512 caracteres
Longitud máxima de los nombres de parámetros 30 caracteres
Longitud máxima de las respuestas de texto 4,000 caracteres
Longitud máxima de la entrada de texto para detectar intents* 256 caracteres
Longitud máxima de los nombres de eventos 150 caracteres

Límites de tamaño

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Tamaño máximo de la solicitud de síntesis de voz Consulta los límites de contenido de la API de TTS.
Tamaño máximo de las especificaciones de la herramienta 20 KB

Agente de Dialogflow ES

Descripción Límite
Tamaño máximo del agente (contenido sin comprimir) para la importación y el restablecimiento del agente 50 MB
Tamaño máximo de la solicitud de síntesis de voz Consulta los límites de contenido de la API de TTS.