Cuotas y límites

En este documento se especifican las cuotas y los límites más habituales del uso de Dialogflow. A continuación, se explica cómo encontrar una lista completa de cuotas y límites. Nos reservamos el derecho de cambiar estas restricciones, en cuyo caso actualizaremos esta página para reflejar cualquier cambio.

Cuotas

Las cuotas son límites predeterminados que se aplican a tu proyecto. Cuando se usan funciones generativas, cada combinación de modelo y región tiene su propia cuota generativa. Si usas una edición de pago, puedes solicitar un aumento de cuota. El objetivo de estas cuotas es limitar la carga de servicio por cliente, lo que protege al servicio de la sobrecarga y, al cliente, de un uso de recursos inesperado.

Las cuotas de Dialogflow varían en función de cuál sea la edición de tu agente. Las cuotas se aplican a todos los proyectos y se comparten en todas las aplicaciones y direcciones IP que utilicen un proyecto.

Información sobre los límites de tiempo de las cuotas:

  • Las cuotas por mes se renuevan el primer día de cada mes a las 00:00 (UTC-8).
  • Las cuotas por día se renuevan diariamente a las 00:00 (UTC-8). Cuando la duración de un día aumenta por el cambio al horario de verano, se concede una cuota extra de forma proporcional. Sin embargo, no se resta la cuota proporcional si la duración del día se reduce por el cambio al horario de invierno.
  • Las cuotas por minuto se actualizan cada 60 segundos.

Las cuotas que aparecen en la tabla de cuotas son las más frecuentes. Para revisarlas todas, consulta la página Google Cloud Cuotas de Dialogflow de la consola.

Cuotas generativas

Cuando tu agente usa las funciones generativas de Conversational Agents (Dialogflow CX), cada combinación de modelo y región tiene cuotas únicas.

Identificador de cuota

La cuota ConversationalAgentLlmTokenConsumption es una cuota regional que monitoriza el uso de tokens de los modelos de lenguaje extensos (LLMs) en los agentes conversacionales (Dialogflow CX). Esta cuota se mide en diferentes modelos base de LLM y actualmente admite los siguientes modelos:

  • gemini-1.5-pro
  • gemini-1.5-pro-002
  • gemini-1.5-flash
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-001
  • gemini-2.5-flash
  • gemini-2.5-flash-lite

La cuota de ConversationalAgentLlmTokenConsumption monitoriza el uso de tokens de LLM en las siguientes funciones de Conversational Agents (Dialogflow CX):

  • Generadores
  • Generative Fallback
  • Guía
  • Datastore

El límite predeterminado de la cuota ConversationalAgentLlmTokenConsumption es de 600.000 tokens por minuto.

Solicitud de aumento de cuota multirregional

Si necesitas solicitar un aumento de cuota para una multirregión, envía tu solicitud para una de las siguientes regiones específicas:

  • En el caso de los agentes de las multirregiones EE. UU. y Global, usa us-central1.
  • En el caso de los agentes de la multirregión UE, usa europe-west4.

Visualizar el uso de tokens por región y modelo

Para obtener información valiosa sobre el consumo de tokens de tu LLM en diferentes regiones y modelos, sigue estos pasos con el explorador de métricas:

  1. Acceder a Explorador de métricas: Abre Explorador de métricas.
  2. Seleccione la métrica: elija Conversational Agent LLM tokens quota usage como métrica que quiera analizar.
  3. Configurar la agregación y el alineador:
    • Define la función de agregación como Sum para obtener el uso total de tokens.
    • Haz clic en Configure Aligner para habilitar el cálculo de los cambios entre puntos de datos consecutivos de tu serie temporal. Esto ayuda a comprender las tendencias de uso a lo largo del tiempo.
  4. Defina las dimensiones de agregación: Para desglosar el uso de tokens, seleccione location y base_model como dimensiones de agregación. De esta forma, podrás ver cómo varía el consumo de tokens en diferentes regiones y modelos.
  5. Definir función de alineación: elige Sum como función de alineación para calcular el cambio total en el uso de tokens entre puntos de datos consecutivos.

Solicitud de aumento de cuota

Si es necesario, puedes solicitar un ajuste del aumento de cuota.

Si usas proyectos diferentes para los agentes de Dialogflow y para autenticarte con cuentas de servicio, solicita un aumento de cuota para el proyecto de consumidor. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).

En el caso de los agentes de Dialogflow ES, asegúrate de actualizar el agente a la edición Dialogflow Essentials antes de solicitar un aumento de cuota.

Tabla de cuotas

Para describir los precios y las cuotas, se utilizan los siguientes términos:

  • Solicitud: se define como solicitud cualquier llamada a la API al servicio Dialogflow, ya sea directa con la API o indirecta con la integración o la consola. Según la tarea y el diseño del agente, el número de solicitudes que se necesitan para que un usuario final complete una tarea con un agente de Dialogflow puede variar en gran medida.
  • Sesión: una sesión es una conversación entre un usuario final y un agente de Dialogflow. Esta se mantiene activa y sus datos se guardan durante 30 minutos después de que se haya enviado la última solicitud de esa sesión. Las sesiones pueden ser de chat o de voz.
    • Sesión de chat: en las solicitudes y respuestas de estas sesiones solo se usa texto.
    • Sesión de voz: en las sesiones de este tipo se usa audio para las solicitudes, para las respuestas o para ambas.
  • Proyectos de consumidores y de recursos: si tienes varios proyectos, es posible que el asociado a la autenticación de una solicitud (proyecto de consumidor) no coincida con el asociado al agente de la solicitud (proyecto de recursos). En este caso, el proyecto de consumidor se usa para determinar los precios y las cuotas. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).

En las siguientes tablas se muestra una comparación de las cuotas de las distintas ediciones por tipo de agente. A menos que se indique que la función está incluida, las cuotas son acumulativas para todas las funciones que use la solicitud.

Agente de Conversational Agents (Dialogflow CX)

Función Edición de agentes conversacionales (Dialogflow CX)
Texto
(incluidas todas las solicitudes DetectIntent, StreamingDetectIntent y FulfillIntent que no contienen audio)
1200 solicitudes por minuto
Entrada y salida de audio
(reconocimiento, transcripción, síntesis de voz, conversión de texto a voz y telefonía)
600 solicitudes por minuto
Operaciones de consulta de audio con la voz en HD de Chirp 3
(síntesis de voz, conversión de texto a voz, telefonía)
25 solicitudes por minuto
Funciones generativas
(manuales, almacenes de datos, generadores y modelo generativo de respaldo)
600.000 tokens por minuto. Consulta las cuotas generativas.
Pasarela de telefonía de Dialogflow CX
Incluye entrada y salida de audio.
Total de 100 minutos telefónicos por minuto‡
Solicitudes de escritura durante el diseño
Por ejemplo, llamadas para crear o actualizar un agente.
60 solicitudes por minuto
Solicitudes de lectura durante el diseño
Por ejemplo, llamadas para enumerar u obtener recursos de agentes.
300 solicitudes por minuto
Otras solicitudes durante las sesiones
Por ejemplo, para configurar u obtener entidades de la sesión.
100 solicitudes por minuto

Agente de Dialogflow ES

Función Trial Edition Essentials Edition
Texto
(incluidas todas las solicitudes DetectIntent y StreamingDetectIntent que no contienen audio)
180 solicitudes por minuto ¶ 600 solicitudes por minuto ¶
Entrada de audio
(conocida también como "reconocimiento de voz" o "transcripción de voz")
100 solicitudes por minuto †

1000 solicitudes al día †

15.000 solicitudes al mes †

Duración máxima del audio por solicitud: 60 segundos †
300 solicitudes por minuto †

Duración máxima del audio por solicitud: 60 segundos †
Audio output
(conocida también como "síntesis de voz")
Igual que la entrada de audio Igual que la entrada de audio
Conectores de conocimiento (versión beta) Tamaño total máximo del documento: 10 MB

1000 solicitudes al mes

100 solicitudes al día
Sin límite#
Análisis de sentimiento No disponible Sin límite#
Pasarela de telefonía de Dialogflow ES
Incluye entrada y salida de audio.
Número gratuito: no disponible

Total de 3 minutos telefónicos por minuto ‡

30 minutos telefónicos al día

500 minutos telefónicos al mes

Número de teléfono reservado durante 30 días
Total de 100 minutos telefónicos por minuto‡
Megaagente 1000 solicitudes diarias Sin límite#
Solicitudes de escritura durante el diseño
Por ejemplo, llamadas para crear o actualizar un agente.
60 solicitudes por minuto 60 solicitudes por minuto
Solicitudes de lectura durante el diseño
Por ejemplo, llamadas para enumerar u obtener recursos de agentes.
60 solicitudes por minuto 60 solicitudes por minuto
Otras solicitudes durante las sesiones
Por ejemplo, para configurar u obtener entidades de la sesión o para actualizar o consultar contexto.
100 solicitudes por minuto 100 solicitudes por minuto

Agent Assist

Si usas Asistente, también se aplican las cuotas que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Agente de Dialogflow ES, según el tipo de agente que utilices.

Función Trial Edition Essentials Edition
Otras operaciones de conversación de Agent Assist
Incluye todas las solicitudes que gestionan conversaciones y participantes.
No disponible 300 solicitudes por minuto
Operaciones de análisis de texto o audio de Agent Assist
Incluye todas las solicitudes de AnalyzeContent o StreamingAnalyzeContent de cualquier fase de conversación. Esto incluye todas las solicitudes de este tipo que impliquen texto, síntesis de voz o reconocimiento de voz.
No disponible 300 solicitudes por minuto
Solicitudes de sondeo de sugerencias de resumen de conversaciones de Agent Assist
Incluye todas las solicitudes para obtener resúmenes de conversaciones.
No disponible 60 solicitudes por minuto
Solicitudes de búsqueda de conocimientos de Agent Assist
Incluye todas las solicitudes de SearchKnowledge de cualquier fase de conversación.
No disponible 60 solicitudes por minuto

Límites

Los límites son fijos. No se pueden aumentar. Muchos recursos y campos tienen limitaciones de recuento, duración o longitud que son restricciones fijas para la implementación de servicios.

Las siguientes tablas muestran los límites más frecuentes. La documentación específica de cada función y la de la referencia de la API pueden indicar límites adicionales.

Límites de recuento

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Número máximo de agentes por Google Cloud proyecto 1000
Número máximo de números de teléfono por proyecto (excepto en la región global) 5
Número máximo de números de teléfono por proyecto y región (excepto en la región global) 5
Número máximo de flujos por agente 50
Número máximo de tipos de entidades por agente 250
Número máximo de webhooks por agente 100
Número máximo de entornos por agente 20
Número máximo de casos de prueba por agente 2000
Número máximo de registros de cambios por agente 20.000
Número máximo de páginas por flujo 250
Número máximo de grupos de rutas por flujo 100
Número máximo de versiones por flujo 20
Número máximo de intents por agente 10.000
Número máximo de referencias a intents por flujo 2000
Número máximo de frases de entrenamiento por intent e idioma (excepto el intent negativo predeterminado) 2000
Número máximo de frases de entrenamiento por flujo e idioma 100.000
Número máximo de parámetros por intent 20
Número máximo de entradas por entidad 30.000
Número máximo de sinónimos por entrada de entidad 200
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma 1.000.000
Número máximo de parámetros por página 20
Número máximo de rutas por página 2000
Número máximo de gestores de eventos por página 100
Número máximo de rutas por grupo de rutas 2000
Número máximo de guiones por agente 50
Número máximo de invocaciones de cuadernos de estrategias en un turno de conversación 3
Número máximo de llamadas a LLM por invocación de playbook en el mismo turno de conversación 10
Número máximo de ejemplos de manuales por agente Con la estrategia de recuperación de ejemplos predeterminada, el sistema limitará automáticamente el número de ejemplos para que se ajuste al límite de tokens del modelo que se esté usando, en función de la relevancia de los ejemplos para el contexto de la sesión.
Número máximo de versiones por manual de procedimientos 100
Número máximo de herramientas por agente 100

Agente de Dialogflow ES

Descripción Límite
Número máximo de agentes por región y proyecto de Google Cloud ¶ 1
Número máximo de números de teléfono por proyecto (excepto en la región global) 5
Número máximo de números de teléfono por proyecto y región (excepto en la región global) 5
Número máximo de intents 2000
Número máximo de tipos de entidades 250
Número máximo de frases de entrenamiento por intent e idioma 2000
Número máximo de frases de entrenamiento por agente e idioma 100.000
Número máximo de entradas de entidades 30.000
Número máximo de sinónimos por entrada de entidad 200
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma 1.000.000
Número máximo de parámetros por intent 20
Número máximo de contextos de entrada por intent 5
Número máximo de contextos de salida por intent 30
Número máximo de respuestas de texto por intent e idioma 30
Número máximo de peticiones por parámetro e idioma 30
Número máximo de entornos por agente 10
Número máximo de versiones por agente 1000

Agent Assist

Si usas Asistente, también se aplican los límites que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Dialogflow ES, según el tipo de agente que utilices.

Descripción Límite
Número mínimo de conversaciones necesarias para entrenar el modelo 30.000
Número máximo de modelos entrenados simultáneamente por proyecto 1
Número máximo de números de teléfono por proyecto (excepto en la región global) 5
Número máximo de números de teléfono por proyecto y región (excepto en la región global) 5
Número máximo de horas de GPU de nodo de entrenamiento al mes 4200
Número máximo de perfiles de conversación 100

Límites de duración

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Tiempo de espera máximo por webhook 30 segundos
Duración máxima de la entrada de audio 120 segundos

Agente de Dialogflow ES

Descripción Límite
Tiempo de espera máximo de webhook 5 segundos
Duración máxima de llamada telefónica 3,5 horas

Límites de longitud

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Longitud máxima de la frase de entrenamiento 768 caracteres
Longitud máxima de la respuesta de texto 4000 caracteres
Longitud máxima de la entrada de texto de detección de intent que coincide con intents no generativos o parámetros 256 caracteres

Agente de Dialogflow ES

Descripción Límite
Longitud mínima del nombre del agente 1 carácter
Longitud máxima del nombre del agente 150 caracteres
Longitud máxima de la descripción del agente 500 caracteres
Longitud máxima del nombre del intent 100 caracteres
Longitud máxima del nombre del tipo de entidad 30 caracteres
Longitud máxima de la frase de entrenamiento 768 caracteres
Longitud máxima del nombre de la acción 250 caracteres
Longitud máxima del nombre del contexto 250 caracteres
Longitud máxima del valor de entrada 512 caracteres
Longitud máxima del nombre del parámetro 30 caracteres
Longitud máxima de la respuesta de texto 4000 caracteres
Longitud máxima de la entrada de texto de detección de intent* 256 caracteres
Longitud máxima del nombre del evento 150 caracteres

Límites de tamaño

Agente de Conversational Agents (Dialogflow CX)

Descripción Límite
Tamaño máximo de la solicitud de síntesis de voz Consulta los límites del contenido de la API TTS.
Tamaño máximo de las especificaciones de la herramienta 20 KB

Agente de Dialogflow ES

Descripción Límite
Tamaño máximo del agente (contenido descomprimido) para importarlo o restaurarlo 50 MB
Tamaño máximo de la solicitud de síntesis de voz Consulta los límites del contenido de la API TTS.