Esta página se ha traducido con Cloud Translation API.

Cuotas y límites

En este documento se especifican las cuotas y los límites más habituales del uso de Dialogflow. A continuación, se explica cómo encontrar una lista completa de cuotas y límites. Nos reservamos el derecho de cambiar estas restricciones, en cuyo caso actualizaremos esta página para reflejar cualquier cambio.

Cuotas

Las cuotas son límites predeterminados que se aplican a tu proyecto. Cuando se usan funciones generativas, cada combinación de modelo y región tiene su propia cuota generativa. Si usas una edición de pago, puedes solicitar un aumento de cuota. El objetivo de estas cuotas es limitar la carga de servicio por cliente, lo que protege al servicio de la sobrecarga y, al cliente, de un uso de recursos inesperado.

Las cuotas de Dialogflow varían en función de cuál sea la edición de tu agente. Las cuotas se aplican a todos los proyectos y se comparten en todas las aplicaciones y direcciones IP que utilicen un proyecto.

Información sobre los límites de tiempo de las cuotas:

Las cuotas por mes se renuevan el primer día de cada mes a las 00:00 (UTC-8).
Las cuotas por día se renuevan diariamente a las 00:00 (UTC-8). Cuando la duración de un día aumenta por el cambio al horario de verano, se concede una cuota extra de forma proporcional. Sin embargo, no se resta la cuota proporcional si la duración del día se reduce por el cambio al horario de invierno.
Las cuotas por minuto se actualizan cada 60 segundos.

Las cuotas que aparecen en la tabla de cuotas son las más frecuentes. Para revisarlas todas, consulta la página Google Cloud Cuotas de Dialogflow de la consola.

Cuotas generativas

Cuando tu agente usa las funciones generativas de Conversational Agents (Dialogflow CX), cada combinación de modelo y región tiene cuotas únicas.

Identificador de cuota

La cuota ConversationalAgentLlmTokenConsumption es una cuota regional que monitoriza el uso de tokens de los modelos de lenguaje extensos (LLMs) en los agentes conversacionales (Dialogflow CX). Esta cuota se mide en diferentes modelos base de LLM y actualmente admite los siguientes modelos:

gemini-1.5-pro
gemini-1.5-pro-002
gemini-1.5-flash
gemini-1.5-flash-002
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-2.5-flash
gemini-2.5-flash-lite

La cuota de ConversationalAgentLlmTokenConsumption monitoriza el uso de tokens de LLM en las siguientes funciones de Conversational Agents (Dialogflow CX):

Generadores
Generative Fallback
Guía
Datastore

El límite predeterminado de la cuota ConversationalAgentLlmTokenConsumption es de 600.000 tokens por minuto.

Solicitud de aumento de cuota multirregional

Si necesitas solicitar un aumento de cuota para una multirregión, envía tu solicitud para una de las siguientes regiones específicas:

En el caso de los agentes de las multirregiones EE. UU. y Global, usa us-central1.
En el caso de los agentes de la multirregión UE, usa europe-west4.

Visualizar el uso de tokens por región y modelo

Para obtener información valiosa sobre el consumo de tokens de tu LLM en diferentes regiones y modelos, sigue estos pasos con el explorador de métricas:

Acceder a Explorador de métricas: Abre Explorador de métricas.
Seleccione la métrica: elija Conversational Agent LLM tokens quota usage como métrica que quiera analizar.
Configurar la agregación y el alineador:
- Define la función de agregación como Sum para obtener el uso total de tokens.
- Haz clic en Configure Aligner para habilitar el cálculo de los cambios entre puntos de datos consecutivos de tu serie temporal. Esto ayuda a comprender las tendencias de uso a lo largo del tiempo.
Defina las dimensiones de agregación: Para desglosar el uso de tokens, seleccione location y base_model como dimensiones de agregación. De esta forma, podrás ver cómo varía el consumo de tokens en diferentes regiones y modelos.
Definir función de alineación: elige Sum como función de alineación para calcular el cambio total en el uso de tokens entre puntos de datos consecutivos.

Solicitud de aumento de cuota

Si es necesario, puedes solicitar un ajuste del aumento de cuota.

Si usas proyectos diferentes para los agentes de Dialogflow y para autenticarte con cuentas de servicio, solicita un aumento de cuota para el proyecto de consumidor. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).

En el caso de los agentes de Dialogflow ES, asegúrate de actualizar el agente a la edición Dialogflow Essentials antes de solicitar un aumento de cuota.

Tabla de cuotas

Para describir los precios y las cuotas, se utilizan los siguientes términos:

Solicitud: se define como solicitud cualquier llamada a la API al servicio Dialogflow, ya sea directa con la API o indirecta con la integración o la consola. Según la tarea y el diseño del agente, el número de solicitudes que se necesitan para que un usuario final complete una tarea con un agente de Dialogflow puede variar en gran medida.
Sesión: una sesión es una conversación entre un usuario final y un agente de Dialogflow. Esta se mantiene activa y sus datos se guardan durante 30 minutos después de que se haya enviado la última solicitud de esa sesión. Las sesiones pueden ser de chat o de voz.
- Sesión de chat: en las solicitudes y respuestas de estas sesiones solo se usa texto.
- Sesión de voz: en las sesiones de este tipo se usa audio para las solicitudes, para las respuestas o para ambas.
Proyectos de consumidores y de recursos: si tienes varios proyectos, es posible que el asociado a la autenticación de una solicitud (proyecto de consumidor) no coincida con el asociado al agente de la solicitud (proyecto de recursos). En este caso, el proyecto de consumidor se usa para determinar los precios y las cuotas. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).

En las siguientes tablas se muestra una comparación de las cuotas de las distintas ediciones por tipo de agente. A menos que se indique que la función está incluida, las cuotas son acumulativas para todas las funciones que use la solicitud.

Agente de Conversational Agents (Dialogflow CX)

Función	Edición de agentes conversacionales (Dialogflow CX)
Texto (incluidas todas las solicitudes DetectIntent, StreamingDetectIntent y FulfillIntent que no contienen audio)	1200 solicitudes por minuto
Entrada y salida de audio (reconocimiento, transcripción, síntesis de voz, conversión de texto a voz y telefonía)	600 solicitudes por minuto
Operaciones de consulta de audio con la voz en HD de Chirp 3 (síntesis de voz, conversión de texto a voz, telefonía)	25 solicitudes por minuto
Funciones generativas (manuales, almacenes de datos, generadores y modelo generativo de respaldo)	600.000 tokens por minuto. Consulta las cuotas generativas.
Pasarela de telefonía de Dialogflow CX Incluye entrada y salida de audio.	Total de 100 minutos telefónicos por minuto‡
Solicitudes de escritura durante el diseño Por ejemplo, llamadas para crear o actualizar un agente.	60 solicitudes por minuto
Solicitudes de lectura durante el diseño Por ejemplo, llamadas para enumerar u obtener recursos de agentes.	300 solicitudes por minuto
Otras solicitudes durante las sesiones Por ejemplo, para configurar u obtener entidades de la sesión.	100 solicitudes por minuto

Símbolo	Descripción
‡	Los "minutos telefónicos por minuto" son la suma total del tiempo que consumen los usuarios en llamadas telefónicas por minuto. Por ejemplo: en un periodo de 60 segundos, un usuario realiza una llamada de 60 segundos; otro, una de 30 segundos, y un tercero, una de 30 segundos. Como resultado, tenemos 2 minutos por minuto. Si se aumenta el número de minutos por minuto, más usuarios podrán emplear el sistema simultáneamente.

Símbolo

Descripción

‡

Los "minutos telefónicos por minuto" son la suma total del tiempo que consumen los usuarios en llamadas telefónicas por minuto. Por ejemplo: en un periodo de 60 segundos, un usuario realiza una llamada de 60 segundos; otro, una de 30 segundos, y un tercero, una de 30 segundos. Como resultado, tenemos 2 minutos por minuto. Si se aumenta el número de minutos por minuto, más usuarios podrán emplear el sistema simultáneamente.

Agente de Dialogflow ES

Función	Trial Edition	Essentials Edition
Texto (incluidas todas las solicitudes DetectIntent y StreamingDetectIntent que no contienen audio)	180 solicitudes por minuto ¶	600 solicitudes por minuto ¶
Entrada de audio (conocida también como "reconocimiento de voz" o "transcripción de voz")	100 solicitudes por minuto † 1000 solicitudes al día † 15.000 solicitudes al mes † Duración máxima del audio por solicitud: 60 segundos †	300 solicitudes por minuto † Duración máxima del audio por solicitud: 60 segundos †
Audio output (conocida también como "síntesis de voz")	Igual que la entrada de audio	Igual que la entrada de audio
Conectores de conocimiento (versión beta)	Tamaño total máximo del documento: 10 MB 1000 solicitudes al mes 100 solicitudes al día	Sin límite#
Análisis de sentimiento	No disponible	Sin límite#
Pasarela de telefonía de Dialogflow ES Incluye entrada y salida de audio.	Número gratuito: no disponible Total de 3 minutos telefónicos por minuto ‡ 30 minutos telefónicos al día 500 minutos telefónicos al mes Número de teléfono reservado durante 30 días	Total de 100 minutos telefónicos por minuto‡
Megaagente	1000 solicitudes diarias	Sin límite#
Solicitudes de escritura durante el diseño Por ejemplo, llamadas para crear o actualizar un agente.	60 solicitudes por minuto	60 solicitudes por minuto
Solicitudes de lectura durante el diseño Por ejemplo, llamadas para enumerar u obtener recursos de agentes.	60 solicitudes por minuto	60 solicitudes por minuto
Otras solicitudes durante las sesiones Por ejemplo, para configurar u obtener entidades de la sesión o para actualizar o consultar contexto.	100 solicitudes por minuto	100 solicitudes por minuto

Símbolo	Descripción
†	Cada flujo StreamingDetectIntent se considera una sola solicitud, aunque puede que esos flujos contengan varios marcos de audio de `StreamingDetectIntentRequest`.
‡	Los "minutos telefónicos por minuto" son la suma total del tiempo que consumen los usuarios en llamadas telefónicas por minuto. Por ejemplo: en un periodo de 60 segundos, un usuario realiza una llamada de 60 segundos; otro, una de 30 segundos, y un tercero, una de 30 segundos. Como resultado, tenemos 2 minutos por minuto. Si se aumenta el número de minutos por minuto, más usuarios podrán emplear el sistema simultáneamente.
#	Puede que las funciones marcadas como "sin límite" estén limitadas por el uso de otras funciones. Por ejemplo, aunque tu edición ofrezca una cuota ilimitada de conectores de conocimiento, las solicitudes de texto que usen estos conectores seguirán estando limitadas por la cuota de esas solicitudes.
¶	La entrada y la salida de audio del Asistente de Google se consideran solicitudes de texto.

Agent Assist

Si usas Asistente, también se aplican las cuotas que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Agente de Dialogflow ES, según el tipo de agente que utilices.

Función	Trial Edition	Essentials Edition
Otras operaciones de conversación de Agent Assist Incluye todas las solicitudes que gestionan conversaciones y participantes.	No disponible	300 solicitudes por minuto
Operaciones de análisis de texto o audio de Agent Assist Incluye todas las solicitudes de AnalyzeContent o StreamingAnalyzeContent de cualquier fase de conversación. Esto incluye todas las solicitudes de este tipo que impliquen texto, síntesis de voz o reconocimiento de voz.	No disponible	300 solicitudes por minuto
Sesiones de streaming bidireccional simultáneas Incluye todas las solicitudes de BidiStreamingAnalyzeContent de cualquier fase de conversación. Esto incluye todas las solicitudes de este tipo que impliquen síntesis o reconocimiento de voz.	No disponible	50 solicitudes simultáneas
Solicitudes de sondeo de sugerencias de resumen de conversaciones de Agent Assist Incluye todas las solicitudes para obtener resúmenes de conversaciones.	No disponible	60 solicitudes por minuto
Solicitudes de búsqueda de conocimientos de Agent Assist Incluye todas las solicitudes de SearchKnowledge de cualquier fase de conversación.	No disponible	60 solicitudes por minuto

Límites

Los límites son fijos. No se pueden aumentar. Muchos recursos y campos tienen limitaciones de recuento, duración o longitud que son restricciones fijas para la implementación de servicios.

Las siguientes tablas muestran los límites más frecuentes. La documentación específica de cada función y la de la referencia de la API pueden indicar límites adicionales.

Límites de recuento

Agente de Conversational Agents (Dialogflow CX)

Descripción	Límite
Número máximo de agentes por Google Cloud proyecto	1000
Número máximo de números de teléfono por proyecto (excepto en la región `global`)	5
Número máximo de números de teléfono por proyecto y región (excepto en la región `global`)	5
Número máximo de flujos por agente	50
Número máximo de tipos de entidades por agente	250
Número máximo de webhooks por agente	100
Número máximo de entornos por agente	20
Número máximo de casos de prueba por agente	2000
Número máximo de registros de cambios por agente	20.000
Número máximo de páginas por flujo	250
Número máximo de grupos de rutas por flujo	100
Número máximo de versiones por flujo	20
Número máximo de intents por agente	10.000
Número máximo de referencias a intents por flujo	2000
Número máximo de frases de entrenamiento por intent e idioma (excepto el intent negativo predeterminado)	2000
Número máximo de frases de entrenamiento por flujo e idioma	100.000
Número máximo de parámetros por intent	20
Número máximo de entradas por entidad	30.000
Número máximo de sinónimos por entrada de entidad	200
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma	1.000.000
Número máximo de parámetros por página	20
Número máximo de rutas por página	2000
Número máximo de gestores de eventos por página	100
Número máximo de rutas por grupo de rutas	2000
Número máximo de guiones por agente	50
Número máximo de invocaciones de cuadernos de estrategias en un turno de conversación	3
Número máximo de llamadas a LLM por invocación de playbook en el mismo turno de conversación	10
Número máximo de ejemplos de manuales por agente	Con la estrategia de recuperación de ejemplos predeterminada, el sistema limitará automáticamente el número de ejemplos para que se ajuste al límite de tokens del modelo que se esté usando, en función de la relevancia de los ejemplos para el contexto de la sesión.
Número máximo de versiones por manual de procedimientos	100
Número máximo de herramientas por agente	100

Agente de Dialogflow ES

Descripción	Límite
Número máximo de agentes por región y proyecto de Google Cloud ¶	1
Número máximo de números de teléfono por proyecto (excepto en la región `global`)	5
Número máximo de números de teléfono por proyecto y región (excepto en la región `global`)	5
Número máximo de intents	2000
Número máximo de tipos de entidades	250
Número máximo de frases de entrenamiento por intent e idioma	2000
Número máximo de frases de entrenamiento por agente e idioma	100.000
Número máximo de entradas de entidades	30.000
Número máximo de sinónimos por entrada de entidad	200
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma	1.000.000
Número máximo de parámetros por intent	20
Número máximo de contextos de entrada por intent	5
Número máximo de contextos de salida por intent	30
Número máximo de respuestas de texto por intent e idioma	30
Número máximo de peticiones por parámetro e idioma	30
Número máximo de entornos por agente	10
Número máximo de versiones por agente	1000

Agent Assist

Si usas Asistente, también se aplican los límites que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Dialogflow ES, según el tipo de agente que utilices.

Descripción	Límite
Número mínimo de conversaciones necesarias para entrenar el modelo	30.000
Número máximo de modelos entrenados simultáneamente por proyecto	1
Número máximo de números de teléfono por proyecto (excepto en la región `global`)	5
Número máximo de números de teléfono por proyecto y región (excepto en la región `global`)	5
Número máximo de horas de GPU de nodo de entrenamiento al mes	4200
Número máximo de perfiles de conversación	100

Límites de duración

Agente de Conversational Agents (Dialogflow CX)

Descripción	Límite
Tiempo de espera máximo por webhook	30 segundos
Duración máxima de la entrada de audio	120 segundos

Agente de Dialogflow ES

Descripción	Límite
Tiempo de espera máximo de webhook	5 segundos
Duración máxima de llamada telefónica	3,5 horas

Límites de longitud

Agente de Conversational Agents (Dialogflow CX)

Descripción	Límite
Longitud máxima de la frase de entrenamiento	768 caracteres
Longitud máxima de la respuesta de texto	4000 caracteres
Longitud máxima de la entrada de texto de detección de intent que coincide con intents no generativos o parámetros	256 caracteres

Agente de Dialogflow ES

Descripción	Límite
Longitud mínima del nombre del agente	1 carácter
Longitud máxima del nombre del agente	150 caracteres
Longitud máxima de la descripción del agente	500 caracteres
Longitud máxima del nombre del intent	100 caracteres
Longitud máxima del nombre del tipo de entidad	30 caracteres
Longitud máxima de la frase de entrenamiento	768 caracteres
Longitud máxima del nombre de la acción	250 caracteres
Longitud máxima del nombre del contexto	250 caracteres
Longitud máxima del valor de entrada	512 caracteres
Longitud máxima del nombre del parámetro	30 caracteres
Longitud máxima de la respuesta de texto	4000 caracteres
Longitud máxima de la entrada de texto de detección de intent*	256 caracteres
Longitud máxima del nombre del evento	150 caracteres

Límites de tamaño

Agente de Conversational Agents (Dialogflow CX)

Descripción	Límite
Tamaño máximo de la solicitud de síntesis de voz	Consulta los límites del contenido de la API TTS.
Tamaño máximo de las especificaciones de la herramienta	20 KB

Agente de Dialogflow ES

Descripción	Límite
Tamaño máximo del agente (contenido descomprimido) para importarlo o restaurarlo	50 MB
Tamaño máximo de la solicitud de síntesis de voz	Consulta los límites del contenido de la API TTS.