En este documento se especifican las cuotas y los límites más habituales del uso de Dialogflow. A continuación, se explica cómo encontrar una lista completa de cuotas y límites. Nos reservamos el derecho de cambiar estas restricciones, en cuyo caso actualizaremos esta página para reflejar cualquier cambio.
Cuotas
Las cuotas son límites predeterminados que se aplican a tu proyecto. Cuando se usan funciones generativas, cada combinación de modelo y región tiene su propia cuota generativa. Si usas una edición de pago, puedes solicitar un aumento de cuota. El objetivo de estas cuotas es limitar la carga de servicio por cliente, lo que protege al servicio de la sobrecarga y, al cliente, de un uso de recursos inesperado.
Las cuotas de Dialogflow varían en función de cuál sea la edición de tu agente. Las cuotas se aplican a todos los proyectos y se comparten en todas las aplicaciones y direcciones IP que utilicen un proyecto.
Información sobre los límites de tiempo de las cuotas:
- Las cuotas por mes se renuevan el primer día de cada mes a las 00:00 (UTC-8).
- Las cuotas por día se renuevan diariamente a las 00:00 (UTC-8). Cuando la duración de un día aumenta por el cambio al horario de verano, se concede una cuota extra de forma proporcional. Sin embargo, no se resta la cuota proporcional si la duración del día se reduce por el cambio al horario de invierno.
- Las cuotas por minuto se actualizan cada 60 segundos.
Las cuotas que aparecen en la tabla de cuotas son las más frecuentes. Para revisarlas todas, consulta la página Google Cloud Cuotas de Dialogflow de la consola.
Cuotas generativas
Cuando tu agente usa las funciones generativas de Conversational Agents (Dialogflow CX), cada combinación de modelo y región tiene cuotas únicas.
Identificador de cuota
La cuota ConversationalAgentLlmTokenConsumption
es una cuota regional que monitoriza el uso de tokens de los modelos de lenguaje extensos (LLMs) en los agentes conversacionales (Dialogflow CX).
Esta cuota se mide en diferentes modelos base de LLM y actualmente admite los siguientes modelos:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
La cuota de ConversationalAgentLlmTokenConsumption
monitoriza el uso de tokens de LLM en las siguientes funciones de Conversational Agents (Dialogflow CX):
- Generadores
- Generative Fallback
- Guía
- Datastore
El límite predeterminado de la cuota ConversationalAgentLlmTokenConsumption
es de 600.000 tokens por minuto.
Solicitud de aumento de cuota multirregional
Si necesitas solicitar un aumento de cuota para una multirregión, envía tu solicitud para una de las siguientes regiones específicas:
- En el caso de los agentes de las multirregiones EE. UU. y Global, usa us-central1.
- En el caso de los agentes de la multirregión UE, usa europe-west4.
Visualizar el uso de tokens por región y modelo
Para obtener información valiosa sobre el consumo de tokens de tu LLM en diferentes regiones y modelos, sigue estos pasos con el explorador de métricas:
- Acceder a Explorador de métricas: Abre Explorador de métricas.
- Seleccione la métrica:
elija
Conversational Agent LLM tokens quota usage
como métrica que quiera analizar. - Configurar la agregación y el alineador:
- Define la función de agregación como
Sum
para obtener el uso total de tokens. - Haz clic en
Configure Aligner
para habilitar el cálculo de los cambios entre puntos de datos consecutivos de tu serie temporal. Esto ayuda a comprender las tendencias de uso a lo largo del tiempo.
- Define la función de agregación como
- Defina las dimensiones de agregación:
Para desglosar el uso de tokens, seleccione
location
ybase_model
como dimensiones de agregación. De esta forma, podrás ver cómo varía el consumo de tokens en diferentes regiones y modelos. - Definir función de alineación:
elige
Sum
como función de alineación para calcular el cambio total en el uso de tokens entre puntos de datos consecutivos.
Solicitud de aumento de cuota
Si es necesario, puedes solicitar un ajuste del aumento de cuota.
Si usas proyectos diferentes para los agentes de Dialogflow y para autenticarte con cuentas de servicio, solicita un aumento de cuota para el proyecto de consumidor. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).
En el caso de los agentes de Dialogflow ES, asegúrate de actualizar el agente a la edición Dialogflow Essentials antes de solicitar un aumento de cuota.
Tabla de cuotas
Para describir los precios y las cuotas, se utilizan los siguientes términos:
- Solicitud: se define como solicitud cualquier llamada a la API al servicio Dialogflow, ya sea directa con la API o indirecta con la integración o la consola. Según la tarea y el diseño del agente, el número de solicitudes que se necesitan para que un usuario final complete una tarea con un agente de Dialogflow puede variar en gran medida.
- Sesión: una sesión es una conversación entre un usuario final y un agente de Dialogflow.
Esta se mantiene activa y sus datos se guardan durante 30 minutos después de que se haya enviado la última solicitud de esa sesión.
Las sesiones pueden ser de chat o de voz.
- Sesión de chat: en las solicitudes y respuestas de estas sesiones solo se usa texto.
- Sesión de voz: en las sesiones de este tipo se usa audio para las solicitudes, para las respuestas o para ambas.
- Proyectos de consumidores y de recursos: si tienes varios proyectos, es posible que el asociado a la autenticación de una solicitud (proyecto de consumidor) no coincida con el asociado al agente de la solicitud (proyecto de recursos). En este caso, el proyecto de consumidor se usa para determinar los precios y las cuotas. Para obtener más información, consulta las páginas sobre usar varios proyectos con Dialogflow ES o con Conversational Agents (Dialogflow CX).
En las siguientes tablas se muestra una comparación de las cuotas de las distintas ediciones por tipo de agente. A menos que se indique que la función está incluida, las cuotas son acumulativas para todas las funciones que use la solicitud.
Agente de Conversational Agents (Dialogflow CX)
Función | Edición de agentes conversacionales (Dialogflow CX) |
---|---|
Texto (incluidas todas las solicitudes DetectIntent, StreamingDetectIntent y FulfillIntent que no contienen audio) |
1200 solicitudes por minuto |
Entrada y salida de audio (reconocimiento, transcripción, síntesis de voz, conversión de texto a voz y telefonía) |
600 solicitudes por minuto |
Operaciones de consulta de audio con la voz en HD de Chirp 3 (síntesis de voz, conversión de texto a voz, telefonía) |
25 solicitudes por minuto |
Funciones generativas (manuales, almacenes de datos, generadores y modelo generativo de respaldo) |
600.000 tokens por minuto. Consulta las cuotas generativas. |
Pasarela de telefonía de Dialogflow CX Incluye entrada y salida de audio. |
Total de 100 minutos telefónicos por minuto‡ |
Solicitudes de escritura durante el diseño Por ejemplo, llamadas para crear o actualizar un agente. |
60 solicitudes por minuto |
Solicitudes de lectura durante el diseño Por ejemplo, llamadas para enumerar u obtener recursos de agentes. |
300 solicitudes por minuto |
Otras solicitudes durante las sesiones Por ejemplo, para configurar u obtener entidades de la sesión. |
100 solicitudes por minuto |
Símbolo | Descripción |
---|---|
‡ | Los "minutos telefónicos por minuto" son la suma total del tiempo que consumen los usuarios en llamadas telefónicas por minuto. Por ejemplo: en un periodo de 60 segundos, un usuario realiza una llamada de 60 segundos; otro, una de 30 segundos, y un tercero, una de 30 segundos. Como resultado, tenemos 2 minutos por minuto. Si se aumenta el número de minutos por minuto, más usuarios podrán emplear el sistema simultáneamente. |
Agente de Dialogflow ES
Función | Trial Edition | Essentials Edition |
---|---|---|
Texto (incluidas todas las solicitudes DetectIntent y StreamingDetectIntent que no contienen audio) |
180 solicitudes por minuto ¶ | 600 solicitudes por minuto ¶ |
Entrada de audio (conocida también como "reconocimiento de voz" o "transcripción de voz") |
100 solicitudes por minuto † 1000 solicitudes al día † 15.000 solicitudes al mes † Duración máxima del audio por solicitud: 60 segundos † |
300 solicitudes por minuto † Duración máxima del audio por solicitud: 60 segundos † |
Audio output (conocida también como "síntesis de voz") |
Igual que la entrada de audio | Igual que la entrada de audio |
Conectores de conocimiento (versión beta) | Tamaño total máximo del documento: 10 MB 1000 solicitudes al mes 100 solicitudes al día |
Sin límite# |
Análisis de sentimiento | No disponible | Sin límite# |
Pasarela de telefonía de Dialogflow ES Incluye entrada y salida de audio. |
Número gratuito: no disponible Total de 3 minutos telefónicos por minuto ‡ 30 minutos telefónicos al día 500 minutos telefónicos al mes Número de teléfono reservado durante 30 días |
Total de 100 minutos telefónicos por minuto‡ |
Megaagente | 1000 solicitudes diarias | Sin límite# |
Solicitudes de escritura durante el diseño Por ejemplo, llamadas para crear o actualizar un agente. |
60 solicitudes por minuto | 60 solicitudes por minuto |
Solicitudes de lectura durante el diseño Por ejemplo, llamadas para enumerar u obtener recursos de agentes. |
60 solicitudes por minuto | 60 solicitudes por minuto |
Otras solicitudes durante las sesiones Por ejemplo, para configurar u obtener entidades de la sesión o para actualizar o consultar contexto. |
100 solicitudes por minuto | 100 solicitudes por minuto |
Símbolo | Descripción |
---|---|
† | Cada flujo StreamingDetectIntent se considera una sola solicitud, aunque puede que esos flujos contengan varios marcos de audio de StreamingDetectIntentRequest . |
‡ | Los "minutos telefónicos por minuto" son la suma total del tiempo que consumen los usuarios en llamadas telefónicas por minuto. Por ejemplo: en un periodo de 60 segundos, un usuario realiza una llamada de 60 segundos; otro, una de 30 segundos, y un tercero, una de 30 segundos. Como resultado, tenemos 2 minutos por minuto. Si se aumenta el número de minutos por minuto, más usuarios podrán emplear el sistema simultáneamente. |
# | Puede que las funciones marcadas como "sin límite" estén limitadas por el uso de otras funciones. Por ejemplo, aunque tu edición ofrezca una cuota ilimitada de conectores de conocimiento, las solicitudes de texto que usen estos conectores seguirán estando limitadas por la cuota de esas solicitudes. |
¶ | La entrada y la salida de audio del Asistente de Google se consideran solicitudes de texto. |
Agent Assist
Si usas Asistente, también se aplican las cuotas que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Agente de Dialogflow ES, según el tipo de agente que utilices.
Función | Trial Edition | Essentials Edition |
---|---|---|
Otras operaciones de conversación de Agent Assist Incluye todas las solicitudes que gestionan conversaciones y participantes. |
No disponible | 300 solicitudes por minuto |
Operaciones de análisis de texto o audio de Agent Assist Incluye todas las solicitudes de AnalyzeContent o StreamingAnalyzeContent de cualquier fase de conversación. Esto incluye todas las solicitudes de este tipo que impliquen texto, síntesis de voz o reconocimiento de voz. |
No disponible | 300 solicitudes por minuto |
Solicitudes de sondeo de sugerencias de resumen de conversaciones de Agent Assist Incluye todas las solicitudes para obtener resúmenes de conversaciones. |
No disponible | 60 solicitudes por minuto |
Solicitudes de búsqueda de conocimientos de Agent Assist Incluye todas las solicitudes de SearchKnowledge de cualquier fase de conversación. |
No disponible | 60 solicitudes por minuto |
Límites
Los límites son fijos. No se pueden aumentar. Muchos recursos y campos tienen limitaciones de recuento, duración o longitud que son restricciones fijas para la implementación de servicios.
Las siguientes tablas muestran los límites más frecuentes. La documentación específica de cada función y la de la referencia de la API pueden indicar límites adicionales.
Límites de recuento
Agente de Conversational Agents (Dialogflow CX)
Descripción | Límite |
---|---|
Número máximo de agentes por Google Cloud proyecto | 1000 |
Número máximo de números de teléfono por proyecto (excepto en la región global ) |
5 |
Número máximo de números de teléfono por proyecto y región (excepto en la región global ) |
5 |
Número máximo de flujos por agente | 50 |
Número máximo de tipos de entidades por agente | 250 |
Número máximo de webhooks por agente | 100 |
Número máximo de entornos por agente | 20 |
Número máximo de casos de prueba por agente | 2000 |
Número máximo de registros de cambios por agente | 20.000 |
Número máximo de páginas por flujo | 250 |
Número máximo de grupos de rutas por flujo | 100 |
Número máximo de versiones por flujo | 20 |
Número máximo de intents por agente | 10.000 |
Número máximo de referencias a intents por flujo | 2000 |
Número máximo de frases de entrenamiento por intent e idioma (excepto el intent negativo predeterminado) | 2000 |
Número máximo de frases de entrenamiento por flujo e idioma | 100.000 |
Número máximo de parámetros por intent | 20 |
Número máximo de entradas por entidad | 30.000 |
Número máximo de sinónimos por entrada de entidad | 200 |
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma | 1.000.000 |
Número máximo de parámetros por página | 20 |
Número máximo de rutas por página | 2000 |
Número máximo de gestores de eventos por página | 100 |
Número máximo de rutas por grupo de rutas | 2000 |
Número máximo de guiones por agente | 50 |
Número máximo de invocaciones de cuadernos de estrategias en un turno de conversación | 3 |
Número máximo de llamadas a LLM por invocación de playbook en el mismo turno de conversación | 10 |
Número máximo de ejemplos de manuales por agente | Con la estrategia de recuperación de ejemplos predeterminada, el sistema limitará automáticamente el número de ejemplos para que se ajuste al límite de tokens del modelo que se esté usando, en función de la relevancia de los ejemplos para el contexto de la sesión. |
Número máximo de versiones por manual de procedimientos | 100 |
Número máximo de herramientas por agente | 100 |
Agente de Dialogflow ES
Descripción | Límite |
---|---|
Número máximo de agentes por región y proyecto de Google Cloud ¶ | 1 |
Número máximo de números de teléfono por proyecto (excepto en la región global ) |
5 |
Número máximo de números de teléfono por proyecto y región (excepto en la región global ) |
5 |
Número máximo de intents | 2000 |
Número máximo de tipos de entidades | 250 |
Número máximo de frases de entrenamiento por intent e idioma | 2000 |
Número máximo de frases de entrenamiento por agente e idioma | 100.000 |
Número máximo de entradas de entidades | 30.000 |
Número máximo de sinónimos por entrada de entidad | 200 |
Número máximo de sinónimos y valores de referencia de entidad por agente e idioma | 1.000.000 |
Número máximo de parámetros por intent | 20 |
Número máximo de contextos de entrada por intent | 5 |
Número máximo de contextos de salida por intent | 30 |
Número máximo de respuestas de texto por intent e idioma | 30 |
Número máximo de peticiones por parámetro e idioma | 30 |
Número máximo de entornos por agente | 10 |
Número máximo de versiones por agente | 1000 |
¶ | El número máximo de agentes por cuenta depende del número de proyectos de Google que puedas crear en tu cuenta. Consulta cómo solicitar más proyectos. |
Agent Assist
Si usas Asistente, también se aplican los límites que se indican en las pestañas Agente de Conversational Agents (Dialogflow CX) y Dialogflow ES, según el tipo de agente que utilices.
Descripción | Límite |
---|---|
Número mínimo de conversaciones necesarias para entrenar el modelo | 30.000 |
Número máximo de modelos entrenados simultáneamente por proyecto | 1 |
Número máximo de números de teléfono por proyecto (excepto en la región global ) |
5 |
Número máximo de números de teléfono por proyecto y región (excepto en la región global ) |
5 |
Número máximo de horas de GPU de nodo de entrenamiento al mes | 4200 |
Número máximo de perfiles de conversación | 100 |
Límites de duración
Agente de Conversational Agents (Dialogflow CX)
Descripción | Límite |
---|---|
Tiempo de espera máximo por webhook | 30 segundos |
Duración máxima de la entrada de audio | 120 segundos |
Agente de Dialogflow ES
Descripción | Límite |
---|---|
Tiempo de espera máximo de webhook | 5 segundos |
Duración máxima de llamada telefónica | 3,5 horas |
Límites de longitud
Agente de Conversational Agents (Dialogflow CX)
Descripción | Límite |
---|---|
Longitud máxima de la frase de entrenamiento | 768 caracteres |
Longitud máxima de la respuesta de texto | 4000 caracteres |
Longitud máxima de la entrada de texto de detección de intent que coincide con intents no generativos o parámetros | 256 caracteres |
Agente de Dialogflow ES
Descripción | Límite |
---|---|
Longitud mínima del nombre del agente | 1 carácter |
Longitud máxima del nombre del agente | 150 caracteres |
Longitud máxima de la descripción del agente | 500 caracteres |
Longitud máxima del nombre del intent | 100 caracteres |
Longitud máxima del nombre del tipo de entidad | 30 caracteres |
Longitud máxima de la frase de entrenamiento | 768 caracteres |
Longitud máxima del nombre de la acción | 250 caracteres |
Longitud máxima del nombre del contexto | 250 caracteres |
Longitud máxima del valor de entrada | 512 caracteres |
Longitud máxima del nombre del parámetro | 30 caracteres |
Longitud máxima de la respuesta de texto | 4000 caracteres |
Longitud máxima de la entrada de texto de detección de intent* | 256 caracteres |
Longitud máxima del nombre del evento | 150 caracteres |
* | Este es el límite que implementa obligatoriamente el servicio Dialogflow. Si usas una integración, su plataforma puede tener un límite inferior. Consulta los detalles de tu integración. |
Límites de tamaño
Agente de Conversational Agents (Dialogflow CX)
Descripción | Límite |
---|---|
Tamaño máximo de la solicitud de síntesis de voz | Consulta los límites del contenido de la API TTS. |
Tamaño máximo de las especificaciones de la herramienta | 20 KB |
Agente de Dialogflow ES
Descripción | Límite |
---|---|
Tamaño máximo del agente (contenido descomprimido) para importarlo o restaurarlo | 50 MB |
Tamaño máximo de la solicitud de síntesis de voz | Consulta los límites del contenido de la API TTS. |