Los agentes de voz de Dialogflow usan la función Transcripción de voz para el reconocimiento de voz, que se incluye en los precios de Dialogflow. Dialogflow selecciona automáticamente un modelo de reconocimiento de voz, pero también puedes especificarlo.
Modelos disponibles
Todos los modelos disponibles se enumeran en la página Modelos de Speech-to-Text. Selecciona el modelo que mejor se adapte a tu dominio y admita el idioma y las funciones de voz de tu agente.
Si no se especifica un modelo de forma explícita, Dialogflow seleccionará automáticamente uno en función de la configuración de audio de las solicitudes de la API y de los ajustes del agente.
Si el modelo de voz mejorado está habilitado para el agente y no existe una versión mejorada del modelo especificado para el idioma, la voz se reconoce con la versión estándar del modelo especificado.Los siguientes modelos suelen tener el mejor rendimiento:
- telephony_short (la mejor opción para Dialogflow de telefonía)
- Telefonía (la mejor opción para Agent Assist)
- phone_call (adecuado para Agent Assist y Dialogflow de telefonía)
- latest_short (la mejor opción para Dialogflow que no sea de telefonía)
- command_and_search (la mejor opción para los idiomas en los que no hay otros modelos disponibles)
Especificar un modelo
Puedes proporcionar el modelo al llamar a los métodosdetectIntent
o streamingDetectIntent
en el tipo Sessions
o al configurar ConversationProfile
para Asistencia del agente.