Configuración avanzada de voz

En esta guía, se proporciona una configuración avanzada adicional para las funciones de voz. Puedes activa o desactiva esta configuración avanzada en Configuración del agente > IVR y voz > Speech-to-Text > Configuración de voz avanzada.

Estos parámetros de configuración están disponibles en la configuración del agente (se aplica a todo el agente), la configuración del flujo (se aplica a todo el flujo y anula la configuración del agente), la configuración de la página (se aplica a la página y anula la configuración del flujo y del agente) y la configuración de entrega (se aplica a la entrega y anula la configuración de la página, el flujo y el agente). Un subconjunto de esta configuración está disponible en cada nivel, según la relevancia de la configuración del nivel. *Antes de configurar estos ajustes en cualquier nivel primero debes marcar la casilla Habilitar configuración de voz avanzada en A nivel del agente (Configuración del agente > IVR y voz > Speech-to-Text > Voz avanzada ).*

La configuración actualizada a nivel del agente no se propaga al flujo, la página ni la entrega cuando se selecciona la opción Personalizar en los niveles inferiores. Si el botón La opción Personalizar abarca varios parámetros de configuración y solo quieres actualizar Algunas de ellas, quizás también debas actualizar otras opciones de configuración si quieres que ser la misma que la configuración a nivel del agente.

Disponibilidad de la configuración por nivel

La siguiente tabla indica en qué configuración de voz avanzada están disponibles cada nivel:

Nombre del parámetro de configuración Agente Flujo Página Fulfillment
Selección del modelo (Speech-to-Text)
Sensibilidad al final de la voz
Sensibilidad avanzada al final de voz basada en tiempo de espera
Habilitar el extremo inteligente
Sin tiempo de espera de voz
Embarcación
Permitir la cancelación de la reproducción de una respuesta parcial
Bucket de exportación de audio
DTMF

Selección del modelo (Speech-to-Text)

Se puede configurar a nivel del agente, el flujo y la página.

Establece el modelo de voz que se usa para el reconocimiento de voz. Este parámetro de configuración es específicos para cada idioma, de modo que puedas seleccionar modelos diferentes para distintos idiomas. También puedes marcar Anular el modelo de voz a nivel de la solicitud, ya que esto hará que se muestre un modelo seleccionado para usarlo incluso si una llamada a la API del entorno de ejecución especifica un valor un modelo de responsabilidad compartida.

Para Dialogflow CX Phone Gateway, consulta limitaciones. Para obtener más información, consulta Modelos de voz.

Sensibilidad de fin de voz

Se puede configurar a nivel del agente, el flujo y la página.

Controla la sensibilidad para reconocer el final de la voz en la entrada de audio del usuario final. El valor varía de 0 (baja sensibilidad, menos probabilidad de finalizar la voz) a 100 (sensibilidad alta, es más probable que finalice la voz).

Sensibilidad avanzada al final de voz basada en tiempo de espera

Se puede configurar a nivel del agente y se puede inhabilitar a nivel del flujo y de la página.

Si este parámetro de configuración está habilitado, el valor de configuración de Sensibilidad al final de la voz se usa como un indicador para establecer un tiempo de espera de silencio de audio relativo para determinar el final de la voz. Si se inhabilita este parámetro de configuración (predeterminado), El valor de configuración de sensibilidad del fin de voz se usa para determinar el final de por el modelo de AA proporcionado por Google Cloud Speech-to-Text.

El parámetro de configuración Sensibilidad del final de voz solo admite el parámetro phone_call modelo de voz para el idioma en-US etiqueta de forma predeterminada, la opción Habilitar la sensibilidad avanzada del fin de la voz basada en tiempo de espera permite configurar la sensibilidad de fin de la voz para todos los idiomas y modelos de voz compatibles con Dialogflow.

Habilitar el extremo inteligente

Solo se puede configurar a nivel del agente.

Si se habilita este parámetro de configuración, Dialogflow CX analizará la entrada parcial del usuario para determinar el final de la voz. Por ejemplo, si el usuario dice: “Me gustaría” y Dialogflow CX esperará a que el usuario continúe la oración.

Esto es particularmente útil para la recopilación de parámetros numéricos, en los que el usuario podría decir "1234" y detente antes de decir "5678". Para aplicar este parámetro de configuración para un parámetro específico, debes configurar la dirección de extremo inteligente en el formulario del parámetro.

Este parámetro de configuración solo está disponible para la etiqueta de idioma en-US y lo inhabilita en de forma predeterminada.

Sin tiempo de espera de voz

Se puede configurar a nivel del agente, el flujo y la página.

La duración en segundos en la que Dialogflow CX dejará de esperar al usuario final entrada de audio. El valor predeterminado es 5 segundos y el valor máximo es 60 segundos. Para este tiempo de espera, Dialogflow CX invoca un evento sin entrada.

Interrupción

Se puede configurar a nivel de agente, flujo y entrega.

Cuando se habilita, un usuario final puede interrumpir el audio de la respuesta de Dialogflow CX. Cuándo interrumpida, Dialogflow CX dejará de enviar audio y procesará el siguiente la entrada del usuario final.

Si hay varios mensajes en la fila de mensajes: y un mensaje se puso en cola por una entrega asociada a una página, un flujo o un agente que tenga habilitada la conexión, todos los siguientes mensajes de la cola también tienen habilitadas las interrupciones. En este caso, la integración dejará de reproducir audio durante todos los mensajes en cola con las interrupciones habilitadas.

Permitir la cancelación de la reproducción de una respuesta parcial

Solo se puede configurar a nivel de entrega.

Puedes habilitar este parámetro de configuración cuando el cuadro Habilitar configuración de voz avanzada esté marcado en Configuración del agente > IVR y voz y respuesta parcial está habilitado a nivel de entrega. Este parámetro de configuración permite cancelar una reproducción de respuesta parcial.

Si un mensaje está en la fila de mensajes una entrega que permite la cancelación, la reproducción del mensaje se se cancelará si se agrega otro mensaje a la cola. Esto es útil cuando quieres un mensaje inicial para comenzar la reproducción, pero para que esta se cancele si una un webhook en funcionamiento produce otro mensaje antes de la reproducción del mensaje inicial. de datos completados.

Bucket de exportación de audio

Se puede configurar a nivel de agente y flujo.

Si se proporcionan, todos los datos de audio asociados con una solicitud se guardarán en Bucket de Cloud Storage:

Se guardó el audio Solicitudes aplicables
Entrada de audio del usuario final DetectIntent, StreamingDetectIntent, AnalyzeContent y StreamingAnalyzeContent
Audio de Text-to-Speech (TTS) sintetizado para una respuesta AnalyzeContent y StreamingAnalyzeContent

Otorga el rol Creador de objetos de almacenamiento a las siguientes cuentas de servicio en tu proyecto:

  • A la cuenta de servicio con el formato one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com si usas una integración de telefonía incorporada para socios.

  • A la cuenta de servicio con el formato service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com si usas la integración de la Puerta de enlace telefónica de Dialogflow CX. Para encontrar esta cuenta de servicio en IAM, marca el campo Incluir Opción de asignaciones de roles proporcionadas por Google.

DTMF

Consulta la Documentación de DTMF (señalización de multifrecuencia de doble tono) para obtener más información sobre esta función.