En esta guía se ofrecen prácticas recomendadas específicas para diseñar agentes de voz. Cuando diseñas un agente de voz, el objetivo es ayudar a los usuarios finales a completar una tarea sin tener que derivarlos a un agente humano. Los usuarios deben sentir que están manteniendo una conversación natural, interactiva y cooperativa con el agente de voz.
También deberías consultar la guía de diseño general de agentes para todos los tipos de agentes y la guía de prácticas recomendadas para usar el servicio Dialogflow.
Medir la calidad de los agentes
Para medir la calidad de la experiencia de usuario de tu agente, te recomendamos que monitorices las siguientes métricas:
Ruta incorrecta: cuántas personas que han llamado han llegado al lugar equivocado.
Resolución en la primera llamada: número de llamadas que se resuelven en la primera llamada o contacto.
Tiempo medio de gestión: tiempo que se tarda en resolver el problema del usuario.
Satisfacción del cliente: la puntuación que obtiene tu agente de voz en una encuesta de usuarios.
Número de turnos: cuántas interacciones se necesitan para completar la tarea del usuario.
Abandono de usuarios: frecuencia con la que los usuarios dejan de participar en la conversación.
Reconocimiento de voz
Los siguientes consejos pueden ayudar a tu agente a reconocer el habla del usuario final:
- Tu agente debe animar al usuario final a usar frases largas o completas. De esta forma, se mejora la calidad del reconocimiento.
- Te recomendamos que uses un webhook para verificar la entrada del usuario final que puede que no se reconozca con precisión o que deba validarse.
- Usa intenciones alternativas para pedirle al usuario final que hable más despacio y con más claridad.
Estructura de la conversación
Una conversación con un agente de voz suele organizarse en la siguiente secuencia:
Actividad | Ejemplo | Notas |
---|---|---|
Actividad de apertura | El usuario inicia sesión o llama a tu centro de contacto. Agente de voz: Hola, soy de Travel Inc. ¿En qué puedo ayudarte? |
El agente de voz inicia la conversación con un mensaje de bienvenida. |
Secuencia principal | Usuario: Quiero reservar un billete de avión. Agente de voz: vale, ¿adónde quieres ir? Usuario: Guatemala, 19 de mayo a las 21:00. Agente de voz: vale, te hemos reservado un billete para Guatemala el 19 de mayo a las 21:00. |
El usuario define la tarea y el agente de voz la completa. Puede que el agente de voz tarde varias interacciones en recoger toda la información necesaria. |
Cerrar actividad | Agente de voz: ¿Puedo ayudarte en algo más? Usuario: no Agente de voz: vale, gracias por chatear conmigo. |
El usuario está listo para finalizar la conversación cuando se haya completado su solicitud. |
Mensaje de bienvenida
Cuando diseñes el mensaje inicial para el usuario, piensa en cómo llegar al primer tema lo antes posible. El mensaje de bienvenida debe ser breve y directo. Estas son algunas sugerencias:
- Responde a la llamada con frases como "Hola".
- Identifica al agente de voz con frases como "Soy el agente o asistente de voz de la empresa XYZ".
- Mostrar disponibilidad con frases como "¿En qué puedo ayudarte?"
Cualquier información adicional puede frustrar a los usuarios y hacer que se pongan en contacto con un agente humano. Sin embargo, es posible que tengas que ampliar el mensaje de bienvenida por motivos legales, como informar al usuario de que la conversación se puede grabar.
Evita la información que haga que la conversación suene poco natural o desequilibrada. Por ejemplo:
Qué debes hacer | Qué no debes hacer |
---|---|
Usa el lenguaje que quieras que utilicen tus usuarios. Por ejemplo, si quieres que el usuario explique las cosas en una o dos frases, limita tu agente de voz a una o dos frases por turno. | No indiques a los usuarios cómo deben hablar con frases como "en una o dos frases, dime…" o "puedes decir cosas como…". |
Céntrate en la tarea que quiere completar el usuario y diseña estrategias de gestión de errores por si la conversación falla. | No digas a los usuarios lo que puede hacer el agente de voz con frases como "Puedo ayudarte a resolver problemas complejos". |
Pares de turnos de conversación
Una conversación típica consta de pares de turnos, como los siguientes tipos de intercambios:
- Pregunta-respuesta, que es la más habitual en los agentes de voz
- invitation-acceptance/rejection
- greetings-greetings
A veces, un par de turnos puede incluir texto adicional, como una explicación sobre por qué necesitamos hacer una pregunta, información general relacionada con la pregunta que queremos hacer o una reacción a la respuesta del usuario. Por ejemplo, echa un vistazo al siguiente par de turnos de pregunta y respuesta:
Agente de voz: te costará 10 USD al día. (información o explicación) ¿Quieres seguir añadiendo esta ventaja? (pregunta)
Usuario: Sí. (answer)
Agente de voz: ¡Genial! (reacción)
Reparación de conversaciones
La reparación de conversaciones es la práctica de corregir malentendidos, errores al escuchar y errores de articulación para reanudar una conversación. Reparar una conversación puede ayudar a generar confianza en el usuario, ya que demuestra que el agente de voz está escuchando su solicitud.
Te indicamos algunas prácticas recomendadas:
Sé específico y usa el contexto que el usuario ya ha ofrecido en turnos anteriores. Evita hacer preguntas obvias y redundantes, como "No te he entendido", "No lo entiendo" o "Tengo problemas".
Ofrece al usuario la oportunidad de corregir su respuesta, lo que significa permitirle corregir su turno de la forma que considere más adecuada para asegurarse de que tiene el control de la conversación. Evita frases como "prueba a reformularlo" o "puedes decir x, y o z".
Usa la estructura "¿Quieres decir x?" para comprobar si has entendido bien lo que te han dicho.
En la siguiente tabla se describen varios ejemplos de lo que se debe y no se debe hacer:
Qué debes hacer | Qué no debes hacer |
---|---|
Usuario: Voy a viajar a Italia. Agente de Voice: ¿En qué país? |
Usuario: Voy a viajar a Italia. Agente de voz: lo siento, estoy teniendo problemas. ¿Puedes reformularlo? ¿A dónde vas? |
Usuario: Quiero pagar 80 $. Agente de voz: ¿Quieres decir 80 €? (Repite solo la información que necesita confirmación) |
Usuario: Quiero pagar 80 $. Agente de voz: ¿quieres pagar 80 €? (Repite la información redundante "quiero pagar") |
Técnicas de conversación
En esta sección se describen técnicas para ayudar al agente de voz a generar confianza entre los usuarios y a que las conversaciones se desarrollen con mayor fluidez.
Diseñar preguntas prácticas
Diseña preguntas explícitas y prácticas para que tu agente de voz se las haga al usuario. Por ejemplo, ten en cuenta lo siguiente:
Qué debes hacer | Qué no debes hacer |
---|---|
Haz preguntas abiertas, como "¿Cuándo vas a viajar?", que animen al usuario a proporcionar fechas si las sabe o a decir "No lo sé" si no las sabe. | No preguntes "¿Sabes las fechas de tu viaje?", ya que solo se puede responder con un sí o un no y es menos útil. |
Pregunta: "¿Quieres consultar el estado de otro paquete?" | No preguntes "¿Quieres consultar el estado de otro paquete?" |
También debes preparar tu agente de voz para situaciones en las que el usuario pueda responder a una pregunta de forma implícita, como suele ocurrir en las conversaciones naturales. Por ejemplo, considera la siguiente interacción:
Agente de voz: ve a Cuenta, haz clic en Uso y, a continuación, en Uso por línea. Avísame cuando llegues.
Usuario: dice que no puedo ver datos de hace 3 meses o más.
La respuesta del usuario implica que ha llegado correctamente a la pantalla de destino, pero que aún necesita más ayuda. Tu agente de voz debe anticipar estas implicaciones en lugar de esperar que el usuario solo diga "He llegado" o "No he llegado".
Ganarse la confianza de los usuarios
Los agentes de voz pueden mostrar a los usuarios que les están escuchando mediante confirmaciones y detalles específicos. Si el agente de voz ofrece respuestas genéricas, los usuarios pueden pensar que no suena natural.
Usa confirmaciones. Por ejemplo, en la siguiente conversación, se usa "No hay problema" como confirmación:
Usuario: Quiero concertar un acuerdo de pago para el lunes.
Agente de voz: no hay problema. ¿Cuánto quieres pagar el lunes?
Añade detalles específicos para demostrar que el agente de voz está escuchando activamente al usuario. Por ejemplo, en la conversación anterior, la frase "el lunes" es un detalle específico que indica que el agente de voz ha oído lo que ha dicho el usuario.
Responde a la solicitud del usuario lo antes posible y excluye cualquier paso innecesario. En el siguiente ejemplo, la información superflua puede provocar frustración en el usuario:
Usuario: ¿Hay una interrupción del servicio en mi zona?
Agente de voz: sabemos lo importante que es para ti mantenerte conectado. Vamos a averiguar qué está causando este problema. Indícanos los cuatro últimos dígitos de la línea con la que tienes problemas. Si el problema se produce en varias líneas, indícanos una por ahora.
Usuario: 1234
Agente de voz: gracias. Voy a consultar los pasos que debes seguir para esta línea. Ahora, empecemos. Desactivar y volver a activar la voz en HD temporalmente puede ser la solución. ¿Te ha funcionado?"
Asegúrate de que la conversación entre el usuario y el agente de voz sea equilibrada. Los usuarios pueden sentir que no tienen control sobre la conversación si el agente de voz la domina. Prioriza las preguntas que empiezan por quién, dónde, qué, cuándo y cómo sobre las que empiezan por sí o no.
Asegúrate de que la conversación del usuario se transfiera sin problemas cuando quiera hablar con agentes humanos.
Información adicional
Consulta la guía de diseño de conversaciones del equipo de Actions on Google.
Consulta la guía de prácticas recomendadas de Voice para los próximos mil millones de usuarios.
Consulta la guía de SSML de Cloud Text-to-Speech.
Consulta más información sobre los actos de habla para diseñar preguntas que permitan realizar acciones.