Crea un conjunto de datos de conversaciones

Un conjunto de datos de conversación contiene datos de transcripciones de conversaciones y se usa para entrenar un modelo personalizado de Respuesta inteligente o de Resumen. La Respuesta inteligente usa las transcripciones de la conversación para recomendar respuestas de texto a los agentes humanos que conversan con un usuario final. Los modelos personalizados de resumen se entrenan con conjuntos de datos de conversaciones que contienen datos de transcripciones y de anotaciones. Usan las anotaciones para generar resúmenes de conversaciones para los agentes humanos después de que finaliza una conversación.

Hay dos formas de crear un conjunto de datos: con los flujos de trabajo del instructivo de la consola o creando un conjunto de datos de forma manual en la consola con la pestaña Datos -> Conjuntos de datos. Te recomendamos que uses los instructivos de la consola como primera opción. Para usar los instructivos de la consola, navega a la consola de Agent Assist y haz clic en el botón Comenzar debajo de la función que quieras probar.

En esta página, se muestra cómo crear un conjunto de datos de forma manual.

Antes de comenzar

  1. Sigue las instrucciones de configuración de Dialogflow para habilitar Dialogflow en un proyecto de Google Cloud Platform.

  2. Te recomendamos que leas la página de conceptos básicos de Agent Assist antes de comenzar este instructivo.

  3. Si implementas Smart Reply con tus propios datos de transcripción, asegúrate de que las transcripciones estén en JSON en el formato especificado y almacenadas en un bucket de Google Cloud Storage. Un conjunto de datos de conversaciones debe contener al menos 30,000 conversaciones. De lo contrario, fallará el entrenamiento de modelos. Como regla general, cuantas más conversaciones tengas, mejor será la calidad de tu modelo. Te sugerimos que quites las conversaciones con menos de 20 mensajes o 3 turnos de conversación (cambios en el participante que emite una expresión). También te sugerimos que quites los mensajes de bots o los mensajes que generan automáticamente los sistemas (por ejemplo, "El agente ingresa a la sala de chat"). Te recomendamos que subas al menos 3 meses de conversaciones para garantizar la cobertura de la mayor cantidad posible de casos de uso. La cantidad máxima de conversaciones en un conjunto de datos de conversaciones es de 1,000,000.

  4. Si implementas la función de resumen con tus propios datos de transcripción y anotación, asegúrate de que las transcripciones tengan el formato especificado y se almacenen en un bucket de Google Cloud Storage. La cantidad mínima recomendada de anotaciones de entrenamiento es de 1,000. La cantidad mínima obligatoria es 100.

  5. Navega a la consola de Agent Assist. Selecciona tu proyecto de Google Cloud Platform y, luego, haz clic en la opción del menú Datos en el margen izquierdo de la página. En el menú Datos, se muestran todos tus datos. Hay dos pestañas, una para los conjuntos de datos de conversación y otra para las bases de conocimiento.

  6. Haz clic en la pestaña Conjuntos de datos de conversación y, luego, en el botón + Crear nuevo en la parte superior derecha de la página de conjuntos de datos de conversación.

Crea un conjunto de datos de conversaciones

  1. Ingresa un Nombre y una Descripción opcional para tu nuevo conjunto de datos. En el campo Datos de conversación, ingresa el URI del bucket de almacenamiento que contiene las transcripciones de tus conversaciones. El Asistente de agente admite el uso del símbolo * para la coincidencia con comodines. El URI debe tener el siguiente formato:

    gs://<bucket name>/<object name>
    

    Por ejemplo:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. Haz clic en Crear. Tu nuevo conjunto de datos ahora aparece en la lista de conjuntos de datos de la página del menú Datos en la pestaña Conjuntos de datos de conversación.

¿Qué sigue?

Entrena un modelo de Respuesta inteligente o Resumen en uno o más conjuntos de datos de conversaciones con la consola de Agent Assist.