Crear un conjunto de datos de conversación

Un conjunto de datos de conversaciones contiene datos de transcripciones de conversaciones y se usa para entrenar un modelo personalizado de Respuesta inteligente o de Resumen. Respuesta inteligente usa las transcripciones de las conversaciones para recomendar respuestas de texto a los agentes humanos que conversan con un usuario final. Los modelos personalizados de resumen se entrenan con conjuntos de datos de conversaciones que contienen tanto transcripciones como datos de anotaciones. Usan las anotaciones para generar resúmenes de conversaciones para los agentes humanos una vez que se ha completado una conversación.

Hay dos formas de crear un conjunto de datos: mediante los flujos de trabajo del tutorial de la consola o creando un conjunto de datos manualmente en la consola con la pestaña Datos -> Conjuntos de datos. Te recomendamos que utilices los tutoriales de la consola como primera opción. Para usar los tutoriales de la consola, ve a la consola de Asistente y haz clic en el botón Empezar de la función que quieras probar.

En esta página se explica cómo crear un conjunto de datos manualmente.

Antes de empezar

  1. Sigue las instrucciones de configuración de Dialogflow para habilitar Dialogflow en un proyecto de Google Cloud Platform.

  2. Te recomendamos que leas la página sobre los conceptos básicos de Asistente antes de empezar este tutorial.

  3. Si vas a implementar Respuesta inteligente con tus propios datos de transcripción, asegúrate de que las transcripciones estén en JSON en el formato especificado y almacenadas en un segmento de Google Cloud Storage. Un conjunto de datos de conversaciones debe contener al menos 30.000 conversaciones. De lo contrario, el entrenamiento del modelo fallará. Por lo general, cuantas más conversaciones tengas, mejor será la calidad de tu modelo. Te recomendamos que elimines las conversaciones que tengan menos de 20 mensajes o 3 turnos de conversación (cambios en el participante que está hablando). También te recomendamos que elimines los mensajes de bots o los mensajes generados automáticamente por sistemas (por ejemplo, "El agente entra en la sala de chat"). Te recomendamos que subas conversaciones de al menos 3 meses para cubrir el mayor número de casos prácticos posible. El número máximo de conversaciones en un conjunto de datos de conversaciones es de 1.000.000.

  4. Si implementas la función de resumen con tus propios datos de transcripción y anotación, asegúrate de que las transcripciones tengan el formato especificado y de que estén almacenadas en un segmento de Google Cloud Storage. El número mínimo recomendado de anotaciones de entrenamiento es 1000. El número mínimo obligatorio es 100.

  5. Ve a la consola de Asistente. Seleccione su proyecto de Google Cloud Platform y, a continuación, haga clic en la opción de menú Datos situada en el extremo izquierdo de la página. En el menú Datos se muestran todos sus datos. Hay dos pestañas, una para los conjuntos de datos de conversaciones y otra para las bases de conocimientos.

  6. Haz clic en la pestaña Conjuntos de datos de conversaciones y, después, en el botón +Crear nuevo, situado en la parte superior derecha de la página Conjuntos de datos de conversaciones.

Crear un conjunto de datos de conversación

  1. Escribe un nombre y, si quieres, una descripción para el nuevo conjunto de datos. En el campo Datos de conversación, introduce el URI del segmento de almacenamiento que contiene las transcripciones de tus conversaciones. Agent Assist admite el uso del símbolo * para buscar coincidencias con comodines. El URI debe tener el siguiente formato:

    gs://<bucket name>/<object name>
    

    Por ejemplo:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. Haz clic en Crear. El nuevo conjunto de datos aparece en la lista de conjuntos de datos de la página del menú Datos, en la pestaña Conjuntos de datos de conversaciones.

Siguientes pasos

Entrena un modelo de Respuesta inteligente o de Resumen con uno o varios conjuntos de datos de conversaciones mediante la consola de Agent Assist.