Subir datos de conversaciones

Los datos de las conversaciones se aceptan como transcripciones (Respuesta inteligente) y transcripciones con datos de anotación (Resumen). También puedes usar los datos de conversación y los modelos de demostración proporcionados por Asistente para agentes para probar la funcionalidad o la integración sin tener que proporcionar tus propios datos. Para usar Respuesta inteligente y Resumen durante el tiempo de ejecución, debes proporcionar tus propios datos de conversación.

En esta página se describen los pasos necesarios para usar los conjuntos de datos públicos, así como para dar formato a tus propios datos para subirlos a Cloud Storage. Debes proporcionar tus datos de conversación en archivos de texto con formato JSON.

Formato de datos de Respuesta inteligente

Respuesta inteligente se puede usar junto con cualquier función de Asistencia del agente o como función independiente. Para implementar Respuesta inteligente, debes proporcionar a Agent Assist datos de conversaciones.

Agent Assist proporciona datos de conversaciones de muestra que puedes usar para entrenar un modelo, así como un modelo de demostración y una lista de permitidos. Puedes usar estos recursos para crear un perfil de conversación y probar las funciones sin tener que proporcionar tus propios datos. Si proporciona sus propios datos, deben tener el formato especificado.

Usar los datos de conversación de muestra de Respuesta inteligente

El conjunto de datos de conversaciones de ejemplo se deriva de una fuente externa y se almacena en un segmento de Google Cloud Storage. Los datos contienen diálogos orientados a tareas que abarcan seis dominios: "Booking", "restaurant", "hotel", "attraction", "taxi" y "train". Para entrenar tu propio modelo con este conjunto de datos, sigue los pasos para crear un conjunto de datos de conversaciones con la consola de Asistente. En el campo Datos de conversación, introduce gs://smart_messaging_integration_test_data/*.json para usar el conjunto de datos de prueba. Si haces llamadas directas a la API en lugar de usar la consola, puedes crear un conjunto de datos de conversaciones dirigiendo la API al segmento de Cloud Storage anterior.

Usar el modelo de demostración de Respuesta inteligente y la lista de permitidos

Para probar la demo del modelo de Respuesta inteligente y la lista de permitidos mediante la consola (no es necesario un conjunto de datos), ve a la consola de Agent Assist y haz clic en el botón Empezar de la función Respuesta inteligente. Los tutoriales de la consola te ofrecen opciones para usar tus propios datos, los datos proporcionados o el modelo de demostración.

Si haces llamadas a la API directamente en lugar de usar la consola, el modelo y la lista de permitidos se pueden encontrar en las siguientes ubicaciones:

  • Modelo: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • Lista de permitidos: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

Para probar la funcionalidad de las funciones, te recomendamos que empieces usando los siguientes mensajes de usuario final para activar una respuesta:

  • "¿Puedes buscarme un alojamiento caro que esté situado en el este?"
  • "Estoy buscando un restaurante caro que sirva comida tailandesa".
  • "Hola, necesito un hotel con Wi-Fi gratis en el norte de Cambridge".

Formato de datos de resumen

La función de resumen se puede usar junto con cualquier función de Asistente, o como función independiente. Para implementar la función de resumen, debes proporcionar a Agent Assist datos de conversaciones que incluyan anotaciones. Una anotación es un resumen de la transcripción de una conversación asociada. Las anotaciones se usan para entrenar un modelo que puedes usar para generar resúmenes para tus agentes al final de cada conversación con un usuario final.

Usar los datos de conversación de resumen de ejemplo y el modelo de demostración

Asistencia para agentes también proporciona datos de conversaciones anotados de ejemplo que puedes usar para entrenar un modelo. Te recomendamos que elijas esta opción si quieres probar la función de resumen antes de dar formato a tu propio conjunto de datos. El conjunto de datos de prueba se encuentra en el siguiente segmento de Cloud Storage: gs://summarization_integration_test_data/data. Si usas los datos de ejemplo, puedes entrenar un modelo de resumen con la consola o la API. Introduce gs://summarization_integration_test_data/data/* en el campo URI del conjunto de datos para usar el conjunto de datos de ejemplo.

Para probar el modelo de resumen de la demo (no es necesario ningún conjunto de datos), ve a la consola de Asistencia con agente y haz clic en el botón Empezar de la función Resumen. Los tutoriales de la consola te ofrecen opciones para usar tus propios datos, los datos proporcionados o el modelo de demostración.

Dar formato a las anotaciones

Los modelos personalizados de Resumen de Agent Assist se entrenan con conjuntos de datos de conversaciones. Un conjunto de datos de conversaciones contiene los datos de transcripción y de anotación que has subido.

Antes de empezar a subir datos, debes asegurarte de que cada transcripción de conversación esté en formato JSON, tenga una anotación asociada y esté almacenada en un segmento de Google Cloud Storage.

Para crear anotaciones, añade las cadenas key y value esperadas al campo annotation asociado a cada conversación de tu conjunto de datos. Para obtener los mejores resultados, los datos de entrenamiento de las anotaciones deben cumplir las siguientes directrices:

  1. El número mínimo recomendado de anotaciones de entrenamiento es 1000. El número mínimo obligatorio es 100.
  2. Los datos de entrenamiento no deben contener IPI.
  3. Las anotaciones no deben incluir información sobre el sexo, la raza o la edad.
  4. Las anotaciones no deben incluir lenguaje tóxico ni malsonante.
  5. Las anotaciones no deben contener información que no se pueda inferir de la transcripción de la conversación correspondiente.
  6. Cada anotación puede contener hasta 3 secciones. Puedes elegir los nombres de las secciones.
  7. Las anotaciones deben tener una ortografía y una gramática correctas.

A continuación, se muestra un ejemplo del formato de una transcripción de conversación con la anotación asociada:

{
  "entries": [
    {
      "text": "How can I help?",
      "role": "AGENT"
    },
    {
      "text": "I cannot login",
      "role": "CUSTOMER"
    },
    {
      "text": "Ok, let me confirm. Are you experiencing issues accessing your account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "CUSTOMER"
    },
    {
      "text": "Got it. Do you still have access to the registered email for the account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "AGENT"
    },
    {
      "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password",
      "role": "AGENT"
    },
    {
      "text": "That's nice",
      "role": "CUSTOMER"
    },
    {
      "text": "Is there anything else I can help",
      "role": "AGENT"
    },
    {
      "text": "No that's all",
      "role": "CUSTOMER"
    },
    {
      "text": "Thanks for calling. You have a nice day",
      "role": "AGENT"
    }
  ],
  "conversation_info": {
    "annotations": [
      {
        "annotation": {
          "conversation_summarization_suggestion": {
            "text_sections": [
              {
                "key": "Situation",
                "value": "Customer was unable to login to account"
              },
              {
                "key": "Action",
                "value": "Agent sent an email with password reset instructions"
              },
              {
                "key": "Outcome",
                "value": "Problem was resolved"
              }
            ]
          }
        }
      }
    ]
  }
}

Datos de transcripciones de conversaciones

Los datos de las conversaciones de texto deben proporcionarse en archivos con formato JSON, donde cada archivo contenga datos de una sola conversación. A continuación, se describe el formato JSON obligatorio.

Conversación

Objeto de nivel superior de los datos de la conversación.

Campo Tipo Descripción
conversation_info ConversationInfo { } Opcional. Metadatos de la conversación.
entries Entrada [ ] Obligatorio. Los mensajes de la conversación ordenados cronológicamente.

ConversationInfo

Metadatos de una conversación.

Campo Tipo Descripción
categorías Categoría [ ] Opcional. Categorías personalizadas de los datos de conversación.

Categoría

Categoría de datos de conversaciones. Si proporcionas categorías con tus datos de conversación, se usarán para identificar temas en tus conversaciones. Si no proporciona categorías, el sistema clasificará automáticamente las conversaciones en función del contenido.

Campo Tipo Descripción
display_name cadena Obligatorio. Nombre visible de la categoría.

Entrada

Datos de un solo mensaje de una conversación.

Campo Tipo Descripción
texto cadena Obligatorio. Texto del mensaje de la conversación. Todo el texto debe incluir las mayúsculas correctamente. La calidad del modelo puede verse afectada significativamente si todas las letras del texto están en mayúsculas o minúsculas. Si este campo se deja vacío, se devolverá un error.
user_id entero Opcional. Número que identifica al participante de la conversación. Cada participante debe tener un solo user_id, que se usará repetidamente si participa en varias conversaciones.
role cadena Obligatorio. El rol de participante de la conversación. Puede ser uno de los siguientes: "AGENT" o "CUSTOMER".
start_timestamp_usec entero Es opcional si la conversación solo se usa para las funciones de asistencia con preguntas frecuentes, sugerencia de artículos y resumen. De lo contrario, es obligatorio. Marca de tiempo del inicio de este turno de conversación en microsegundos.

Ejemplo

A continuación, se muestra un ejemplo de un archivo de datos de conversación.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Subir conversaciones a Cloud Storage

Debes proporcionar los datos de tus conversaciones en un segmento de Cloud Storage contenido en tu proyecto de Google Cloud Platform. Cuando cree el segmento, haga lo siguiente:

  • Asegúrate de haber seleccionado el proyecto de Google Cloud Platform que usas para Dialogflow.
  • Usa la clase de almacenamiento estándar.
  • Define la ubicación del segmento como la más cercana a tu ubicación. Necesitará el ID de ubicación (por ejemplo, us-west1) cuando proporcione los datos de conversación, así que anote su elección.
  • También necesitará el nombre del segmento al proporcionar los datos de la conversación.

Sigue las instrucciones de la guía de inicio rápido de Cloud Storage para crear un segmento y subir archivos.