Creare un set di dati di conversazione

Un set di dati di conversazione contiene dati di trascrizione della conversazione e viene utilizzato per addestrare un modello personalizzato di Risposta rapida o di riepilogo. Risposta intelligente utilizza le trascrizioni della conversazione per consigliare risposte di testo agli agenti umani che conversano con un utente finale. I modelli personalizzati di riepilogo vengono addestrati su set di dati di conversazione che contengono sia trascrizioni sia dati di annotazione. Utilizzano le annotazioni per generare riepiloghi delle conversazioni per gli agenti umani al termine di una conversazione.

Esistono due modi per creare un set di dati: utilizzando i flussi di lavoro del tutorial della console oppure creando manualmente un set di dati nella console utilizzando la scheda Dati -> Set di dati. Ti consigliamo di utilizzare i tutorial della console come prima opzione. Per utilizzare i tutorial della console, vai alla console di Assistente agente e fai clic sul pulsante Inizia sotto la funzionalità che vuoi testare.

Questa pagina mostra come creare manualmente un set di dati.

Prima di iniziare

  1. Segui le istruzioni di configurazione di Dialogflow per attivare Dialogflow in un progetto Google Cloud Platform.

  2. Prima di iniziare questo tutorial, ti consigliamo di leggere la pagina sulle nozioni di base di Assistente agente.

  3. Se implementi Risposta rapida utilizzando i tuoi dati delle trascrizioni, assicurati che le trascrizioni siano in JSON nel formato specificato e archiviate in un bucket Google Cloud Storage. Un set di dati di conversazione deve contenere almeno 30.000 conversazioni, altrimenti l'addestramento del modello non andrà a buon fine. Come regola generale, più conversazioni hai, migliore sarà la qualità del modello. Ti suggeriamo di rimuovere le conversazioni con meno di 20 messaggi o 3 turni di conversazione (cambiamenti del partecipante che sta parlando). Ti consigliamo inoltre di rimuovere tutti i messaggi dei bot o i messaggi generati automaticamente dai sistemi (ad esempio "L'agente entra nella chat room"). Ti consigliamo di caricare almeno tre mesi di conversazioni per garantire la copertura del maggior numero possibile di casi d'uso. Il numero massimo di conversazioni in un set di dati delle conversazioni è 1.000.000.

  4. Se implementi il riepilogo utilizzando i tuoi dati di trascrizione e annotazione, assicurati che le trascrizioni siano nel formato specificato e archiviate in un bucket Google Cloud Storage. Il numero minimo consigliato di annotazioni di addestramento è 1000. Il numero minimo imposto è 100.

  5. Vai alla console Assistente agente. Seleziona il tuo progetto Google Cloud Platform, poi fai clic sull'opzione del menu Dati nel margine più a sinistra della pagina. Il menu Dati mostra tutti i tuoi dati. Sono presenti due schede, una per i set di dati delle conversazioni e una per le knowledge base.

  6. Fai clic sulla scheda Set di dati delle conversazioni, quindi sul pulsante +Crea nuovo in alto a destra nella pagina dei set di dati delle conversazioni.

Creare un set di dati conversazione

  1. Inserisci un nome e una descrizione facoltativa per il nuovo set di dati. Nel campo Dati delle conversazioni, inserisci l'URI del bucket di archiviazione che contiene le trascrizioni delle conversazioni. Agent Assist supporta l'utilizzo del simbolo * per la corrispondenza con caratteri jolly. L'URI deve avere il seguente formato:

    gs://<bucket name>/<object name>
    

    Ad esempio:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. Fai clic su Crea. Il nuovo set di dati viene visualizzato nell'elenco dei set di dati nella pagina del menu Dati nella scheda Set di dati sulle conversazioni.

Passaggi successivi

Addestra un modello di Risposta rapida o Riepilogo su uno o più set di dati di conversazione utilizzando la console Agent Assist.