Caricamento dati delle conversazioni

I dati delle conversazioni vengono accettati come trascrizioni (Risposta rapida) e trascrizioni più dati di annotazione (Riepilogo). Se vuoi, puoi utilizzare i dati delle conversazioni e i modelli demo forniti da Agent Assist per testare la funzionalità o l'integrazione senza dover fornire i tuoi dati. Per utilizzare Risposta rapida e il riepilogo durante l'esecuzione, devi fornire i tuoi dati di conversazione.

Questa pagina ti guida attraverso i passaggi necessari per utilizzare i set di dati pubblici e per formattare i tuoi dati per il caricamento su Cloud Storage. Devi fornire i dati delle conversazioni come file di testo in formato JSON.

Formato dei dati di Risposta rapida

Risposta rapida può essere utilizzata in combinazione con qualsiasi funzionalità di Assistente agente o come funzionalità autonoma. Per implementare Risposta rapida, devi fornire ad Agent Assist i dati delle conversazioni.

Agent Assist fornisce dati di conversazione di esempio che puoi utilizzare per addestrare un modello, oltre a un modello demo e a una lista consentita. Puoi utilizzare queste risorse per creare un profilo conversazionale e testare la funzionalità senza dover fornire i tuoi dati. Se fornisci i tuoi dati, questi devono essere nel formato specificato.

Utilizzare i dati di conversazione di esempio di Risposta rapida

Il set di dati di conversazione di esempio deriva da un'origine esterna ed è archiviato in un bucket Google Cloud Storage. I dati contengono dialoghi orientati alle attività che riguardano sei domini: "Prenotazione", "ristorante", "hotel", "attrazione", "taxi" e "treno". Per addestrare il tuo modello utilizzando questo set di dati, segui i passaggi per creare un set di dati di conversazione utilizzando la console di Assistente agente. Nel campo Dati delle conversazioni, inserisci gs://smart_messaging_integration_test_data/*.json per utilizzare il set di dati di test. Se effettui chiamate API dirette anziché utilizzare la console, puoi creare un set di dati di conversazione indirizzando l'API al bucket Cloud Storage sopra indicato.

Utilizzare il modello di Risposta rapida demo e la lista consentita

Per provare il modello demo di Risposta rapida e la lista consentita utilizzando la console (non è necessario un set di dati), vai alla console di Assistente agente e fai clic sul pulsante Inizia nella sezione della funzionalità Risposta rapida. I tutorial della console offrono opzioni per utilizzare i tuoi dati, i dati forniti o il modello demo.

Se effettui chiamate all'API direttamente anziché utilizzare la console, il modello e la lista consentita si trovano nelle seguenti posizioni:

  • Modello: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • Lista consentita: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

Per testare la funzionalità, ti suggeriamo di iniziare utilizzando i seguenti messaggi per gli utenti finali per attivare una risposta:

  • "Puoi trovarmi un posto costoso dove alloggiare che si trova a est?"
  • "Sto cercando un ristorante costoso che serva cibo thailandese, per favore."
  • "Buongiorno, mi serve un hotel con Wi-Fi gratuito a nord di Cambridge."

Formato dei dati di riepilogo

Il riepilogo può essere utilizzato in combinazione con qualsiasi funzionalità di Assistente agente o come funzionalità autonoma. Per implementare il riepilogo, devi fornire ad Agent Assist dati di conversazione che includono annotazioni. Un'annotazione è un riepilogo della trascrizione di una conversazione associata. Le annotazioni vengono utilizzate per addestrare un modello che puoi utilizzare per generare riepiloghi per i tuoi agenti al termine di ogni conversazione con un utente finale.

Utilizzare i dati delle conversazioni di riepilogo di esempio e il modello demo

Agent Assist fornisce anche dati di conversazione annotati di esempio che puoi utilizzare per addestrare un modello. Ti consigliamo di scegliere questa opzione se vuoi testare la funzionalità di riepilogo prima di formattare il tuo set di dati. Il set di dati di test si trova nel seguente bucket Cloud Storage: gs://summarization_integration_test_data/data. Se utilizzi i dati di esempio, puoi addestrare un modello di riepilogo utilizzando la console o l'API. Inserisci gs://summarization_integration_test_data/data/* nel campo URI del set di dati per utilizzare il set di dati di esempio.

Per provare il modello demo di riepilogo (non è necessario un set di dati), vai alla console Agent Assist e fai clic sul pulsante Inizia nella funzionalità di riepilogo. I tutorial della console ti offrono opzioni per utilizzare i tuoi dati, i dati forniti o il modello demo.

Formattare le annotazioni

I modelli personalizzati di riepilogo di Agent Assist vengono addestrati utilizzando set di dati di conversazioni. Un set di dati delle conversazioni contiene la trascrizione caricata e i dati delle annotazioni.

Prima di poter iniziare a caricare i dati, devi assicurarti che ogni trascrizione della conversazione sia in formato JSON, abbia un'annotazione associata e sia archiviata in un bucket Google Cloud Storage.

Per creare annotazioni, aggiungi le stringhe key e value previste al campo annotation associato a ogni conversazione nel set di dati. Per ottenere risultati ottimali, i dati di addestramento delle annotazioni devono rispettare le seguenti linee guida:

  1. Il numero minimo consigliato di annotazioni di addestramento è 1000. Il numero minimo imposto è 100.
  2. I dati di addestramento non devono contenere PII.
  3. Le annotazioni non devono includere informazioni su genere, razza o età.
  4. Le annotazioni non devono utilizzare un linguaggio tossico o volgare.
  5. Le annotazioni non devono contenere informazioni che non possono essere dedotte dalla trascrizione della conversazione corrispondente.
  6. Ogni annotazione può contenere fino a tre sezioni. Puoi scegliere i nomi delle sezioni.
  7. Le annotazioni devono essere corrette dal punto di vista ortografico e grammaticale.

Di seguito è riportato un esempio che mostra il formato della trascrizione di una conversazione con l'annotazione associata:

{
  "entries": [
    {
      "text": "How can I help?",
      "role": "AGENT"
    },
    {
      "text": "I cannot login",
      "role": "CUSTOMER"
    },
    {
      "text": "Ok, let me confirm. Are you experiencing issues accessing your account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "CUSTOMER"
    },
    {
      "text": "Got it. Do you still have access to the registered email for the account",
      "role": "AGENT"
    },
    {
      "text": "Yes",
      "role": "AGENT"
    },
    {
      "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password",
      "role": "AGENT"
    },
    {
      "text": "That's nice",
      "role": "CUSTOMER"
    },
    {
      "text": "Is there anything else I can help",
      "role": "AGENT"
    },
    {
      "text": "No that's all",
      "role": "CUSTOMER"
    },
    {
      "text": "Thanks for calling. You have a nice day",
      "role": "AGENT"
    }
  ],
  "conversation_info": {
    "annotations": [
      {
        "annotation": {
          "conversation_summarization_suggestion": {
            "text_sections": [
              {
                "key": "Situation",
                "value": "Customer was unable to login to account"
              },
              {
                "key": "Action",
                "value": "Agent sent an email with password reset instructions"
              },
              {
                "key": "Outcome",
                "value": "Problem was resolved"
              }
            ]
          }
        }
      }
    ]
  }
}

Dati delle trascrizioni delle conversazioni

I dati delle conversazioni di testo devono essere forniti in file in formato JSON, in cui ogni file contiene i dati di una singola conversazione. Di seguito viene descritto il formato JSON richiesto.

Conversazione

L'oggetto di primo livello per i dati delle conversazioni.

Campo Tipo Descrizione
conversation_info ConversationInfo { } Facoltativo. Metadati della conversazione.
entries Entry [ ] Obbligatorio. I messaggi della conversazione in ordine cronologico.

ConversationInfo

I metadati di una conversazione.

Campo Tipo Descrizione
categorie Categoria [ ] Facoltativo. Categorie personalizzate per i dati delle conversazioni.

Categoria

Categoria di dati conversazione. Se fornisci categorie con i dati delle conversazioni, queste verranno utilizzate per identificare gli argomenti delle conversazioni. Se non fornisci categorie, il sistema categorizzerà automaticamente le conversazioni in base ai contenuti.

Campo Tipo Descrizione
display_name string Obbligatorio. Un nome visualizzato per la categoria.

Voce

Dati per un singolo messaggio di conversazione.

Campo Tipo Descrizione
testo string Obbligatorio. Il testo di questo messaggio della conversazione. Tutto il testo deve essere scritto correttamente in maiuscolo. La qualità del modello può essere influenzata in modo significativo se tutte le lettere del testo sono maiuscole o minuscole. Se questo campo viene lasciato vuoto, verrà restituito un errore.
user_id integer Facoltativo. Un numero che identifica il partecipante alla conversazione. Ogni partecipante deve avere un unico user_id, da utilizzare ripetutamente se partecipa a più conversazioni.
ruolo string Obbligatorio. Il ruolo di partecipante alla conversazione. Uno tra i seguenti: "AGENT", "CUSTOMER".
start_timestamp_usec integer Facoltativo se la conversazione viene utilizzata solo per l'assistenza per le domande frequenti, il suggerimento di articoli e il riepilogo, altrimenti obbligatorio. Il timestamp dell'inizio di questo turno di conversazione in microsecondi.

Esempio

Di seguito è riportato un esempio di file di dati delle conversazioni.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Caricare le conversazioni su Cloud Storage

Devi fornire i dati delle conversazioni in un bucket Cloud Storage contenuto nel tuo progettoGoogle Cloud Platformd. Quando crei il bucket:

  • Assicurati di aver selezionato il progetto Google Cloud Platform che utilizzi per Dialogflow.
  • Utilizza la classe di archiviazione Standard.
  • Imposta la posizione del bucket su una posizione più vicina alla tua. Avrai bisogno dell'ID località (ad esempio us-west1) quando fornisci i dati della conversazione, quindi prendi nota della tua scelta.
  • Avrai bisogno anche del nome del bucket quando fornisci i dati della conversazione.

Segui le istruzioni della Guida di avvio rapido di Cloud Storage per creare un bucket e caricare i file.