I dati delle conversazioni vengono accettati come trascrizioni (Risposta rapida) e trascrizioni più dati di annotazione (Riepilogo). Se vuoi, puoi utilizzare i dati delle conversazioni e i modelli demo forniti da Agent Assist per testare la funzionalità o l'integrazione senza dover fornire i tuoi dati. Per utilizzare Risposta rapida e il riepilogo durante l'esecuzione, devi fornire i tuoi dati di conversazione.
Questa pagina ti guida attraverso i passaggi necessari per utilizzare i set di dati pubblici e per formattare i tuoi dati per il caricamento su Cloud Storage. Devi fornire i dati delle conversazioni come file di testo in formato JSON.
Formato dei dati di Risposta rapida
Risposta rapida può essere utilizzata in combinazione con qualsiasi funzionalità di Assistente agente o come funzionalità autonoma. Per implementare Risposta rapida, devi fornire ad Agent Assist i dati delle conversazioni.
Agent Assist fornisce dati di conversazione di esempio che puoi utilizzare per addestrare un modello, oltre a un modello demo e a una lista consentita. Puoi utilizzare queste risorse per creare un profilo conversazionale e testare la funzionalità senza dover fornire i tuoi dati. Se fornisci i tuoi dati, questi devono essere nel formato specificato.
Utilizzare i dati di conversazione di esempio di Risposta rapida
Il set di dati di conversazione di esempio deriva da un'origine esterna ed è archiviato in un bucket Google Cloud Storage. I dati contengono dialoghi orientati alle attività che riguardano sei domini: "Prenotazione", "ristorante", "hotel", "attrazione", "taxi" e "treno". Per addestrare il tuo modello utilizzando questo set di dati, segui i passaggi per
creare un set di dati di conversazione
utilizzando la console di Assistente agente. Nel campo Dati delle conversazioni, inserisci
gs://smart_messaging_integration_test_data/*.json
per utilizzare il set di dati di test. Se
effettui chiamate API dirette anziché utilizzare la console, puoi creare
un set di dati di conversazione indirizzando l'API al bucket Cloud Storage sopra indicato.
Utilizzare il modello di Risposta rapida demo e la lista consentita
Per provare il modello demo di Risposta rapida e la lista consentita utilizzando la console (non è necessario un set di dati), vai alla console di Assistente agente e fai clic sul pulsante Inizia nella sezione della funzionalità Risposta rapida. I tutorial della console offrono opzioni per utilizzare i tuoi dati, i dati forniti o il modello demo.
Se effettui chiamate all'API direttamente anziché utilizzare la console, il modello e la lista consentita si trovano nelle seguenti posizioni:
- Modello:
projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
- Lista consentita:
projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg
Per testare la funzionalità, ti suggeriamo di iniziare utilizzando i seguenti messaggi per gli utenti finali per attivare una risposta:
- "Puoi trovarmi un posto costoso dove alloggiare che si trova a est?"
- "Sto cercando un ristorante costoso che serva cibo thailandese, per favore."
- "Buongiorno, mi serve un hotel con Wi-Fi gratuito a nord di Cambridge."
Formato dei dati di riepilogo
Il riepilogo può essere utilizzato in combinazione con qualsiasi funzionalità di Assistente agente o come funzionalità autonoma. Per implementare il riepilogo, devi fornire ad Agent Assist dati di conversazione che includono annotazioni. Un'annotazione è un riepilogo della trascrizione di una conversazione associata. Le annotazioni vengono utilizzate per addestrare un modello che puoi utilizzare per generare riepiloghi per i tuoi agenti al termine di ogni conversazione con un utente finale.
Utilizzare i dati delle conversazioni di riepilogo di esempio e il modello demo
Agent Assist fornisce anche dati di conversazione annotati di esempio che puoi utilizzare per addestrare un modello. Ti consigliamo di scegliere questa opzione se vuoi
testare la funzionalità di riepilogo prima di formattare il tuo set di dati. Il set di dati di test si trova nel seguente bucket Cloud Storage:
gs://summarization_integration_test_data/data
. Se utilizzi i dati di esempio,
puoi addestrare un modello di riepilogo utilizzando la console o l'API. Inserisci
gs://summarization_integration_test_data/data/*
nel campo URI del set di dati per
utilizzare il set di dati di esempio.
Per provare il modello demo di riepilogo (non è necessario un set di dati), vai alla console Agent Assist e fai clic sul pulsante Inizia nella funzionalità di riepilogo. I tutorial della console ti offrono opzioni per utilizzare i tuoi dati, i dati forniti o il modello demo.
Formattare le annotazioni
I modelli personalizzati di riepilogo di Agent Assist vengono addestrati utilizzando set di dati di conversazioni. Un set di dati delle conversazioni contiene la trascrizione caricata e i dati delle annotazioni.
Prima di poter iniziare a caricare i dati, devi assicurarti che ogni
trascrizione della conversazione sia in
formato JSON
,
abbia un'annotazione associata e sia archiviata in un
bucket Google Cloud Storage.
Per creare annotazioni, aggiungi le stringhe key
e value
previste al campo annotation
associato a ogni conversazione nel set di dati. Per ottenere risultati ottimali, i dati di addestramento delle annotazioni devono rispettare le seguenti linee guida:
- Il numero minimo consigliato di annotazioni di addestramento è 1000. Il numero minimo imposto è 100.
- I dati di addestramento non devono contenere PII.
- Le annotazioni non devono includere informazioni su genere, razza o età.
- Le annotazioni non devono utilizzare un linguaggio tossico o volgare.
- Le annotazioni non devono contenere informazioni che non possono essere dedotte dalla trascrizione della conversazione corrispondente.
- Ogni annotazione può contenere fino a tre sezioni. Puoi scegliere i nomi delle sezioni.
- Le annotazioni devono essere corrette dal punto di vista ortografico e grammaticale.
Di seguito è riportato un esempio che mostra il formato della trascrizione di una conversazione con l'annotazione associata:
{ "entries": [ { "text": "How can I help?", "role": "AGENT" }, { "text": "I cannot login", "role": "CUSTOMER" }, { "text": "Ok, let me confirm. Are you experiencing issues accessing your account", "role": "AGENT" }, { "text": "Yes", "role": "CUSTOMER" }, { "text": "Got it. Do you still have access to the registered email for the account", "role": "AGENT" }, { "text": "Yes", "role": "AGENT" }, { "text": "I have sent an email with reset steps. You can follow the instructions in the email to reset your login password", "role": "AGENT" }, { "text": "That's nice", "role": "CUSTOMER" }, { "text": "Is there anything else I can help", "role": "AGENT" }, { "text": "No that's all", "role": "CUSTOMER" }, { "text": "Thanks for calling. You have a nice day", "role": "AGENT" } ], "conversation_info": { "annotations": [ { "annotation": { "conversation_summarization_suggestion": { "text_sections": [ { "key": "Situation", "value": "Customer was unable to login to account" }, { "key": "Action", "value": "Agent sent an email with password reset instructions" }, { "key": "Outcome", "value": "Problem was resolved" } ] } } } ] } }
Dati delle trascrizioni delle conversazioni
I dati delle conversazioni di testo devono essere forniti in file in formato JSON, in cui ogni file contiene i dati di una singola conversazione. Di seguito viene descritto il formato JSON richiesto.
Conversazione
L'oggetto di primo livello per i dati delle conversazioni.
Campo | Tipo | Descrizione |
---|---|---|
conversation_info | ConversationInfo { } | Facoltativo. Metadati della conversazione. |
entries | Entry [ ] | Obbligatorio. I messaggi della conversazione in ordine cronologico. |
ConversationInfo
I metadati di una conversazione.
Campo | Tipo | Descrizione |
---|---|---|
categorie | Categoria [ ] | Facoltativo. Categorie personalizzate per i dati delle conversazioni. |
Categoria
Categoria di dati conversazione. Se fornisci categorie con i dati delle conversazioni, queste verranno utilizzate per identificare gli argomenti delle conversazioni. Se non fornisci categorie, il sistema categorizzerà automaticamente le conversazioni in base ai contenuti.
Campo | Tipo | Descrizione |
---|---|---|
display_name | string | Obbligatorio. Un nome visualizzato per la categoria. |
Voce
Dati per un singolo messaggio di conversazione.
Campo | Tipo | Descrizione |
---|---|---|
testo | string | Obbligatorio. Il testo di questo messaggio della conversazione. Tutto il testo deve essere scritto correttamente in maiuscolo. La qualità del modello può essere influenzata in modo significativo se tutte le lettere del testo sono maiuscole o minuscole. Se questo campo viene lasciato vuoto, verrà restituito un errore. |
user_id | integer | Facoltativo. Un numero che identifica il partecipante alla conversazione. Ogni partecipante deve avere un unico user_id , da utilizzare ripetutamente se partecipa a più conversazioni. |
ruolo | string | Obbligatorio. Il ruolo di partecipante alla conversazione. Uno tra i seguenti: "AGENT", "CUSTOMER". |
start_timestamp_usec | integer | Facoltativo se la conversazione viene utilizzata solo per l'assistenza per le domande frequenti, il suggerimento di articoli e il riepilogo, altrimenti obbligatorio. Il timestamp dell'inizio di questo turno di conversazione in microsecondi. |
Esempio
Di seguito è riportato un esempio di file di dati delle conversazioni.
{ "conversation_info":{ "categories":[ { "display_name":"Category 1" } ] }, "entries": [ { "start_timestamp_usec": 1000000, "text": "Hello, I'm calling in regards to ...", "role": "CUSTOMER", "user_id": 1 }, { "start_timestamp_usec": 5000000, "text": "Yes, I can answer your question ...", "role": "AGENT", "user_id": 2 }, ... ] }
Caricare le conversazioni su Cloud Storage
Devi fornire i dati delle conversazioni in un bucket Cloud Storage contenuto nel tuo progettoGoogle Cloud Platformd. Quando crei il bucket:
- Assicurati di aver selezionato il progetto Google Cloud Platform che utilizzi per Dialogflow.
- Utilizza la classe di archiviazione Standard.
- Imposta la posizione del bucket su una posizione più vicina alla tua.
Avrai bisogno dell'ID località (ad esempio
us-west1
) quando fornisci i dati della conversazione, quindi prendi nota della tua scelta. - Avrai bisogno anche del nome del bucket quando fornisci i dati della conversazione.
Segui le istruzioni della Guida di avvio rapido di Cloud Storage per creare un bucket e caricare i file.