Criar um conjunto de dados de conversa

Um conjunto de dados de conversa contém dados de transcrição de conversa e é usado para treinar um modelo personalizado de Resposta inteligente ou de resumo. A Resposta inteligente usa as transcrições de conversa para recomendar respostas de texto aos agentes humanos que conversam com um usuário final. Os modelos personalizados de resumo são treinados em conjuntos de dados de conversas que contêm transcrições e dados de anotação. Eles usam as anotações para gerar resumos de conversas para agentes humanos depois que uma conversa é concluída.

Há duas maneiras de criar um conjunto de dados: usando os fluxos de trabalho do tutorial do console ou criando um conjunto de dados manualmente no console usando a guia Dados -> Conjuntos de dados. Recomendamos que você use os tutoriais do console como primeira opção. Para usar os tutoriais do console, acesse o Console da Assistente de IA e clique no botão Começar abaixo do recurso que você quer testar.

Esta página demonstra como criar um conjunto de dados manualmente.

Antes de começar

  1. Siga as instruções de configuração do Dialogflow para ativar o Dialogflow em um projeto do Google Cloud Platform.

  2. Recomendamos que você leia a página de fundamentos da Assistente de IA antes de começar este tutorial.

  3. Se você estiver implementando o Smart Reply usando seus próprios dados de transcrição, verifique se as transcrições estão em JSON no formato especificado e armazenadas em um bucket do Google Cloud Storage. Um conjunto de dados de conversas precisa ter pelo menos 30.000 conversas. Caso contrário, o treinamento de modelo vai falhar. Como regra geral, quanto mais conversas você tiver, melhor será a qualidade do seu modelo. Recomendamos remover conversas com menos de 20 mensagens ou três turnos de conversa (mudanças no participante que está falando). Também sugerimos que você remova mensagens de bots ou mensagens geradas automaticamente por sistemas (por exemplo, "O agente entra na sala de chat"). Recomendamos que você envie pelo menos três meses de conversas para garantir a cobertura do maior número possível de casos de uso. O número máximo de conversas em um conjunto de dados de conversa é de 1.000.000.

  4. Se você estiver implementando a sumarização usando seus próprios dados de transcrição e anotação, verifique se as transcrições estão no formato especificado e armazenadas em um bucket do Google Cloud Storage. O número mínimo recomendado de anotações de treinamento é 1.000. O número mínimo obrigatório é 100.

  5. Acesse o console da Assistente de IA. Selecione seu projeto do Google Cloud Platform e clique na opção de menu Dados na margem esquerda da página. O menu Dados mostra todas as suas informações. Há duas guias, uma para conjuntos de dados de conversação e outra para bases de conhecimento.

  6. Clique na guia Conjuntos de dados de conversas e depois no botão +Criar novo no canto superior direito da página.

Criar um conjunto de dados de conversa

  1. Insira um Nome e uma Descrição opcional para o novo conjunto de dados. No campo Dados de conversa, insira o URI do bucket de armazenamento que contém as transcrições de conversa. O Assistente de IA é compatível com o uso do símbolo * para correspondência de caracteres curinga. O URI precisa ter o seguinte formato:

    gs://<bucket name>/<object name>
    

    Exemplo:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. Clique em Criar. O novo conjunto de dados aparece na lista da página do menu Dados, na guia Conjuntos de dados de conversação.

A seguir

Treine um modelo de Resposta inteligente ou Resumo em um ou mais conjuntos de dados de conversas usando o console do Agent Assist.