建立對話資料集

對話資料集包含對話轉錄資料,可用於訓練智慧回覆或摘要自訂模型。智慧回覆功能會根據對話記錄,為與使用者對話的真人服務專員建議文字回覆。摘要自訂模型會使用包含對話記錄和註解資料的對話資料集進行訓練。在對話結束後,他們會使用註解為真人服務專員產生對話摘要。

您可以透過兩種方式建立資料集:使用控制台教學課程工作流程,或在控制台中使用「資料」「資料集」分頁手動建立資料集。我們建議您先使用控制台教學課程。如要使用控制台教學課程,請前往 Agent Assist 控制台,然後點選要測試的功能下方的「開始使用」按鈕。

本頁說明如何手動建立資料集。

事前準備

  1. 請按照Dialogflow 設定操作說明,在 Google Cloud Platform 專案中啟用 Dialogflow。

  2. 建議您在開始本教學課程前,先閱讀 Agent Assist 基本知識頁面。

  3. 如果您使用自己的轉錄稿資料導入智慧回覆功能,請確認轉錄稿採用指定的格式,並儲存在 JSON Google Cloud Storage 值區中。對話資料集至少須包含 30,000 個對話,否則模型訓練會失敗。一般來說,對話越多,模型品質就越好。建議您移除訊息數量少於 20 則或對話回合 (參與者發言的變化) 少於 3 次的對話。我們也建議您移除任何機器人訊息或系統自動產生的訊息 (例如「服務專員進入即時通訊聊天室」)。建議您至少上傳 3 個月的對話內容,以便涵蓋盡可能多的用途。對話資料集中的對話數量上限為 1,000,000。

  4. 如果您要使用自己的逐字稿和註解資料導入摘要功能,請務必確保逐字稿採用指定的格式,並儲存在 Google Cloud Storage 值區中。建議的訓練註解數量下限為 1000。強制執行的最低數量為 100。

  5. 前往 Agent Assist 控制台。選取 Google Cloud Platform 專案,然後按一下頁面最左邊邊界上的「Data」選單選項。「資料」選單會顯示所有資料。分頁分為兩種,分別用於對話資料集知識庫

  6. 按一下「對話方言資料集」分頁標籤,然後按一下對話方言資料集頁面右上方的「+ 建立新對話方言資料集」按鈕。

建立對話資料集

  1. 輸入新資料集的「名稱」和選填的「說明」。在「Conversation data」欄位中,輸入包含對話記錄的儲存值區 URI。Agent Assist 支援使用 * 符號進行萬用字元比對。URI 應採用下列格式:

    gs://<bucket name>/<object name>
    

    例如:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  2. 按一下「建立」,新的資料集現在會顯示在「資料」選單頁面中的「對話資料集」分頁下方的資料集清單中。

後續步驟

使用 Agent Assist 主控台,針對一或多個對話資料集訓練智慧回覆摘要模型。