本指南提供語音功能的其他進階設定。如要啟用或停用這些進階設定,請依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「語音進階設定」。
這些設定可在代理程式設定 (套用於整個代理程式)、流程設定 (套用於整個流程並覆寫代理程式設定)、頁面設定 (套用於頁面並覆寫流程和代理程式設定) 和執行要求設定 (套用於執行要求並覆寫頁面、流程和代理程式設定)。每個層級都提供部分設定,具體取決於設定與層級的關聯性。*如要設定較低層級的這些設定,你必須先在服務專員層級勾選「啟用進階語音設定」方塊 (依序前往「Agent settings」>「Speech and IVR」>「Speech-to-Text」>「Advanced speech settings」)*。
如果在較低層級選取「自訂」選項,更新的代理程式層級設定就不會套用至流程、頁面和執行層級。如果「自訂」選項包含多個設定,且您只想更新其中部分設定,則可能還需要更新其他設定,以便與代理程式層級設定保持一致。
設定可用性 (依等級而定)
下表列出各等級可用的進階語音設定:
設定名稱 | 虛擬服務專員 | 心流狀態 | 頁面 | Fulfillment |
---|---|---|---|---|
模型選取 (Speech-to-Text) | ✔ | ✔ | ✔ | |
語音感測結束處 | ✔ | ✔ | ✔ | |
進階的逾時時間為語音感測結束處 | ✔ | ✔ | ✔ | |
啟用智慧端點功能 | ✔ | |||
無語音逾時 | ✔ | ✔ | ✔ | |
Barge-in | ✔ | ✔ | ||
允許取消部分回應的播放 | ✔ | |||
音訊匯出值區 | ✔ | ✔ | ||
DTMF | ✔ | ✔ | ✔ |
模型選取 (Speech-to-Text)
可在代理程式、流程和頁面層級設定。
設定用於語音辨識的語音模型。這項設定是語言專屬,因此您可以為不同語言選取不同的模型。您也可以勾選「Override request-level speech model」,這樣即使執行階段 API 呼叫指定了其他模型,系統也會使用所選模型。
如要瞭解 Conversational Agents (Dialogflow CX) Phone Gateway 的限制,請參閱限制。詳情請參閱語音模型。
語音感測結束處
可在代理程式、流程和頁面層級設定。
控制在使用者輸入的音訊中,辨識語音結束處的敏感度。值的範圍從 0 (低敏感度,較不容易結束語音) 到 100 (高敏感度,較容易結束語音)。
進階的逾時時間為語音感測結束處
可在代理程層級設定,並在流程和頁面層級停用。
如果啟用這項設定,系統會使用語音結束敏感度設定值做為評估依據,建立相對的音訊靜默時間逾時值,以判斷語音結束時間。如果停用這項設定 (預設),系統會使用 End of speech sensitivity 設定值,透過 Google Cloud Speech-to-Text 提供的機器學習模型來判斷語音結束時間。
雖然「End of speech sensitivity」設定預設只支援 en-US
語言標記的 phone_call
語音模型,但「Enable advanced timeout-based end of speech sensitivity」設定可讓您為 Dialogflow 支援的所有語言和語音模型設定語音感測結束處。
啟用智慧端點功能
只能在代理程式層級設定。
如果啟用這項設定,Conversational Agents (Dialogflow CX) 會分析部分使用者輸入內容,判斷語音結束時間。舉例來說,如果使用者說「I would like to」(我想) 後暫停,Conversational Agents (Dialogflow CX) 會等待使用者繼續說話。
這對於收集數值參數特別有用,因為使用者可能會先說出「1234」,然後暫停一下再說「5678」。如要為特定參數套用這項設定,您必須在參數表單中設定智慧端點設定。
這項設定僅適用於 en-US
語言代碼,且預設為停用。
無語音逾時
可在代理程式、流程和頁面層級設定。
Conversational Agents (Dialogflow CX) 停止等待使用者音訊輸入的時間長度 (以秒為單位)。預設值為 5 秒,上限為 60 秒。針對這項逾時,Conversational Agents (Dialogflow CX) 會叫用無輸入事件。
Barge-in
可在代理程式、流程和執行要求層級設定。
啟用後,使用者就能中斷 Conversational Agents (Dialogflow CX) 的回應音訊。遭到中斷時,Conversational Agents (Dialogflow CX) 會停止傳送音訊,並處理下一個使用者輸入內容。
如果訊息佇列中有多則訊息,且某則訊息是由與已啟用插入式對話的網頁、流程或服務項目相關聯的服務項目排入佇列,則佇列中的後續所有訊息也會啟用插入式對話。在這種情況下,整合服務會停止播放所有已排入佇列的訊息音訊 (已啟用插入功能)。
允許取消部分回應的播放
只能在執行層級設定。
只要在「Agent settings」>「Speech and IVR」中勾選「Enable advanced speech settings」方塊,並在執行層級啟用部分回應,即可啟用這項設定。這項設定可讓您取消部分回應的播放。
如果訊息佇列中的訊息是由允許取消的服務供應商建立,如果另一則訊息加入佇列,系統就會取消訊息的播放。當您希望初始訊息開始播放,但如果在初始訊息播放完成前,有可用的 webhook 產生另一則訊息,則這項功能就很實用,可取消該播放作業。
音訊匯出值區
可在代理程式和對話流層級設定。
如果提供,與要求相關的任何音訊資料都會儲存至 Cloud Storage 值區:
已儲存音訊 | 適用的要求 |
---|---|
使用者音訊輸入 | DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent |
用於回應的文字轉語音 (TTS) 合成音訊 | AnalyzeContent、StreamingAnalyzeContent |
將「Storage Object Creator」角色授予專案中的下列服務帳戶:
如使用合作夥伴內建的電話整合服務,請將資料傳送至
one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com
格式的服務帳戶。如使用 Dialogflow CX Phone Gateway 整合功能,請將資料傳送至
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com
格式的服務帳戶。如要在 IAM 中找出這個服務帳戶,請勾選「包含 Google 提供的角色授予項目」選項。
DTMF
如要進一步瞭解這項功能,請參閱 DTMF (雙音多頻率訊號) 說明文件。