進階語音設定

本指南提供語音功能的其他進階設定。如要啟用或停用這些進階設定,請依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「語音進階設定」

這些設定可在代理程式設定 (套用於整個代理程式)、流程設定 (套用於整個流程並覆寫代理程式設定)、頁面設定 (套用於頁面並覆寫流程和代理程式設定) 和執行要求設定 (套用於執行要求並覆寫頁面、流程和代理程式設定)。每個層級都提供部分設定,具體取決於設定與層級的關聯性。*如要設定較低層級的這些設定,你必須先在服務專員層級勾選「啟用進階語音設定」方塊 (依序前往「Agent settings」>「Speech and IVR」>「Speech-to-Text」>「Advanced speech settings」)*。

如果在較低層級選取「自訂」選項,更新的代理程式層級設定就不會套用至流程、頁面和執行層級。如果「自訂」選項包含多個設定,且您只想更新其中部分設定,則可能還需要更新其他設定,以便與代理程式層級設定保持一致。

設定可用性 (依等級而定)

下表列出各等級可用的進階語音設定:

設定名稱 虛擬服務專員 心流狀態 頁面 Fulfillment
模型選取 (Speech-to-Text)
語音感測結束處
進階的逾時時間為語音感測結束處
啟用智慧端點功能
無語音逾時
Barge-in
允許取消部分回應的播放
音訊匯出值區
DTMF

模型選取 (Speech-to-Text)

可在代理程式、流程和頁面層級設定。

設定用於語音辨識的語音模型。這項設定是語言專屬,因此您可以為不同語言選取不同的模型。您也可以勾選「Override request-level speech model」,這樣即使執行階段 API 呼叫指定了其他模型,系統也會使用所選模型。

如要瞭解 Conversational Agents (Dialogflow CX) Phone Gateway 的限制,請參閱限制。詳情請參閱語音模型

語音感測結束處

可在代理程式、流程和頁面層級設定。

控制在使用者輸入的音訊中,辨識語音結束處的敏感度。值的範圍從 0 (低敏感度,較不容易結束語音) 到 100 (高敏感度,較容易結束語音)。

進階的逾時時間為語音感測結束處

可在代理程層級設定,並在流程和頁面層級停用。

如果啟用這項設定,系統會使用語音結束敏感度設定值做為評估依據,建立相對的音訊靜默時間逾時值,以判斷語音結束時間。如果停用這項設定 (預設),系統會使用 End of speech sensitivity 設定值,透過 Google Cloud Speech-to-Text 提供的機器學習模型來判斷語音結束時間。

雖然「End of speech sensitivity」設定預設只支援 en-US 語言標記的 phone_call 語音模型,但「Enable advanced timeout-based end of speech sensitivity」設定可讓您為 Dialogflow 支援的所有語言和語音模型設定語音感測結束處。

啟用智慧端點功能

只能在代理程式層級設定。

如果啟用這項設定,Conversational Agents (Dialogflow CX) 會分析部分使用者輸入內容,判斷語音結束時間。舉例來說,如果使用者說「I would like to」(我想) 後暫停,Conversational Agents (Dialogflow CX) 會等待使用者繼續說話。

這對於收集數值參數特別有用,因為使用者可能會先說出「1234」,然後暫停一下再說「5678」。如要為特定參數套用這項設定,您必須在參數表單中設定智慧端點設定

這項設定僅適用於 en-US 語言代碼,且預設為停用。

無語音逾時

可在代理程式、流程和頁面層級設定。

Conversational Agents (Dialogflow CX) 停止等待使用者音訊輸入的時間長度 (以秒為單位)。預設值為 5 秒,上限為 60 秒。針對這項逾時,Conversational Agents (Dialogflow CX) 會叫用無輸入事件

Barge-in

可在代理程式、流程和執行要求層級設定。

啟用後,使用者就能中斷 Conversational Agents (Dialogflow CX) 的回應音訊。遭到中斷時,Conversational Agents (Dialogflow CX) 會停止傳送音訊,並處理下一個使用者輸入內容。

如果訊息佇列中有多則訊息,且某則訊息是由與已啟用插入式對話的網頁、流程或服務項目相關聯的服務項目排入佇列,則佇列中的後續所有訊息也會啟用插入式對話。在這種情況下,整合服務會停止播放所有已排入佇列的訊息音訊 (已啟用插入功能)。

允許取消部分回應的播放

只能在執行層級設定。

只要在「Agent settings」>「Speech and IVR」中勾選「Enable advanced speech settings」方塊,並在執行層級啟用部分回應,即可啟用這項設定。這項設定可讓您取消部分回應的播放。

如果訊息佇列中的訊息是由允許取消的服務供應商建立,如果另一則訊息加入佇列,系統就會取消訊息的播放。當您希望初始訊息開始播放,但如果在初始訊息播放完成前,有可用的 webhook 產生另一則訊息,則這項功能就很實用,可取消該播放作業。

音訊匯出值區

可在代理程式和對話流層級設定。

如果提供,與要求相關的任何音訊資料都會儲存至 Cloud Storage 值區:

已儲存音訊 適用的要求
使用者音訊輸入 DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent
用於回應的文字轉語音 (TTS) 合成音訊 AnalyzeContent、StreamingAnalyzeContent

將「Storage Object Creator」角色授予專案中的下列服務帳戶:

  • 如使用合作夥伴內建的電話整合服務,請將資料傳送至 one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com 格式的服務帳戶。

  • 如使用 Dialogflow CX Phone Gateway 整合功能,請將資料傳送至 service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 格式的服務帳戶。如要在 IAM 中找出這個服務帳戶,請勾選「包含 Google 提供的角色授予項目」選項。

DTMF

如要進一步瞭解這項功能,請參閱 DTMF (雙音多頻率訊號) 說明文件