進階語音設定

本指南提供語音功能的其他進階設定。如要開啟或關閉這些進階設定，請依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」。

這些設定位於代理程式設定 (套用至整個代理程式)、流程設定 (套用至整個流程並覆寫代理程式設定)、頁面設定 (套用至頁面並覆寫流程和代理程式設定)，以及執行要求設定 (套用至執行要求並覆寫頁面、流程和代理程式設定)。每個層級都有一組可用的設定，具體取決於該層級的設定關聯性。*如要在任何較低層級設定這些設定，請先在代理程式層級勾選「啟用進階語音設定」方塊 (依序前往「代理程式設定」>「語音和 IVR」>「語音轉文字」>「進階語音設定」)*。

如果這些較低層級選取「自訂」選項，更新後的專員層級設定就不會傳播至流程、頁面和完成層級。如果「自訂」選項包含多項設定，而您只想更新部分設定，可能也需要更新其他設定，才能與代理程式層級設定保持一致。

各層級可用的設定

下表說明各層級可用的進階語音設定：

設定名稱	代理	心流狀態	頁面	Fulfillment
模型選擇 (Speech-to-Text)	✔	✔	✔
語音感測結束處	✔	✔	✔
根據逾時時間進階調整語音感測結束處	✔	✔	✔
啟用智慧端點	✔
沒有語音逾時	✔	✔	✔
插話	✔	✔		✔
允許取消播放部分回覆				✔
音訊匯出值區	✔	✔
DTMF	✔	✔	✔

模型選擇 (Speech-to-Text)

可在代理程式、流程和頁面層級設定。

設定用於語音辨識的語音模型。這項設定會因語言而異，因此你可以為不同語言選取不同模型。您也可以勾選「Override request-level speech model」(覆寫要求層級的語音模型)，這樣即使執行階段 API 呼叫指定了其他模型，系統仍會使用所選模型。

如要瞭解 Conversational Agents (Dialogflow CX) Phone Gateway 的限制，請參閱這篇文章。詳情請參閱語音模型。

語音感測結束處

可在代理程式、流程和頁面層級設定。

控制辨識使用者語音輸入結束的感應度。值介於 0 (低感應度，較不可能結束語音) 到 100 (高感應度，較可能結束語音)。

根據逾時時間進階調整語音感測結束處

可在代理程式層級設定，並在流程和頁面層級停用。

如果啟用這項設定，系統會使用「語音結束敏感度」設定值做為指標，建立相對音訊靜音逾時，以判斷語音結束時間。如果停用這項設定 (預設)，系統會使用「語音結束敏感度」設定值，判斷 Google Cloud 語音轉文字提供的 ML 模型何時結束語音。

雖然「語音感測結束處」設定預設只支援 en-US 語言標記的 phone_call 語音模型，但「啟用以逾時為準的進階語音感測結束處」設定可讓您為 Dialogflow 支援的所有語言和語音模型設定語音感測結束處。

啟用智慧端點

只能在代理程式層級設定。

啟用這項設定後，Conversational Agents (Dialogflow CX) 會分析部分使用者輸入內容，判斷語音是否結束。舉例來說，如果使用者說「我想」並暫停，Conversational Agents (Dialogflow CX) 會等待使用者繼續說完句子。

這項功能在收集數字參數時特別實用，因為使用者可能會先說出「1234」，然後暫停，再說出「5678」。如要為特定參數套用這項設定，請在參數表單中設定智慧端點。

這項設定僅適用於 en-US 語言代碼，且預設為停用。

沒有語音逾時

可在代理程式、流程和頁面層級設定。

Conversational Agents (Dialogflow CX) 停止等待使用者音訊輸入的時間長度 (以秒為單位)。預設值為 5 秒，上限為 60 秒。如果超過這個逾時時間，Conversational Agents (Dialogflow CX) 會叫用無輸入內容事件。

插話

可在代理程式、流程和執行要求層級設定。

啟用後，使用者就能中斷 Conversational Agents (Dialogflow CX) 的回應音訊。如果中斷，Conversational Agents (Dialogflow CX) 會停止傳送音訊，並處理下一個終端使用者輸入內容。

如果訊息佇列中有多則訊息，且訊息是由與頁面、流程或代理程式相關聯的完成事項排入佇列，並已啟用插話功能，則佇列中的所有後續訊息也會啟用插話功能。在這種情況下，整合服務會停止播放所有已啟用插播功能的佇列訊息音訊。

允許取消播放部分回覆

只能在履行層級設定。

在「代理程式設定」>「語音和 IVR」中勾選「啟用進階語音設定」方塊，並在執行要求層級啟用部分回應，即可啟用這項設定。這項設定可取消播放部分回應。

如果訊息佇列中的訊息是由允許取消的完成動作所建立，且佇列中新增了其他訊息，系統就會取消播放該訊息。如果您希望初始訊息開始播放，但如果工作中的 Webhook 在初始訊息播放完畢前產生其他訊息，則取消播放，這時就很有用。

音訊匯出值區

可在代理程式和流程層級設定。

如果提供音訊資料，系統會將與要求相關聯的音訊資料儲存至 Cloud Storage 值區：

已儲存音訊	適用要求
使用者音訊輸入	DetectIntent、StreamingDetectIntent、AnalyzeContent、StreamingAnalyzeContent
為回應合成的文字轉語音 (TTS) 音訊	AnalyzeContent、StreamingAnalyzeContent

將「Storage Object Creator」(Storage 物件建立者) 角色授予專案中的下列服務帳戶：

服務帳戶 (格式為 one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com)，如果您使用合作夥伴內建電話整合。
如果使用 Dialogflow CX Phone Gateway 整合服務，請將服務帳戶設為 service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 格式。如要在 IAM 中找到這個服務帳戶，請勾選「Include Google-provided role grants」選項。

DTMF

如要進一步瞭解這項功能，請參閱 DTMF (雙音多頻訊號) 說明文件。

語音調整

語音模型遷移作業：2024 年第 1 季