單一語音輸入行為
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
Speech-to-Text 提供 latest_short
模型,可辨識由單一發言所組成的語音。在使用者發出單一語音指令 (而非長篇獨白或口述) 的應用程式中,這項功能可能會很實用。
當使用含有 latest_short
模型的辨識器處理辨識要求時,Speech-to-Text 會在偵測到語句結束後停止執行辨識作業。語音轉文字會傳回語音活動事件回應,其類型為 END_OF_SINGLE_UTTERANCE
,後面接著轉錄結果。
單一語句和 StreamingRecognize
如果為 StreamingRecognize
要求選取 latest_short
模型 Recognizer
,語音轉文字會在語音結束後自動關閉串流。
使用語音活動事件
如果您也為 StreamingRecognize 要求啟用語音活動事件,Speech-to-Text 仍會傳回語音開始/結束語音活動事件。系統仍會套用語音活動開始的逾時限制。系統不會套用語音結束的語音活動逾時,因為語音結束後串流會立即關閉。
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-07-09 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-07-09 (世界標準時間)。"],[],[]]