單一語音輸入行為

Speech-to-Text 提供 latest_short 模型,可辨識由單一發言所組成的語音。在使用者發出單一語音指令 (而非長篇獨白或口述) 的應用程式中,這項功能可能會很實用。

當使用含有 latest_short 模型的辨識器處理辨識要求時,Speech-to-Text 會在偵測到語句結束後停止執行辨識作業。語音轉文字會傳回語音活動事件回應,其類型為 END_OF_SINGLE_UTTERANCE,後面接著轉錄結果。

單一語句和 StreamingRecognize

如果為 StreamingRecognize 要求選取 latest_short 模型 Recognizer,語音轉文字會在語音結束後自動關閉串流。

使用語音活動事件

如果您也為 StreamingRecognize 要求啟用語音活動事件,Speech-to-Text 仍會傳回語音開始/結束語音活動事件。系統仍會套用語音活動開始的逾時限制。系統不會套用語音結束的語音活動逾時,因為語音結束後串流會立即關閉。