Speech-to-Text fornisce il modello latest_short
per il riconoscimento vocale costituito da singole frasi. Questa funzionalità può essere utile per le applicazioni in cui gli utenti danno comandi vocali singoli anziché monologhi o dettature nel formato lungo.
Quando per una richiesta di riconoscimento viene utilizzato un riconoscitore con il modello latest_short
, Speech-to-Text interrompe l'esecuzione del riconoscimento quando rileva che un'espressione è terminata. Speech-to-Text restituirà una risposta all'evento attività vocale con il tipo END_OF_SINGLE_UTTERANCE
seguito dai risultati della trascrizione.
Singola espressione e StreamingRecognize
Se per una richiesta StreamingRecognize
viene selezionato un modello latest_short
Recognizer
, Speech-to-Text chiuderà automaticamente lo stream al termine dell'enunciazione.
Con eventi di attività vocale
Se sono stati attivati anche gli eventi di attività vocale per una richiesta StreamingRecognize, Speech-to-Text restituirà comunque gli eventi di attività vocale inizio/fine del parlato. I timeout dell'attività vocale per l'inizio del parlato continueranno a essere applicati. I timeout per l'attività vocale relativi alla fine del parlato non verranno applicati, poiché lo stream verrà chiuso non appena termina l'enunciazione.