Comportamento de comando único

O Speech-to-Text fornece o modelo latest_short para reconhecer a voz que consiste em expressões únicas. Isto pode ser útil para aplicações em que os utilizadores emitem comandos de voz únicos, em vez de monólogos longos ou ditados.

Quando um reconhecedor com o modelo latest_short é usado para um pedido de reconhecimento, o Speech-to-Text deixa de realizar o reconhecimento assim que deteta que uma expressão terminou. A conversão de voz em texto devolve uma resposta de evento de atividade de voz com o tipo END_OF_SINGLE_UTTERANCE seguido dos resultados da transcrição.

Expressão única e StreamingRecognize

No caso em que um modelo latest_short Recognizer é selecionado para um pedido StreamingRecognize, o Speech-to-Text fecha automaticamente a stream após o fim da expressão.

Com eventos de atividade de voz

No caso em que os eventos de atividade de voz também tenham sido ativados para um pedido StreamingRecognize, o Speech-to-Text continua a devolver eventos de atividade de voz de início/fim de voz. Os limites de tempo de atividade de voz para o início da fala continuam a ser aplicados. Os limites de tempo de atividade de voz para o fim da fala não são aplicados, uma vez que a stream é fechada assim que a expressão termina.