Comportamiento de una sola petición

Speech-to-Text proporciona el modelo latest_short para reconocer la voz que consta de una sola frase. Esto puede ser útil en aplicaciones en las que los usuarios emiten comandos de voz únicos en lugar de monólogos o dictados largos.

Cuando se usa un reconocedor con el modelo latest_short para una solicitud de reconocimiento, Speech-to-Text dejará de realizar el reconocimiento una vez que detecte que ha terminado una expresión. Speech-to-Text devolverá una respuesta de evento de actividad de voz con el tipo END_OF_SINGLE_UTTERANCE seguido de los resultados de la transcripción.

Una sola expresión y StreamingRecognize

Si se selecciona un modelo latest_short Recognizer para una solicitud StreamingRecognize, Speech-to-Text cerrará el flujo automáticamente cuando termine la expresión.

Con eventos de actividad de voz

En el caso de que también se hayan habilitado los eventos de actividad de voz para una solicitud StreamingRecognize, Speech-to-Text seguirá devolviendo eventos de actividad de voz de inicio y fin de voz. Seguirán aplicándose los tiempos de espera de la actividad de voz para el inicio de la conversación. No se aplicarán tiempos de espera por inactividad de voz para el final de la conversación, ya que el flujo se cerrará en cuanto termine la expresión.