Synthétiser la voix avec le streaming bidirectionnel
Ce document vous explique comment synthétiser des contenus audio à l'aide du streaming bidirectionnel.
Le streaming bidirectionnel vous permet d'envoyer des entrées de texte et de recevoir des données audio simultanément. Cela signifie que vous pouvez commencer à synthétiser la parole avant l'envoi du texte d'entrée complet, ce qui réduit la latence et permet des interactions en temps réel. Les assistants vocaux et les jeux interactifs utilisent le streaming bidirectionnel pour créer des applications plus dynamiques et réactives.
Pour en savoir plus sur les concepts fondamentaux de Text-to-Speech, consultez la page Concepts fondamentaux de Text-to-Speech.
Avant de commencer
Avant de pouvoir envoyer une requête à l'API Text-to-Speech, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- Activez Text-to-Speech sur un projet Google Cloud.
- Vérifiez que la facturation est activée pour Text-to-Speech.
-
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Synthétiser la voix avec le streaming bidirectionnel
Installer la bibliothèque cliente
Python
Avant d'installer la bibliothèque, assurez-vous d'avoir préparé votre environnement pour le développement Python.
pip install --upgrade google-cloud-texttospeech
Envoyer un flux de texte et recevoir un flux audio
L'API accepte un flux de requêtes de type StreamingSynthesizeRequest
, qui contient StreamingSynthesisInput
ou StreamingSynthesizeConfig
.
Avant d'envoyer un flux StreamingSynthesizeRequest
avec StreamingSynthesisInput
, qui fournit une entrée de texte, envoyez exactement un StreamingSynthesizeRequest
avec un StreamingSynthesizeConfig
.
Le streaming de Text-to-Speech n'est compatible qu'avec les voix Journey.
Python
Avant d'exécuter l'exemple, assurez-vous d'avoir préparé l'environnement pour le développement Python.
Effectuer un nettoyage
Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide de Google Cloud Console si vous n'en avez plus besoin.
Étape suivante
- Pour en savoir plus sur Cloud Text-to-Speech, consultez la page Concepts de base.
- Passez en revue la liste des voix disponibles que vous pouvez utiliser pour la voix synthétique.