Synthétiser la voix avec le streaming bidirectionnel
Ce document vous explique comment synthétiser des contenus audio à l'aide du streaming bidirectionnel.
Le streaming bidirectionnel vous permet d'envoyer des entrées de texte et de recevoir des données audio simultanément. Cela signifie que vous pouvez commencer à synthétiser la parole avant l'envoi du texte d'entrée complet, ce qui réduit la latence et permet des interactions en temps réel. Les assistants vocaux et les jeux interactifs utilisent le streaming bidirectionnel pour créer des applications plus dynamiques et réactives.
Pour en savoir plus sur les concepts fondamentaux de Text-to-Speech, consultez la page Concepts fondamentaux de Text-to-Speech.
Avant de commencer
Avant de pouvoir envoyer une requête à l'API Text-to-Speech, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- activer Text-to-Speech dans un projet Google Cloud ;
- Vérifiez que la facturation est activée pour Text-to-Speech.
-
After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:
gcloud init
Synthétiser la voix avec le streaming bidirectionnel
Installer la bibliothèque cliente
Python
Avant d'installer la bibliothèque, assurez-vous d'avoir préparé votre environnement pour le développement Python.
pip install --upgrade google-cloud-texttospeech
Envoyer un flux de texte et recevoir un flux audio
L'API accepte un flux de requêtes de type StreamingSynthesizeRequest
, qui contient StreamingSynthesisInput
ou StreamingSynthesizeConfig
.
Avant d'envoyer un flux StreamingSynthesizeRequest
avec StreamingSynthesisInput
, qui fournit une entrée de texte, envoyez exactement un StreamingSynthesizeRequest
avec un StreamingSynthesizeConfig
.
Le streaming de Text-to-Speech n'est compatible qu'avec les voix Chirp 3 : HD.
Python
Avant d'exécuter l'exemple, assurez-vous d'avoir préparé l'environnement pour le développement Python.
Effectuer un nettoyage
Pour éviter des frais Google Cloud Platform inutiles, supprimez votre projet à l'aide deGoogle Cloud console si vous n'en avez plus besoin.
Étapes suivantes
- Pour en savoir plus sur Cloud Text-to-Speech, consultez la page Concepts de base.
- Passez en revue la liste des voix disponibles que vous pouvez utiliser pour la voix synthétique.