Sprache mit bidirektionalem Streaming synthetisieren
In diesem Dokument wird beschrieben, wie Sie Audioinhalte mithilfe von bidirektionalem Streaming synthetisieren.
Mit bidirektionalem Streaming können Sie gleichzeitig Texteingaben senden und Audiodaten empfangen. Das bedeutet, dass Sie mit der Sprachsynthese beginnen können, bevor der vollständige Eingabetext gesendet wird. Dadurch wird die Latenz verringert und Interaktionen in Echtzeit werden ermöglicht. Sprachassistenten und interaktive Spiele verwenden bidirektionales Streaming, um dynamischere und reaktionsschnellere Anwendungen zu erstellen.
Weitere Informationen zu den grundlegenden Konzepten von Text-to-Speech finden Sie unter Grundlagen von Text-to-Speech.
Hinweis
Bevor Sie eine Anfrage an die Text-to-Speech API senden können, müssen Sie die folgenden Aktionen ausgeführt haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.
- Text-to-Speech in einem Google Cloud -Projekt aktivieren.
- Die Abrechnung muss für Text-to-Speech aktiviert sein.
-
After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:
gcloud init
Sprache mit bidirektionalem Streaming synthetisieren
Clientbibliothek installieren
Python
Bevor Sie die Bibliothek installieren, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
pip install --upgrade google-cloud-texttospeech
Textstream senden und Audiostream empfangen
Die API akzeptiert einen Stream von Anfragen vom Typ StreamingSynthesizeRequest
, die entweder StreamingSynthesisInput
oder StreamingSynthesizeConfig
enthalten.
Bevor Sie einen Stream StreamingSynthesizeRequest
mit StreamingSynthesisInput
senden, der Texteingabe enthält, senden Sie genau einen StreamingSynthesizeRequest
mit einem StreamingSynthesizeConfig
.
Streaming-Text-to-Speech ist nur mit Chirp 3: HD-Stimmen kompatibel.
Python
Bevor Sie das Beispiel ausführen, prüfen Sie, ob Sie Ihre Umgebung auf die Python-Entwicklung vorbereitet haben.
Bereinigen
Löschen Sie das Projekt mit derGoogle Cloud console , wenn Sie es nicht benötigen. Damit vermeiden Sie unnötige Kosten für die Google Cloud Platform.
Nächste Schritte
- Grundlagen der Cloud Text-to-Speech API
- Liste der für synthetische Sprache verfügbaren Stimmen