Sintetizza il parlato con lo streaming bidirezionale
Questo documento descrive la procedura di sintesi dell'audio utilizzando lo streaming bidirezionale.
Lo streaming bidirezionale ti consente di inviare input di testo e ricevere dati audio contemporaneamente. Ciò significa che puoi iniziare a sintetizzare la voce prima che venga inviato il testo di input completo, il che riduce la latenza e consente interazioni in tempo reale. Gli assistenti vocali e i giochi interattivi utilizzano lo streaming bidirezionale per creare applicazioni più dinamiche e reattive.
Per scoprire di più sui concetti fondamentali di Text-to-Speech, leggi Nozioni di base di Text-to-Speech.
Prima di iniziare
Prima di poter inviare una richiesta all'API Text-to-Speech, devi aver completato le seguenti azioni. Per informazioni dettagliate, consulta la pagina Prima di iniziare.
- Abilitare Text-to-Speech in un progetto Google Cloud .
- Assicurati che la fatturazione sia attivata per Text-to-Speech.
-
After installing the Google Cloud CLI, sign in to the gcloud CLI with your federated identity and then initialize it by running the following command:
gcloud init
Sintetizza il parlato con lo streaming bidirezionale
installa la libreria client
Python
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Python.
pip install --upgrade google-cloud-texttospeech
Inviare un flusso di testo e ricevere un flusso audio
L'API accetta un flusso di richieste di tipo StreamingSynthesizeRequest
,
che contengono StreamingSynthesisInput
o StreamingSynthesizeConfig
.
Prima di inviare un flusso StreamingSynthesizeRequest
con
StreamingSynthesisInput
, che fornisce l'input di testo, invia esattamente un
StreamingSynthesizeRequest
con un StreamingSynthesizeConfig
.
Text-to-Speech in streaming è compatibile solo con Chirp 3: voci in HD.
Python
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Python.
Esegui la pulizia
Per evitare addebiti Google Cloud non necessari, utilizzaGoogle Cloud console per eliminare il progetto se non ti serve.
Passaggi successivi
- Scopri di più su Cloud Text-to-Speech leggendo le nozioni di base.
- Consulta l'elenco delle voci disponibili che puoi utilizzare per la sintesi vocale.