Questa sezione mostra come trascrivere in testo l'audio in streaming, ad esempio l'input da un microfono.
Il riconoscimento vocale di audio in streaming ti consente di trasmettere in streaming l'audio a Speech-to-Text e di ricevere i risultati del riconoscimento vocale in streaming in tempo reale durante l'elaborazione dell'audio. Consulta anche i limiti relativi all'audio per le richieste di riconoscimento vocale in streaming. Il riconoscimento vocale di audio in streaming è disponibile solo tramite gRPC.
Eseguire il riconoscimento vocale in streaming su un file locale
Di seguito è riportato un esempio di esecuzione del riconoscimento vocale in streaming su un
file audio locale. È previsto un limite di 10 MB per tutte le richieste di streaming inviate all'API. Questo
limite si applica sia alla richiesta StreamingRecognize
iniziale che alla dimensione dei singoli messaggi nel flusso. Il superamento di questo limite causerà un errore.
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Go.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Speech-to-Text per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per Ruby.
Sebbene tu possa riprodurre in streaming un file audio locale nell'API Speech-to-Text, è consigliabile eseguire il riconoscimento audio sincrono o asincrono per i risultati in modalità batch.
Eseguire il riconoscimento vocale di audio in streaming su uno stream audio
Speech-to-Text può anche eseguire il riconoscimento su audio in streaming e in tempo reale.
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su uno stream audio ricevuto da un microfono:
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Go.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questi esempi richiedono l'installazione di SoX e devono essere disponibili in $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e sulla creazione di un client Speech-to-Text, consulta Librerie client Speech-to-Text.
Linguaggi aggiuntivi
C#: segui le istruzioni di configurazione per C# riportate nella pagina delle librerie client e consulta la documentazione di riferimento di Speech-to-Text per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per Ruby.
Eseguire il riconoscimento vocale di audio in streaming infinito
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su uno stream audio infinito ricevuto da un microfono:
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per autenticarti a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio richiede l'installazione di SoX e deve essere disponibile in $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e sulla creazione di un client Speech-to-Text, consulta Librerie client Speech-to-Text.
Passaggi successivi
- Scopri come misurare e migliorare la precisione
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Speech-to-Text in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
Prova Speech-to-Text gratuitamente