Questa sezione mostra come trascrivere in testo l'audio in streaming, ad esempio l'input di un microfono.
Il riconoscimento vocale in streaming ti consente di trasmettere audio a Speech-to-Text e ricevere un flusso di risultati del riconoscimento vocale in tempo reale durante l'elaborazione dell'audio. Consulta anche i limiti audio per le richieste di riconoscimento vocale in streaming. Il riconoscimento vocale di audio in streaming è disponibile solo tramite gRPC.
Esecuzione del riconoscimento vocale in streaming su un file locale
Di seguito è riportato un esempio di esecuzione del riconoscimento vocale in streaming su un file audio locale. È previsto un limite di 10 MB su tutte le richieste di streaming inviate all'API. Questo limite si applica sia alla richiesta StreamingRecognize
iniziale che alla dimensione dei singoli messaggi nel flusso. Il superamento di questo limite causerà un errore.
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Go.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Java.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Node.js.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: Segui le istruzioni di configurazione di C# nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per .NET.
PHP: Segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: Segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per Ruby.
Sebbene sia possibile riprodurre in streaming un file audio locale nell'API Speech-to-Text, è consigliabile eseguire il riconoscimento audio sincrono o asincrono per i risultati della modalità batch.
Eseguire il riconoscimento vocale di audio in streaming su uno stream audio
Speech-to-Text può anche eseguire il riconoscimento su audio in streaming in tempo reale.
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su un flusso audio ricevuto da un microfono:
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Go.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Java.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questi esempi richiedono l'installazione di SoX, che deve essere disponibile in $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e la creazione di un client Speech-to-Text, consulta Librerie client Speech-to-Text.
Linguaggi aggiuntivi
C#: Segui le istruzioni di configurazione di C# nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per .NET.
PHP: Segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: Segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per Ruby.
Eseguire il riconoscimento vocale di audio in streaming illimitato
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su un flusso audio infinito ricevuto da un microfono:
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Java.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio richiede l'installazione di SoX, che deve essere disponibile in $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e la creazione di un client Speech-to-Text, consulta Librerie client Speech-to-Text.
Passaggi successivi
- Scopri come misurare e migliorare la precisione
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Speech-to-Text in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti senza addebiti per l'esecuzione, il test e il deployment dei workload.
Prova Speech-to-Text gratuitamente