Questa pagina descrive come attivare il riconoscimento della lingua per le richieste di trascrizione audio inviate a Speech-to-Text.
In alcune situazioni, non sai con certezza la lingua delle tue registrazioni audio. Ad esempio, se pubblichi il tuo servizio, app o prodotto in un paese con più lingue ufficiali, puoi potenzialmente ricevere input audio dagli utenti in una varietà di lingue. In questo modo, specificare un singolo codice lingua per le richieste di trascrizione può diventare molto più difficile.
Riconoscimento di più lingue
Speech-to-Text ti offre un modo per specificare un insieme di lingue alternative che i tuoi dati audio potrebbero contenere. Quando invii una richiesta di trascrizione audio a Speech-to-Text, puoi fornire un elenco di lingue aggiuntive che i dati audio potrebbero includere. Se includi un elenco di lingue nella richiesta, Speech-to-Text tenta di trascrivere l'audio in base alla lingua che meglio si adatta al campione tra le alternative che fornisci. Speech-to-Text etichetta quindi i risultati della trascrizione con il codice lingua previsto.
Questa funzionalità è ideale per le app che devono trascrivere brevi dichiarazioni come comandi vocali o ricerche. Puoi elencare fino a tre lingue alternative tra quelle supportate da Speech-to-Text oltre alla lingua principale (per un totale di quattro lingue).
Anche se puoi specificare lingue alternative per la richiesta di trascrizione vocale, devi comunque fornire un codice di lingua principale nel campo languageCode
. Inoltre, devi limitare il numero
di lingue richieste al minimo indispensabile. Se richiedi un numero inferiore di codici
di lingua alternativi, Speech-to-Text riuscirà a selezionare
più facilmente quello corretto. Specificare una sola lingua
produce i risultati migliori.
Attivare il riconoscimento della lingua nelle richieste di trascrizione audio
Per specificare lingue alternative nella trascrizione audio,
devi impostare il campo alternativeLanguageCodes
su un elenco di
codici di lingua nei parametri
RecognitionConfig
per la richiesta. Speech-to-Text supporta
codici di lingua alternativi per tutti i metodi di riconoscimento vocale:
speech:recognize
,
speech:longrunningrecognize
e streaming.
Utilizzare un file locale
Protocollo
Per informazioni dettagliate, consulta l'endpoint API speech:recognize
.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST
e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST
mediante curl
. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
L'esempio seguente mostra come richiedere la trascrizione di un file audio che potrebbe includere discorsi in inglese, francese o tedesco.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK
e la risposta in formato JSON, salvata in un file denominato multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Java.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Node.js.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Utilizzare un file remoto
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Java.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Node.js.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.