Trascrivere il parlato in testo utilizzando gcloud CLI
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando lo strumento gcloud
dalla riga di comando.
Speech-to-Text consente di integrare facilmente le tecnologie di riconoscimento vocale di Google nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo del file audio. Per ulteriori informazioni sul servizio, consulta Nozioni di base su Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le seguenti azioni. Per informazioni dettagliate, consulta la pagina Prima di iniziare.
- Attivare Speech-to-Text in un progetto Google Cloud.
- Assicurati che la fatturazione sia attivata per Speech-to-Text.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Esecuzione di una richiesta di trascrizione audio
Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il seguente esempio di codice per inviare una richiesta
recognize
all'API Speech-to-Text.
Apri la shell della riga di comando ed esegui il comando seguente.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Questo comando richiede a Speech-to-Text di trascrivere l'audio contenuto in un file FLAC ospitato in una posizione accessibile pubblicamente.
Se la richiesta riesce, il server restituisce una risposta in formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, consulta i passaggi per la risoluzione dei problemi e la mitigazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Utilizza la console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Fai pratica di trascrizione di file audio brevi.
- Scopri come eseguire il batch di file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere l'audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per ottenere il massimo rendimento e la massima precisione e altri suggerimenti, consulta la documentazione relativa alle best practice.