Trascrivere la voce in testo utilizzando gcloud CLI
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando lo strumento gcloud
dalla riga di comando.
Speech-to-Text consente di integrare facilmente le tecnologie di riconoscimento vocale di Google nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Speech-to-Text, che restituisce una trascrizione di testo del file audio. Per saperne di più sul servizio, consulta la pagina Nozioni di base di Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le seguenti azioni. Per informazioni dettagliate, consulta la pagina Prima di iniziare.
- Abilita Speech-to-Text in un progetto GCP.
- Assicurati che la fatturazione sia attivata per Speech-to-Text.
-
Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il seguente comando:
gcloud init
Se utilizzi un provider di identità (IdP) esterno, devi prima accedere alla gcloud CLI con la tua identità federata.
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Esecuzione di una richiesta di trascrizione audio
Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il seguente esempio di codice per inviare una richiesta
recognize
all'API Speech-to-Text.
Apri la shell della riga di comando ed esegui il comando seguente.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Questo comando richiede a Speech-to-Text di trascrivere l'audio contenuto in un file FLAC ospitato in una posizione accessibile pubblicamente.
Se la richiesta riesce, il server restituisce una risposta in formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, consulta i passaggi di risoluzione dei problemi e mitigazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Utilizza Google Cloud console per eliminare il progetto se non ti serve.
Passaggi successivi
- Esercitati a trascrivere file audio corti.
- Scopri come elaborare in batch file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere l'audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per ottenere prestazioni, precisione e altri suggerimenti ottimali, consulta la documentazione sulle best practice.