Speech-to-Text è un'API basata sulla tecnologia di intelligenza artificiale (AI) di Google. Invii i dati audio a Speech-to-Text e ricevi una risposta con la trascrizione in testo dei dati audio.
Per ulteriori informazioni su come creare una richiesta di Speech-to-Text, consulta la pagina requests.
Panoramica
Prima di poter iniziare a inviare richieste a Speech-to-Text, devi attivare l'API nella console Google Cloud. I passaggi riportati in questa pagina descrivono le seguenti azioni:
- Attivare Speech-to-Text in un progetto.
- Assicurati che la fatturazione sia attivata per Speech-to-Text.
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Prima di iniziare
Esistono due modi per accedere al servizio: utilizzando l'API REST o la console Speech-to-Text. Forniamo esempi di codice che mostrano come effettuare una richiesta all'API REST e ricevere una risposta. Per scoprire come utilizzare questi esempi, consulta le guide rapide e le guide pratiche di Speech-to-Text. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi utilizzare la console Cloud Speech-to-Text.
Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Se non hai mai programmato, ti consigliamo di iniziare con i tutorial passo passo nella console della piattaforma Google Cloud prima di iniziare questa guida rapida.
Configurare il progetto Google Cloud per Speech-to-Text
Vai alla pagina del selettore dei progetti
Puoi scegliere un progetto esistente o crearne uno nuovo. Per scoprire di più sulla creazione di un progetto, consulta la pagina Creare e gestire progetti.
Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto esistente, assicurati di avere attivato la fatturazione.
Scopri come verificare che la fatturazione sia attivata per il tuo progetto
Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi attivare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.
Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text per l'utilizzo con il tuo progetto, fai clic su ABILITA.
(Facoltativo) Attiva il logging dei dati. Attivando il logging dei dati, consente a Google di registrare tutti i dati audio inviati a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli di Speech-to-Text. Gli utenti che attivano il logging dei dati beneficiano di prezzi inferiori. Per ulteriori informazioni, consulta le pagine relative ai prezzi e ai Termini e condizioni relativi al logging dei dati.
(Facoltativo) Crea un bucket Cloud Storage
Se intendi trascrivere audio di durata superiore a 60 secondi o con dimensioni del file superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di poterli trascrivere utilizzando Speech-to-Text. I passaggi riportati di seguito illustrano la procedura di creazione di un nuovo bucket.
- For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
-
For Choose where to store your data, do the following:
- Select a Location type option.
- Select a Location option.
- For Choose a default storage class for your data, select a storage class.
- For Choose how to control access to objects, select an Access control option.
- For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
Disattiva l'API Speech-to-Text
Completa i passaggi che seguono se non avrai più bisogno di utilizzare l'API Speech-to-Text in futuro.
- Vai alla dashboard di Google Cloud e fai clic sul link Vai alla panoramica delle API nella casella API.
- Seleziona l'API Cloud Speech-to-Text.
- Fai clic sul pulsante DISATTIVA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.
Passaggi successivi
Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando librerie client, gcloud, la riga di comando o la UI di Speech-to-Text.