Configurare Speech-to-Text

Speech-to-Text è un'API basata sulla tecnologia di intelligenza artificiale (AI) di Google. Invii i dati audio a Speech-to-Text e ricevi una risposta con la trascrizione in testo dei dati audio.

Per ulteriori informazioni su come creare una richiesta di Speech-to-Text, consulta la pagina requests.

Panoramica

Prima di poter iniziare a inviare richieste a Speech-to-Text, devi attivare l'API nella console Google Cloud. I passaggi riportati in questa pagina descrivono le seguenti azioni:

  • Attivare Speech-to-Text in un progetto.
  • Assicurati che la fatturazione sia attivata per Speech-to-Text.
  • (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.

Prima di iniziare

Esistono due modi per accedere al servizio: utilizzando l'API REST o la console Speech-to-Text. Forniamo esempi di codice che mostrano come effettuare una richiesta all'API REST e ricevere una risposta. Per scoprire come utilizzare questi esempi, consulta le guide rapide e le guide pratiche di Speech-to-Text. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi utilizzare la console Cloud Speech-to-Text.

Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Se non hai mai programmato, ti consigliamo di iniziare con i tutorial passo passo nella console della piattaforma Google Cloud prima di iniziare questa guida rapida.

Configurare il progetto Google Cloud per Speech-to-Text

  1. Accedi alla console Google Cloud

  2. Vai alla pagina del selettore dei progetti

    Puoi scegliere un progetto esistente o crearne uno nuovo. Per scoprire di più sulla creazione di un progetto, consulta la pagina Creare e gestire progetti.

  3. Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto esistente, assicurati di avere attivato la fatturazione.

    Scopri come verificare che la fatturazione sia attivata per il tuo progetto

  4. Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi attivare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.

  5. Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text per l'utilizzo con il tuo progetto, fai clic su ABILITA.

  6. (Facoltativo) Attiva il logging dei dati. Attivando il logging dei dati, consente a Google di registrare tutti i dati audio inviati a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli di Speech-to-Text. Gli utenti che attivano il logging dei dati beneficiano di prezzi inferiori. Per ulteriori informazioni, consulta le pagine relative ai prezzi e ai Termini e condizioni relativi al logging dei dati.

(Facoltativo) Crea un bucket Cloud Storage

Se intendi trascrivere audio di durata superiore a 60 secondi o con dimensioni del file superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di poterli trascrivere utilizzando Speech-to-Text. I passaggi riportati di seguito illustrano la procedura di creazione di un nuovo bucket.

  • In the Google Cloud console, go to the Cloud Storage Buckets page.

    Go to Buckets page

  • Click Create bucket.
  • On the Create a bucket page, enter your bucket information. To go to the next step, click Continue.
    • For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
    • For Choose where to store your data, do the following:
      • Select a Location type option.
      • Select a Location option.
    • For Choose a default storage class for your data, select a storage class.
    • For Choose how to control access to objects, select an Access control option.
    • For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
  • Click Create.
  • Disattiva l'API Speech-to-Text

    Completa i passaggi che seguono se non avrai più bisogno di utilizzare l'API Speech-to-Text in futuro.

    1. Vai alla dashboard di Google Cloud e fai clic sul link Vai alla panoramica delle API nella casella API.
    2. Seleziona l'API Cloud Speech-to-Text.
    3. Fai clic sul pulsante DISATTIVA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.

    Passaggi successivi

    Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando librerie client, gcloud, la riga di comando o la UI di Speech-to-Text.