Questa pagina descrive come ottenere la punteggiatura automatica nei risultati della trascrizione di Speech-to-Text. Quando attivi questa funzionalità, Speech-to-Text deduce automaticamente la presenza di punti, virgole e punti interrogativi nei tuoi dati audio e li aggiunge alla trascrizione.
Per impostazione predefinita, Speech-to-Text non include segni di punteggiatura nei risultati del riconoscimento vocale. Tuttavia, puoi richiedere a Speech-to-Text di rilevare e inserire automaticamente la punteggiatura nei risultati della trascrizione. Quando attivi la punteggiatura automatica, la funzionalità di Speech-to-Text aggiunge automaticamente la maiuscola alla prima lettera dopo ogni punto e punto interrogativo.
Per attivare la punteggiatura automatica, imposta il campo enableAutomaticPunctuation su
true nei parametri RecognitionConfig per la
richiesta. L'API Speech-to-Text supporta la punteggiatura automatica per tutti i metodi di riconoscimento vocale:
speech:recognize,
speech:longrunningrecognize e
streaming.
I seguenti esempi di codice mostrano come ottenere i dettagli della punteggiatura automatica in una richiesta di trascrizione.
Protocollo
Per informazioni dettagliate, consulta l'endpoint APIspeech:recognize.
Per eseguire il riconoscimento vocale sincrono, invia una richiesta POST e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST mediante curl. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
curl -s -H "Content-Type: application/json" \
-H "Authorization: Bearer "$(gcloud auth print-access-token) \
https://speech.googleapis.com/v1/speech:recognize \
--data '{
"config": {
"encoding":"FLAC",
"sampleRateHertz": 16000,
"languageCode": "en-US",
"enableAutomaticPunctuation": true
},
"audio": {
"uri":"gs://cloud-samples-tests/speech/brooklyn.flac"
}
}'
Per ulteriori informazioni sulla configurazione del corpo della richiesta, consulta la documentazione di riferimento di RecognitionConfig.
Se la richiesta riesce, il server restituisce un codice di stato HTTP 200 OK e la risposta in formato JSON:
{
"results": [
{
"alternatives": [
{
"transcript": "How old is the Brooklyn Bridge?",
"confidence": 0.98360395
}
]
}
]
}
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Go.
Per eseguire l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per eseguire l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per eseguire l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client Speech-to-Text. Per saperne di più, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per eseguire l'autenticazione in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: Segui le istruzioni di configurazione di C# nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per .NET.
PHP: Segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: Segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Speech-to-Text per Ruby.
Passaggi successivi
Esamina come effettuare richieste di trascrizione sincrona.