Puoi migliorare l'accuratezza dei risultati della trascrizione che ottieni da Speech-to-Text utilizzando l'adattamento del modello. La funzionalità di adattamento del modello ti consente di specificare parole e/o frasi che Speech-to-Text deve riconoscere più frequentemente nei tuoi dati audio rispetto ad altre alternative che altrimenti potrebbero essere suggerite. L'adattamento del modello è particolarmente utile per migliorare l'accuratezza della trascrizione nei seguenti casi d'uso:
- L'audio contiene parole o frasi che si verificano probabilmente con frequenza.
- L'audio probabilmente contiene parole rare (come nomi propri) o parole che non esistono nell'uso comune.
- L'audio contiene rumore o non è molto chiaro.
Per ulteriori informazioni sull'utilizzo di questa funzionalità, consulta Miglioramento dei risultati della trascrizione con l'adattamento del modello. Per informazioni sui limiti di frasi e caratteri per richiesta di adattamento del modello, consulta Quote e limiti. Non tutti i modelli supportano l'adattamento del parlato. Consulta la sezione Lingue supportate per scoprire quali modelli supportano l'adattamento.
Esempio di codice
L'adattamento vocale è una configurazione facoltativa di Speech-to-Text che puoi utilizzare per personalizzare i risultati della trascrizione in base alle tue esigenze. Per ulteriori informazioni sulla configurazione del corpo della richiesta di riconoscimento, consulta la documentazione
RecognitionConfig
.
Il seguente esempio di codice mostra come migliorare l'accuratezza della trascrizione utilizzando una risorsa
SpeechAdaptation:
PhraseSet
,
CustomClass
,
e miglioramento dell'adattamento del modello.
Per utilizzare un PhraseSet
o un CustomClass
nelle richieste future, prendi nota della relativa
risorsa name
, restituita nella risposta quando crei la risorsa.
Per un elenco delle classi predefinite disponibili per la tua lingua, consulta Token di classe supportati.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la sezione Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text per Python.
Per autenticarti in Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.