Pode melhorar a precisão dos resultados da transcrição que obtém do Speech-to-Text através da adaptação do modelo. A funcionalidade de adaptação do modelo permite-lhe especificar palavras e/ou expressões que o Speech-to-Text tem de reconhecer com mais frequência nos seus dados de áudio do que outras alternativas que possam ser sugeridas. A adaptação do modelo é particularmente útil para melhorar a precisão da transcrição nos seguintes exemplos de utilização:
- O áudio contém palavras ou expressões que ocorrem com frequência.
- É provável que o seu áudio contenha palavras raras (como nomes próprios) ou palavras que não são usadas geralmente.
- O áudio contém ruído ou não é muito claro.
Para mais informações sobre a utilização desta funcionalidade, consulte o artigo Melhore os resultados da transcrição com a adaptação do modelo. Para obter informações sobre os limites de expressões e carateres por pedido de adaptação do modelo, consulte Quotas e limites. Nem todos os modelos suportam a adaptação da voz. Consulte o artigo Suporte de idiomas para ver que modelos suportam a adaptação.
Exemplo de código
A adaptação de voz é uma configuração opcional de conversão de voz em texto que pode usar para personalizar os resultados da transcrição de acordo com as suas necessidades. Consulte a
RecognitionConfig
documentação para mais informações sobre a configuração do corpo do pedido de reconhecimento.
O seguinte exemplo de código mostra como melhorar a precisão da transcrição através de um recurso
SpeechAdaptation
:
PhraseSet
,
CustomClass
e aumento da adaptação do modelo.
Para usar um PhraseSet
ou CustomClass
em pedidos futuros, tome nota do respetivo recurso name
, devolvido na resposta quando cria o recurso.
Para ver uma lista das classes pré-criadas disponíveis para o seu idioma, consulte o artigo Tokens de classe suportados.
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.