Nesta página, descrevemos como ativar o reconhecimento de idioma para solicitações de transcrição de áudio enviadas à Speech-to-Text.
Em algumas situações, você pode não saber ao certo qual é o idioma contido na gravação de áudio. Por exemplo, caso seu serviço, aplicativo ou produto seja oferecido em um país com vários idiomas oficiais, você poderá receber entradas de áudio de usuários em idiomas diferentes. Isso pode dificultar muito a especificação de um único código de idioma para solicitações de transcrição.
Reconhecimento de vários idiomas
A Speech-to-Text permite especificar um conjunto de idiomas alternativos que possam estar presentes nos dados de áudio. Quando você envia uma solicitação de transcrição de áudio para a Speech-to-Text, pode fornecer uma lista de idiomas complementares que possam estar presentes nos dados de áudio. Se você incluir uma lista de idiomas na solicitação, a Speech-to-Text vai tentar transcrever o áudio com base no idioma que melhor se encaixa na amostra, baseando-se nas alternativas fornecidas. A Speech-to-Text rotula os resultados da transcrição com o código de idioma previsto.
Esse recurso é ideal para aplicativos que precisam transcrever frases curtas, como comandos de voz ou pesquisas. É possível listar até três idiomas alternativos entre aqueles aceitos pela Speech-to-Text, além do idioma principal, totalizando quatro idiomas.
Embora seja possível especificar idiomas alternativos para a solicitação de
transcrição de fala, você ainda precisa fornecer um código de idioma principal
no campo languageCode
. Além disso, é recomendável limitar o número
de idiomas solicitados ao mínimo. Quanto menos códigos de
idioma alternativos forem solicitados, mais fácil será para a Speech-to-Text
escolher o correto. Para ter melhores resultados,
especifique apenas um idioma.
Ativar o reconhecimento de idioma em solicitações de transcrição de áudio
Para especificar idiomas alternativos na transcrição de áudio,
defina o campo alternativeLanguageCodes
como uma lista de
códigos de idioma nos parâmetros
RecognitionConfig
da solicitação. A Speech-to-Text aceita
códigos de idiomas alternativos para todos os métodos de reconhecimento de fala:
speech:recognize
,
speech:longrunningrecognize
e streaming.
Usar um arquivo local
Protocolo
Consulte o endpoint de API speech:recognize
para conferir todos os detalhes.
Para realizar o reconhecimento de fala síncrono, faça uma solicitação POST
e forneça o
corpo de solicitação apropriado. Confira a seguir um exemplo de uma solicitação POST
que usa
curl
. O exemplo usa a CLI do Google Cloud para gerar um token
de acesso. Para saber como instalar a gcloud CLI,
consulte o guia de início rápido.
Confira no exemplo a seguir como solicitar a transcrição de um arquivo de áudio que pode incluir falas em inglês, francês ou alemão.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Quando a solicitação é bem-sucedida, o servidor retorna um código de status HTTP 200 OK
e a resposta no formato JSON, salvos em um
arquivo chamado multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Node.js.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Usar um arquivo remoto
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Node.js.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.