Transcrever voz em texto usando bibliotecas de cliente
Esta página mostra como enviar uma solicitação de reconhecimento de fala para a Speech-to-Text na sua linguagem de programação preferencial usando as bibliotecas de cliente do Google Cloud.
A Speech-to-Text facilita a integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text e ela retorna uma transcrição em texto do arquivo de áudio. Para saber mais sobre o serviço, consulte Conceitos básicos da Speech-to-Text.
Antes de começar
Antes de enviar uma solicitação para a API Speech-to-Text, é necessário realizar as ações abaixo. Consulte a página Antes de começar para saber mais.
- Ativar a Speech-to-Text em um projeto do Google Cloud.
- Verificar se o faturamento está ativado para a Speech-to-Text.
-
Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
gcloud init
Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- (Opcional) Criar um bucket do Google Cloud Storage para armazenar dados de áudio.
Instalar a biblioteca de cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar a biblioteca, verifique se você preparou o ambiente para o desenvolvimento em Node.js..
npm install @google-cloud/speech
Python
Antes de instalar a biblioteca, verifique se você preparou o ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-speech
Fazer uma solicitação de transcrição de áudio
Use a Speech-to-Text para transcrever um arquivo de áudio
para texto. Use o código a seguir para enviar uma
solicitação recognize
à API Speech-to-Text.
Go
Java
Node.js
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Node.js.
Python
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Python.
Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.
Se você receber um erro ou uma resposta vazia da Speech to Text, confira as etapas de solução de problemas e de mitigação de erros.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.
- Use o Google Cloud console para excluir o projeto, se você não precisar mais dele.
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
- Aprenda a transcrever um streaming de áudio, como de um microfone.
- Comece a usar a Speech-to-Text no idioma de sua preferência com uma biblioteca de cliente da Speech-to-Text.
- Trabalhe com os aplicativos de exemplo.
- Consulte a documentação de práticas recomendadas para ter melhor desempenho e acurácia e conferir outras dicas.