Nesta seção, demonstramos como transcrever em texto streamings de áudio, como a entrada de um microfone.
O reconhecimento de fala de streaming permite que você faça streaming de áudio para a Speech-to-Text e receba os resultados do reconhecimento de fala de streaming em tempo real conforme o áudio é processado. Consulte também os limites de áudio para solicitações de reconhecimento de fala em streaming. O reconhecimento de fala em streaming só está disponível via gRPC.
Realizar o reconhecimento de fala com streaming em um arquivo local
Confira abaixo um exemplo de reconhecimento de fala em streaming em um arquivo de áudio
local. Há um limite de 10 MB em todas as solicitações de streaming enviadas à API. Esse
limite se aplica à solicitação StreamingRecognize
inicial e ao tamanho de cada mensagem individual no streaming. Exceder esse limite
causará um erro.
Go
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Go.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Node.js.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Linguagens adicionais
C#: siga as instruções de configuração de C# na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para .NET.
PHP: siga as instruções de configuração de PHP na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para PHP.
Ruby: siga as instruções de configuração do Ruby na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para Ruby.
Embora seja possível fazer streaming de um arquivo de áudio local para a API Speech-to-Text, recomendamos realizar o reconhecimento de áudio síncrono ou assíncrono para receber os resultados no modo de lote.
Realizar o reconhecimento de fala com streaming em um stream de áudio
A Speech-to-Text também pode realizar reconhecimento em streaming de áudio em tempo real.
Este é um exemplo do reconhecimento de fala em streaming feito em um stream de áudio recebido de um microfone:
Go
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Go.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para essas amostras, é preciso que você instale o SoX e que ele esteja disponível no $PATH
.
- Para Mac OS:
brew install sox
. - Para a maioria das distribuições do Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: faça o download dos binários.
Para saber como instalar e criar um cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text.
Linguagens adicionais
C#: siga as instruções de configuração de C# na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para .NET.
PHP: siga as instruções de configuração de PHP na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para PHP.
Ruby: siga as instruções de configuração do Ruby na página das bibliotecas de cliente e acesse a documentação de referência da Speech-to-Text para Ruby.
Realizar o reconhecimento de fala com streaming contínuo
Este é um exemplo do reconhecimento de fala em streaming feito em um stream de áudio contínuo recebido de um microfone:
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para se autenticar na Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para essa amostra, é preciso que você instale o SoX e que ele esteja disponível no $PATH
.
- Para Mac OS:
brew install sox
. - Para a maioria das distribuições do Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: faça o download dos binários.
Para saber como instalar e criar um cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text.
A seguir
- Saiba como avaliar e melhorar a acurácia
Faça um teste
Se você ainda não conhece o Google Cloud, crie uma conta para avaliar o desempenho da Speech-to-Text em cenários reais. Clientes novos também recebem US$ 300 em créditos sem custos para executar, testar e implantar cargas de trabalho.
Faça um teste da Speech-to-Text sem custos