Transcrever uma voz em texto usando a gcloud CLI

Veja nesta página como enviar uma solicitação de reconhecimento de fala para o Speech-to-Text usando a ferramenta gcloud a partir da linha de comando.

O Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text, que em seguida retorna uma transcrição de texto desse arquivo de áudio. Para mais informações sobre o serviço , consulte Conceitos básicos do Speech-to-Text.

Antes de começar

Antes de enviar uma solicitação para a API Speech-to-Text, é necessário concluir as ações a seguir. Consulte a página antes de começar para ver os detalhes.

Ative o Speech-to-Text em um projeto do GCP.
1. Verifique se o faturamento está ativado para o Speech-to-Text.
Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
```
gcloud init
```
Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
(Opcional) Criar um novo bucket do Google Cloud Storage para armazenar dados de áudio.

Fazer uma solicitação de transcrição de áudio

Use o Speech-to-Text para transcrever um arquivo de áudio para texto. Use o exemplo de código a seguir para enviar uma solicitação recognize para a API Speech-to-Text.

Abra o shell da linha de comando e execute este comando.

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Este comando solicita que o Speech-to-Text transcreva o áudio contido em um FLAC hospedado em um local acessível ao público.

Se a solicitação for bem-sucedida, o servidor retornará uma resposta no formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.

Se você receber um erro ou uma resposta vazia do Speech to Text, confira as etapas de solução de problemas e de mitigação de erros.

Limpeza

Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.

Use o Google Cloud console Console do Cloud para excluir seu projeto se você não precisar dele.

A seguir

Pratique a transcrição de arquivos de áudio curtos.
Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
Aprenda a transcrever o streaming de áudio, como de um microfone.
Comece a usar o Speech-to-Text no idioma de sua preferência usando uma biblioteca de cliente do Speech-to-Text.
Trabalhe com os aplicativos de exemplo.
Para ter o melhor desempenho e acurácia e ver outras dicas, consulte a documentação sobre Práticas recomendadas.