Preços do Speech-to-Text
Os preços da Speech-to-Text são calculados com base na quantidade de áudio processada pelo serviço a cada mês, medida em incrementos de um segundo. Se a API retornar uma resposta, o áudio enviado na solicitação foi processado com sucesso. Isso inclui uma resposta vazia, que indica que a API processou o áudio, mas não foi possível transcrevê-lo. As solicitações que resultam em um erro do servidor não contam como processadas com êxito e, portanto, não geram custo.
Para ver o status atualizado da sua fatura, incluindo a utilização e a fatura atual, acesse o console do Google Cloud. Para mais informações sobre o gerenciamento da sua conta, consulte a documentação de faturamento do Cloud ou o suporte de faturamento e pagamentos.
Tabela de preços
Os preços na tabela abaixo se aplicam a minutos de áudio processados por mês para a API Speech-to-Text V1.
Categoria | Modelos | Preços | |
---|---|---|---|
0 a 60 minutos/mês | Mais de 60 minutos/mês | ||
Reconhecimento de fala (sem geração de registros de dados, padrão) | Padrão 1 | Grátis | US$ 0,024 / minuto ** |
Médico2 | Grátis | US$ 0,078 / minuto ** | |
Reconhecimento de fala (com ativação da geração de registros de dados) | Padrão 1 | Grátis | US$ 0,016 / minuto ** |
Os preços na tabela abaixo se aplicam a minutos de áudio processados por mês para a API Speech-to-Text V2.
Categoria | Modelos | Preços | |||
---|---|---|---|---|---|
0 a 500.000 minutos / mês | 500.000 a 1.000.000 minutos / mês | 1.000.000 a 2.000.000 minutos / mês | Mais de 2 milhões de minutos / mês | ||
Reconhecimento de fala (padrão) | Padrão 1 | US$ 0,016 / minuto ** | US$ 0,010 / minuto ** | US$ 0,008 / minuto ** | US$ 0,004 / minuto ** |
Médico2 | US$ 0,078 / minuto ** | US$ 0,078 / minuto ** | US$ 0,078 / minuto ** | US$ 0,078 / minuto ** | |
Reconhecimento de fala dinâmico em lote | Padrão 1 | US$ 0,003 / minuto ** | US$ 0,003 / minuto ** | US$ 0,003 / minuto ** | US$ 0,003 / minuto ** |
Os modelos Standard1 incluem: default
, command_and_search
, latest_short
, latest_long
, phone_call
, video
, chirp
(somente Speech-to-Text V2).
Os modelos do Medicina2 incluem: medical_conversation
, medical_dictation
.
** Cada solicitação é arredondada para o incremento mais próximo de 1 segundo.
Fatores dos preços
O preço da API Speech-to-Text é determinado pelos seguintes fatores:
* O número de canais sendo reconhecidos no áudio. * A duração e a quantidade de áudio que você envia. * O modelo de reconhecimento que você está usando. * O método de lote que você está usando. * A versão da API que você está usando.
Vários canais
Cada canal de áudio é faturado separadamente. Se você enviar solicitações com vários canais, a cobrança será feita de acordo com a soma total da duração dos áudios processados de todos os canais. A contagem de tempo é diferente do controle de limites de uso mensal. Os limites de uso são determinados somente pela duração do arquivo de áudio e não contam os vários canais. Por exemplo, ao enviar uma solicitação de 30 segundos de áudio e 4 canais, 120 segundos serão cobrados, mas somente 30 serão contabilizados na sua cota mensal. Veja mais detalhes na página cotas e limites.
Lote dinâmico
A API Speech-to-Text V2 tem uma opção para usar lote dinâmico. O lote dinâmico processa áudio em um nível de urgência mais baixo. Se você ativar o lote dinâmico, será cobrado uma taxa com desconto.
Grandes cargas de trabalho
Para clientes com cargas de trabalho muito grandes, descontos por volume adicionais podem estar disponíveis. Entre em contato com a equipe de vendas para saber mais.
Custos do Google Cloud Platform
Alguns serviços adicionais também são pagos, como o armazenamento de arquivos de áudio para reconhecimento no Google Cloud Storage ou o uso de outros recursos do GCP em conjunto com a Speech-to-Text (como as instâncias do Google App Engine). Consulte a calculadora de preços do Google Cloud Platform para determinar outros custos com base nos valores atuais.
A seguir
- Leia a documentação do Speech-to-Text.
- Primeiros passos com o Speech-to-Text.
- Use a calculadora de preços.
- Saiba mais sobre as soluções e casos de uso do Speech-to-Text.