Os agentes de voz do Dialogflow usam o Speech-to-Text para o reconhecimento de voz, que está incluído nos preços do Dialogflow. O Dialogflow seleciona automaticamente um modelo de reconhecimento de voz para si, mas pode especificar o modelo opcionalmente.
Modelos disponíveis
Todos os modelos disponíveis estão listados em Modelos de conversão de voz em texto. Selecione um modelo mais adequado ao seu domínio e que suporte o idioma do agente e as funcionalidades de voz.
Se um modelo não for especificado explicitamente, o Dialogflow seleciona automaticamente um modelo com base na configuração de áudio nos pedidos da API e nas definições do agente.
Normalmente, os seguintes modelos têm o melhor desempenho:
- telefonia_short (melhor para o Dialogflow de telefonia)
 - telefonia (melhor para o Agent Assist) (também bom para o Dialogflow de telefonia quando a sensibilidade avançada de fim de discurso baseada em tempo limite está ativada)
 - phone_call (adequado para o Agent Assist e o Dialogflow de telefonia)
 - latest_short (melhor para o Dialogflow não telefónico)
 - command_and_search (ideal para idiomas em que outros modelos não estão disponíveis)
 
Especificar um modelo
Pode fornecer o modelo para um agente, um fluxo ou uma página com a definição de seleção de modelos.Também pode fornecer o modelo quando chamar os métodos Sessions.detectIntent ou Sessions.streamingDetectIntent;
Selecione um protocolo e uma versão para a referência da sessão:
| Protocolo | V3 | V3beta1 | 
|---|---|---|
| REST | Recurso de sessão | Recurso de sessão | 
| RPC | Interface de sessão | Interface de sessão | 
| C++ | SessionsClient | Não disponível | 
| C# | SessionsClient | Não disponível | 
| Ir | SessionsClient | Não disponível | 
| Java | SessionsClient | SessionsClient | 
| Node.js | SessionsClient | SessionsClient | 
| PHP | Não disponível | Não disponível | 
| Python | SessionsClient | SessionsClient | 
| Ruby | Não disponível | Não disponível | 
ConversationProfile
para o
Agent Assist.
A especificação do modelo numa chamada API de intenção de deteção ou perfil de conversa
substitui todas as seleções de modelos aplicadas ao agente, fluxo ou página, a menos que
ative a definição Substituir modelo de voz ao nível do pedido.