Dialogflow 音声エージェントは、音声認識に Dialogflow の料金に含まれている Speech-to-Text を使用します。Dialogflow によって自動的に音声認識モデルが選択されますが、必要に応じてモデルを指定することもできます。
使用可能なモデル
使用可能なすべてのモデルは、Speech-to-Text モデルに記載されています。ドメインに最適で、エージェントの言語と音声機能をサポートするモデルを選択します。
モデルが明示的に指定されていない場合、Dialogflow は API リクエストとエージェントの設定の音声構成に基づいてモデルを自動的に選択します。
通常、次のモデルが最適なパフォーマンスを発揮します。
- telephony_short(テレフォニー Dialogflow に最適)
- telephony(Agent Assist に最適) (高度なタイムアウト ベースの音声終了の感度が有効になっている場合は、テレフォニー Dialogflow にも適しています)
- phone_call(Agent Assist とテレフォニー Dialogflow に推奨)
- latest_short(テレフォニー以外の Dialogflow に最適)
- command_and_search(他のモデルを使用できない言語に最適)
モデルを指定する
エージェント、フロー、ページのモデルは、モデル選択設定で指定できます。Sessions.detectIntent
メソッドまたは Sessions.streamingDetectIntent
メソッドを呼び出すときにモデルを指定することもできます。
セッション リファレンスのプロトコルとバージョンを選択:
プロトコル | V3 | V3beta1 |
---|---|---|
REST | セッション リソース | セッション リソース |
RPC | セッション インターフェース | セッション インターフェース |
C++ | SessionsClient | 利用できません |
C# | SessionsClient | 利用できません |
Go | SessionsClient | 利用できません |
Java | SessionsClient | SessionsClient |
Node.js | SessionsClient | SessionsClient |
PHP | 利用不可 | 利用できません |
Python | SessionsClient | SessionsClient |
Ruby | 利用不可 | 利用できません |
ConversationProfile
を構成する場合。リクエスト レベルの音声モデルをオーバーライドする 設定を有効にしない限り、インテント検出または会話プロファイル API 呼び出しでモデルを指定すると、エージェント、フロー、ページに適用されたモデルの選択がオーバーライドされます。