エージェントには、動作に影響する多くの設定があります。コンソールごとに設定が異なります。
会話エージェント コンソールのエージェント設定
エージェントの構成にアクセスするには、以下の手順に従います。
コンソール
- 会話型エージェント コンソールを開きます。
- Google Cloud プロジェクトを選択します。
- エージェントを選択します。
- 右上の設定アイコンをクリックします。
- 必要に応じて設定を更新します。
- [保存] をクリックします。
API
Agent
型の get
メソッドと patch/update
メソッドをご覧ください。
エージェント リファレンスのプロトコルとバージョンを選択:
プロトコル | V3 | V3beta1 |
---|---|---|
REST | エージェント リソース | エージェント リソース |
RPC | エージェント インターフェース | エージェント インターフェース |
C++ | AgentsClient | 利用できません |
C# | AgentsClient | 利用できません |
Go | AgentsClient | 利用できません |
Java | AgentsClient | AgentsClient |
Node.js | AgentsClient | AgentsClient |
PHP | 利用不可 | 利用できません |
Python | AgentsClient | AgentsClient |
Ruby | 利用不可 | 利用できません |
以下では、エージェント設定の各カテゴリについて説明します。
全般設定
エージェントでは次の全般設定を使用できます。
-
人間が読み取れる形式のエージェントの名前。
-
エージェントのデフォルトのタイムゾーン。
-
この設定により、エージェントが生成ハンドブックまたは確定フローを使用して会話を開始するかどうかが決まります。
-
エージェントの作成時に選択したエージェント リージョン。
-
エージェントをロックする
エージェントがロックされているかどうかを示します。ロックされたエージェントは編集できません。
-
Cloud Logging を有効にする
エージェントで Cloud Logging が有効になっているかどうかを示します。
会話履歴を有効にする
品質向上のために秘匿化済みエンドユーザー クエリを収集して保存するかどうかを指定します。
同意に基づくエンドユーザー入力の秘匿化を有効にする
この設定を有効にすると、特別なセッション パラメータを使用して、会話履歴と Cloud Loggingからのエンドユーザー入力とパラメータを秘匿化するかどうかを制御できます。デフォルトでは、セッション パラメータは
true
です。この設定が無効になっている場合、秘匿化は行われません。ユーザーの同意は、ブール値のセッション パラメータ
$session.params.conversation-redaction
を使用して収集されます。この設定が有効になっていて、セッション パラメータがfalse
に設定されている場合、秘匿化は行われません(他の秘匿化戦略は引き続き適用されます)。この設定が有効になっていて、セッション パラメータがtrue
に設定されている場合、秘匿化は行われます。同意を求める流れの例を挙げると、まずエンドユーザー入力を保持するかどうかをユーザーに尋ねて、そのレスポンスを 2 つのインテントと照合します。1 つ目は「はいのインテント」、もう 1 つは「いいえのインテント」です。次に、フルフィルメントの「はいのインテント」のルートにあるパラメータ プリセットで、セッション パラメータを
false
(秘匿化しない)に設定します。また、「いいえのインテント」のルートにあるパラメータ プリセットで、セッション パラメータをtrue
(秘匿化する)に設定します。
-
BigQuery エクスポートを有効にする
BigQuery Export が有効になっているかどうかを示します。
BigQuery データセット
BigQuery データセット名。
BigQuery テーブル
BigQuery テーブル名。
-
インテントの候補を有効にできます。
-
この設定を有効にすると、エージェントの回答の質に関するフィードバック(高評価/低評価など)を提供できます。
-
この設定を使用して、Git インテグレーションを追加します。
生成 AI の設定
次の生成 AI 設定が利用できます。
全般
-
生成機能で使用するモデルを選択します。詳細については、モデルのバージョンをご覧ください。
トークンの上限
-
生成モデルの入力トークン上限を選択します。これは、モデルに送信される入力のトークンの最大サイズです。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークン数の上限が小さいほどレイテンシは低くなりますが、モデル入力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデル入力サイズを大きくできます。
-
生成モデルの出力トークンの上限を選択します。これは、モデルから受信する出力の最大トークンサイズです。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークン数の上限が小さいほどレイテンシは低くなりますが、モデルの出力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデルの出力サイズは大きくなります。
-
-
LLM の温度により、回答の創造性を制御できます。値が小さいほど、より予測可能なレスポンスが返されます。値が大きいほど、より創造的なレスポンスまたはランダムなレスポンスが返されます。
-
この設定では、エージェントが処理する連続したターンごとにプロンプトのサイズが大きくなるのを防ぐため、LLM プロンプトから過去のターンが削除されます。この機能を使用すると、不要なプロンプトサイズの増加を軽減できます。
通常、切り捨てなしの場合、後続の各ターンは、現在のターンに関連しているかどうかに関係なく、LLM プロンプトの「会話履歴」に追加されます。これにより、最終的にはターンごとにプロンプトのサイズが大きくなる可能性があります。会話履歴によってプロンプトの使用量が増えると、少数ショットのサンプルに使用できるプロンプトの量が減ります(そのため、少数ショットのサンプルが破棄される可能性があります)。最終的には、プロンプトが現在のトークン上限を超える可能性があります。これに応じてトークンサイズを増やすことはできますが、プロンプトサイズの増加は LLM レスポンスのレイテンシの増加にもつながることを念頭に置いてください。
コンテキストの切り捨てでは、会話履歴に予約するトークン バジェットの割合を最大値として設定できます。会話のターンは、最新の順に保存されます。この設定により、トークンの上限を超えないようにできます。どの設定を選択しても、少なくとも 2 つの会話ターンが最新から古い順に保持されます。
この設定を変更するには、まずトークンの上限を設定する必要があります。
コンテキストを切り捨てると、除外されたターンの一部であるパラメータが誤って失われる可能性があります。このオプションを有効にした後、Playbook のインタラクションを慎重に評価してください。
トークン入力予算は、次のものでも使用されます。
- システムの指示と例: プロンプトに自動的に追加されます。この動作は変更できません。
- ハンドブックの手順と目標: 作成した手順と目標はすべてプロンプトに追加されます。
- Playbook の少数ショットの例: 順番に追加されます(デフォルト)。または、選択したアルゴリズム(正規表現の最適な一致順序など)によって追加されます。他のすべてのアイテムが追加された後、入力トークン バジェット内に収まるように例が除外されます。
- ユーザーとエージェントの発話、フローおよびプレイブックの遷移コンテキスト、現在のプレイブックで順番に処理されたすべての前のターンの同じセッション内のツール呼び出しと出力で構成される会話履歴。
-
生成 AI で禁止されているフレーズのリスト。禁止されたフレーズがプロンプトまたは生成されたレスポンスにある場合、生成は失敗します。禁止されているフレーズリストは、すべてのクエリと LLM 呼び出しに影響し、レイテンシが増加します。
-
責任ある AI(RAI)の各カテゴリに対して安全フィルタの感度レベルを構成します。コンテンツは、次の 4 つのカテゴリで評価されます。
カテゴリ 説明 ヘイトスピーチ ID や保護されている属性をターゲットとする否定的なコメントや有害なコメント。 危険なコンテンツ 有害な商品、サービス、アクティビティへのアクセスを促進または可能にする 性的描写が露骨なコンテンツ 性行為やわいせつな内容に関する情報が含まれるコンテンツ 嫌がらせ 他人をターゲットにした悪口、威圧表現、いじめ、虐待的な内容を含むコメント コンテンツは有害である可能性に基づいてブロックされます。 各カテゴリの感度レベルは、[少量をブロック]、[一部をブロック]、[ほとんどをブロック] のいずれかを選択してカスタマイズできます。また、プロジェクトのリスク認識リクエストを送信して承認を受けた後、カテゴリの RAI チェックを無効にする [Block none] 制限付きオプションにアクセスすることもできます。
詳細については、安全性属性を構成するをご覧ください。
-
[enable prompt security check] 設定をオンにすると、プロンプトによるセキュリティ チェックを有効にできます。有効にすると、エージェントはプロンプト インジェクション攻撃を防ぐよう試みます。これらの攻撃は、エージェント プロンプトの一部を明らかにしたり、エージェントが提供すべきでないレスポンスを提供したりするために使用される場合があります。これは、ユーザーのクエリが悪意のあるものであるかどうかを確認する追加の LLM プロンプトを送信することで実現されます。
生成フォールバック
-
生成フォールバック: 独自のプロンプトを定義するをご覧ください。
-
-
データストア
データストア エージェントの設定をご覧ください。
決定論的フロー
これらの設定は、フローごとに適用される ML 設定を除き、このエージェントのすべてのフローに適用されます。他のフロー固有の設定を編集するには、コンソールでフローを見つけて、そこで設定を編集します。
インテント トレーニング
Flows は、機械学習(ML)アルゴリズムを使用して、エンドユーザー入力を理解し、インテントと照合して、構造化データを抽出します。フローでは、ユーザーが提供するトレーニング フレーズと、フローに組み込まれた言語モデルから学習します。このデータに基づいて、エンドユーザー入力と照合するインテントを決定するモデルを構築します。エージェントのフローごとに一意の ML 設定を適用できます。
次のインテント トレーニング設定を使用できます。
-
これを有効にすると、エンドユーザーの入力にスペルミスや文法ミスがあっても、入力が正しく記述されているものとしてインテントと照合されます。インテント検出レスポンスには、修正済みのエンドユーザー入力が含まれます。たとえば、エンドユーザーが「I want an applle」と入力した場合、「I want an apple」と入力したかのように処理されます。これは、システム エンティティとカスタム エンティティの両方を含むマッチングにも当てはまります。
スペル修正は、英語、フランス語、ドイツ語、スペイン語、イタリア語で利用できます。すべての会話エージェント(Dialogflow CX)のリージョンで利用できます。
警告とおすすめの方法:
フロー固有の ML 設定
-
次のいずれかになります。
- 高度な NLU(デフォルト): 高度な NLU 技術。この NLU タイプは、特に大規模なエージェントとフローでは標準より優れています。
- 標準 NLU: 標準的な NLU 技術。今後、品質の改善や新機能は提供されなくなります。
-
有効にすると、フローがコンソールで更新されるたびにトレーニングされます。フローが大きい場合、コンソール UI の遅延の原因となることがあります。その場合はこの設定を無効にし、必要に応じて大規模なフロー用に手動でトレーニングする必要があります。
-
結果から偽陽性を除外した後でも、多様な自然言語入力との一致に基づいてエージェントが応答できるように、ML の分類しきい値を調整できます。この設定は、インテントの一致に必要なインテント検出の信頼度を制御します。
インテント一致の信頼スコアがしきい値より小さい場合は、no-match イベントが呼び出されます。
エージェントで有効になっている各言語のフローごとに、個別の分類しきい値を設定できます。これは、さまざまな分類しきい値で最高のパフォーマンスを発揮するさまざまな言語に対応するためです。多言語エージェントの作成の詳細については、多言語エージェントに関するドキュメントをご覧ください。
-
フローデータの最新更新以降にフローがトレーニングされたかどうかを示します。
-
フローを手動でトレーニングする場合は、このボタンを使用します。
-
-
エージェントがサポートする言語。エージェントの作成後に、デフォルトの言語を変更することはできません。ただし、次のことはできます。
- エージェントを JSON 形式にエクスポートします。
- ダウンロードしたファイルを展開します。
agent.json
ファイルを見つけます。defaultLanguageCode
フィールドとsupportedLanguageCodes
フィールドを必要な値に更新します。- ステップ 1 と同じエージェントまたは別のエージェントにエージェントを復元します。
- 必要に応じて、言語固有のトレーニング フレーズとエンティティ値を更新します。
言語の自動検出と切り替えを有効にすることもできます。
-
接続
-
このセクションでは、カスタム ペイロード テンプレートの説明とペイロードを作成できます。
-
セッション パラメータのどのパラメータを Webhook に送信するか、Webhook のレスポンスによって設定できるセッション パラメータはどれかを明記します。
-
SSL 証明書のアップロードに使用されます。
音声と IVR
音声オプション
-
-
音声合成に使用する言語と音声を選択できます。
音声選択ドロップボックスからカスタム音声オプションを選択し、対応するフィールドにカスタム音声名を指定することで、エージェントのカスタム音声を有効にできます。カスタム音声名は、
projects/PROJECT_ID/locations/LOCATION/models/MODEL_NAME
のパターンに従う必要があります。- テレフォニー ゲートウェイを使用している場合は、Dialogflow サービス エージェントのサービス アカウント
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com
にカスタム音声プロジェクトにおける「AutoML Predictor」が付与されていることを確認します。 - 通常の API 呼び出しの場合は、会話エージェント(Dialogflow CX)の呼び出しに使用するサービス アカウントに、カスタム音声プロジェクトにおける「AutoML Predictor」ロールが付与されていることを確認します。
- テレフォニー ゲートウェイを使用している場合は、Dialogflow サービス エージェントのサービス アカウント
-
-
-
自動音声適応をご覧ください。
-
高度な音声オプションの詳細については、高度な音声設定ガイドをご覧ください。
-
詳しくは、テレフォニー統合用の DTMF をご覧ください。
-
手動による音声適応をご覧ください。
-
-
通話コンパニオン
コンパニオンの呼び出しをご覧ください。
UI 設定
これらの設定を使用して、Messenger と通話コンパニオンのユーザー インターフェースをカスタマイズできます。
セキュリティ
セキュリティ設定をご覧ください。
Dialogflow CX コンソールのエージェント設定
エージェントの構成にアクセスするには、以下の手順に従います。
コンソール
- Dialogflow CX コンソールを開きます。
- Google Cloud プロジェクトを選択します。
- エージェントを選択します。
- [エージェント設定] をクリックします。
- 必要に応じて設定を更新します。
- [保存] をクリックします。
API
Agent
型の get
メソッドと patch/update
メソッドをご覧ください。
エージェント リファレンスのプロトコルとバージョンを選択:
プロトコル | V3 | V3beta1 |
---|---|---|
REST | エージェント リソース | エージェント リソース |
RPC | エージェント インターフェース | エージェント インターフェース |
C++ | AgentsClient | 利用できません |
C# | AgentsClient | 利用できません |
Go | AgentsClient | 利用できません |
Java | AgentsClient | AgentsClient |
Node.js | AgentsClient | AgentsClient |
PHP | 利用不可 | 利用できません |
Python | AgentsClient | AgentsClient |
Ruby | 利用不可 | 利用できません |
以下では、エージェント設定の各カテゴリについて説明します。
全般設定
エージェントでは次の全般設定を使用できます。
表示名
人間が読み取れる形式のエージェントの名前。
タイムゾーン
エージェントのデフォルトのタイムゾーン。
デフォルトの言語
エージェントがサポートするデフォルトの言語。 エージェントの作成後に、デフォルトの言語を変更することはできません。ただし、次のことはできます。
エージェントのロック
エージェントをロックする
エージェントがロックされているかどうかを示します。ロックされたエージェントは編集できません。
ロギングの設定
Cloud Logging を有効にする
エージェントで Cloud Logging が有効になっているかどうかを示します。
インタラクションのロギングを有効にする
品質向上のために秘匿化済みエンドユーザー クエリを収集して保存するかどうかを指定します。
同意に基づくエンドユーザー入力の秘匿化を有効にする
この設定を有効にすると、特別なセッション パラメータを使用して、会話履歴と Cloud Loggingからのエンドユーザー入力とパラメータを秘匿化するかどうかを制御できます。デフォルトでは、セッション パラメータは
true
です。この設定が無効になっている場合、秘匿化は行われません。ユーザーの同意は、ブール値のセッション パラメータ
$session.params.conversation-redaction
を使用して収集されます。この設定が有効になっていて、セッション パラメータがfalse
に設定されている場合、秘匿化は行われません(他の秘匿化戦略は引き続き適用されます)。この設定が有効になっていて、セッション パラメータがtrue
に設定されている場合、秘匿化は行われます。同意を求める流れの例を挙げると、まずエンドユーザー入力を保持するかどうかをユーザーに尋ねて、そのレスポンスを 2 つのインテントと照合します。1 つ目は「はいのインテント」、もう 1 つは「いいえのインテント」です。次に、フルフィルメントの「はいのインテント」のルートにあるパラメータ プリセットで、セッション パラメータを
false
(秘匿化しない)に設定します。また、「いいえのインテント」のルートにあるパラメータ プリセットで、セッション パラメータをtrue
(秘匿化する)に設定します。
BigQuery Export
BigQuery エクスポートを有効にする
BigQuery Export が有効になっているかどうかを示します。
BigQuery データセット
BigQuery データセット名。
BigQuery テーブル
BigQuery テーブル名。
インテントの候補
インテントの候補を有効にできます。
カスタム ペイロード テンプレート
このセクションでは、カスタム ペイロード テンプレートの説明とペイロードを作成できます。
ML の設定
会話エージェント(Dialogflow CX)は、機械学習(ML)アルゴリズムを使用して、エンドユーザー入力を理解し、インテントと照合して、構造化データを抽出します。会話エージェント(Dialogflow CX)は、ユーザーが提供するトレーニング フレーズと、会話エージェント(Dialogflow CX)に組み込まれた言語モデルから学習します。このデータに基づいて、エンドユーザー入力と照合するインテントを決定するモデルを構築します。エージェントのフローごとに一意の ML 設定を適用できます。会話エージェント(Dialogflow CX)によって作成されたモデルは、フローごとに一意です。
次のエージェント全体の ML 設定が使用できます。
ML にスペルの修正を許可する
これを有効にすると、エンドユーザーの入力にスペルミスや文法ミスがあっても、入力が正しく記述されているものとしてインテントと照合されます。インテント検出レスポンスには、修正済みのエンドユーザー入力が含まれます。たとえば、エンドユーザーが「I want an applle」と入力した場合、「I want an apple」と入力したかのように処理されます。これは、システム エンティティとカスタム エンティティの両方を含むマッチングにも当てはまります。
スペル修正は、英語、フランス語、ドイツ語、スペイン語、イタリア語で利用できます。すべての会話エージェント(Dialogflow CX)のリージョンで利用できます。
警告とおすすめの方法:
次のフロー固有の ML 設定が利用できます。
NLU タイプ
次のいずれかになります。
- 高度な NLU(デフォルト): 高度な NLU 技術。この NLU タイプは、特に大規模なエージェントとフローでは標準より優れています。
- 標準 NLU: 標準的な NLU 技術。今後、品質の改善や新機能は提供されなくなります。
自動トレーニング
有効にすると、フローがコンソールで更新されるたびにトレーニングされます。フローが大きい場合、コンソール UI の遅延の原因となることがあります。その場合はこの設定を無効にし、必要に応じて大規模なフロー用に手動でトレーニングする必要があります。
分類しきい値
結果から偽陽性を除外した後でも、多様な自然言語入力との一致に基づいてエージェントが応答できるように、ML の分類しきい値を調整できます。この設定は、インテントの一致に必要なインテント検出の信頼度を制御します。
インテント一致の信頼スコアがしきい値より小さい場合は、no-match イベントが呼び出されます。
エージェントで有効になっている各言語のフローごとに、個別の分類しきい値を設定できます。これは、さまざまな分類しきい値で最高のパフォーマンスを発揮するさまざまな言語に対応するためです。多言語エージェントの作成の詳細については、多言語エージェントに関するドキュメントをご覧ください。
トレーニングのステータス
フローデータの最新更新以降にフローがトレーニングされたかどうかを示します。
NLU のトレーニング
フローを手動でトレーニングする場合は、このボタンを使用します。
生成 AI の設定
次の生成 AI 設定が利用できます。
全般
禁止フレーズ
生成 AI で禁止されているフレーズのリスト。禁止されたフレーズがプロンプトまたは生成されたレスポンスにある場合、生成は失敗します。
安全フィルタ
責任ある AI(RAI)の各カテゴリに対して安全フィルタの感度レベルを構成します。コンテンツは、次の 4 つのカテゴリで評価されます。
カテゴリ 説明 ヘイトスピーチ ID や保護されている属性をターゲットとする否定的なコメントや有害なコメント。 危険なコンテンツ 有害な商品、サービス、アクティビティへのアクセスを促進または可能にする 性的描写が露骨なコンテンツ 性行為やわいせつな内容に関する情報が含まれるコンテンツ 嫌がらせ 他人をターゲットにした悪口、威圧表現、いじめ、虐待的な内容を含むコメント コンテンツは有害である可能性に基づいてブロックされます。 各カテゴリの感度レベルは、[少量をブロック]、[一部をブロック]、[ほとんどをブロック] のいずれかを選択してカスタマイズできます。また、プロジェクトのリスク認識リクエストを送信して承認を受けた後、カテゴリの RAI チェックを無効にする [Block none] 制限付きオプションにアクセスすることもできます。
詳細については、安全性属性を構成するをご覧ください。
プロンプトのセキュリティ
[enable prompt security check] 設定をオンにすると、プロンプトによるセキュリティ チェックを有効にできます。有効にすると、エージェントはプロンプト インジェクション攻撃を防ぐよう試みます。これらの攻撃は、エージェント プロンプトの一部を明らかにしたり、エージェントが提供すべきでないレスポンスを提供したりするために使用される場合があります。これは、ユーザーのクエリが悪意のあるものであるかどうかを確認する追加の LLM プロンプトを送信することで実現されます。
生成エージェント
生成モデルの選択
生成機能で使用するモデルを選択します。詳細については、モデルのバージョンをご覧ください。
Playbook コンテキストの切り捨て
Playbook コンテキストの切り捨て: Playbook プロンプトから過去のターンを削除して、Playbook によって処理される連続ターンごとにプロンプトのサイズが大きくなるのを防ぎます。この機能を使用すると、不要なプロンプトサイズの増加を軽減できます。
通常、切り捨てなしの場合、後続の各ターンは、現在のターンに関連しているかどうかに関係なく、LLM プロンプトの「会話履歴」に追加されます。これにより、最終的にはターンごとにプロンプトのサイズが大きくなる可能性があります。会話履歴によってプロンプトの使用量が増えると、少数ショットのサンプルに使用できるプロンプトの量が減ります(そのため、少数ショットのサンプルが破棄される可能性があります)。最終的には、プロンプトが現在のトークン上限を超える可能性があります。これに応じてトークンサイズを増やすことはできますが、プロンプトサイズの増加は LLM レスポンスのレイテンシの増加にもつながることを念頭に置いてください。
Playbook コンテキストの切り捨てでは、会話履歴に予約するトークン バジェットの割合を最大値として設定できます。会話のターンは、最新の順に保存されます。この設定により、トークンの上限を超えないようにできます。どの設定を選択しても、少なくとも 2 つの会話ターンが最新から古い順に保持されます。
この設定を変更するには、まずトークン数の上限を設定する必要があります。
重要: コンテキストを切り捨てると、除外されたターンの一部であるパラメータが誤って失われる可能性があります。このオプションを有効にした後、Playbook のインタラクションを慎重に評価してください。
トークン入力予算は、次のものでも使用されます。
- システムの指示と例: プロンプトに自動的に追加されます。この動作は変更できません。
- ハンドブックの手順と目標: 作成した手順と目標はすべてプロンプトに追加されます。
- Playbook の少数ショットの例: 順番に追加されます(デフォルト)。または、選択したアルゴリズム(正規表現の最適な一致順序など)によって追加されます。他のすべてのアイテムが追加された後、入力トークン バジェット内に収まるように例が除外されます。
- ユーザーとエージェントの発話、フローおよびプレイブックの遷移コンテキスト、現在のプレイブックで順番に処理されたすべての前のターンの同じセッション内のツール呼び出しと出力で構成される会話履歴。
生成フォールバック
テキスト プロンプトの構成
生成フォールバック: 独自のプロンプトを定義するをご覧ください。
データストア
データストア エージェントの設定をご覧ください。
音声と IVR の設定
次の音声と IVR の設定を使用できます。
Text-to-Speech
音声の選択
音声合成に使用する言語と音声を選択できます。
音声選択ドロップボックスからカスタム音声オプションを選択し、対応するフィールドにカスタム音声名を指定することで、エージェントのカスタム音声を有効にできます。カスタム音声名は、
projects/PROJECT_ID/locations/LOCATION/models/MODEL_NAME
のパターンに従う必要があります。- テレフォニー ゲートウェイを使用している場合は、Dialogflow サービス エージェントのサービス アカウント
service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com
にカスタム音声プロジェクトにおける「AutoML Predictor」が付与されていることを確認します。 - 通常の API 呼び出しの場合は、会話エージェント(Dialogflow CX)の呼び出しに使用するサービス アカウントに、カスタム音声プロジェクトにおける「AutoML Predictor」ロールが付与されていることを確認します。
- テレフォニー ゲートウェイを使用している場合は、Dialogflow サービス エージェントのサービス アカウント
Speech-to-Text
DTMF
詳しくは、テレフォニー統合用の DTMF をご覧ください。
マルチモーダル
コンパニオンの呼び出しをご覧ください。
共有設定
アクセス制御をご覧ください。
言語設定
エージェントに追加の言語サポートを追加します。全言語の一覧については、言語リファレンスをご覧ください。
言語の自動検出
言語の自動検出を構成すると、チャット エージェントはエンドユーザーの言語を自動的に検出してその言語に切り替わります。詳細については、言語の自動検出のドキュメントをご覧ください。
セキュリティ設定
セキュリティ設定をご覧ください。
詳細設定
現在、詳細設定は感情分析でのみ利用できます。
AI アプリケーション コンソールの設定
このセクションでは、エージェント アプリで使用できる設定について説明します。
全般
エージェント アプリでは、次の全般設定を使用できます。
表示名
人間が読み取れる形式のエージェントアプリの名前。
ロケーション
エージェント アプリのリージョン。
アプリのロック
有効にすると、エージェント アプリへの変更は許可されません。
ロギング
エージェント アプリでは、次のロギング設定を使用できます。
Cloud Logging を有効にする
有効にすると、ログは Cloud Logging に送信されます。
会話履歴を有効にする
有効にすると、会話履歴が利用可能になります。品質向上のために秘匿化済みエンドユーザー クエリを収集して保存するかどうかを指定します。この設定は、会話履歴がエージェント レスポンスを生成するために使用されるかどうかには影響しません。
BigQuery Export を有効にする
有効にすると、会話履歴が BigQuery にエクスポートされます。[会話履歴を有効にする] の設定も有効にする必要があります。
生成 AI
エージェント アプリでは、次の生成 AI 設定を使用できます。
生成モデルの選択
エージェントがデフォルトで使用する生成モデルを選択します。
入力トークンの上限
生成モデルの入力トークン上限を選択します。これは、モデルに送信される入力のトークンの最大サイズです。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークンの上限が小さいほどレイテンシは低くなりますが、モデル入力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデル入力サイズを大きくできます。
出力トークンの上限
生成モデルの出力トークンの上限を選択します。これは、モデルから受信する出力の最大トークンサイズです。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークン数の上限が小さいほどレイテンシは低くなりますが、モデルの出力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデルの出力サイズは大きくなります。
温度
LLM の温度により、回答の創造性を制御できます。値が小さいほど、より予測可能なレスポンスが返されます。値が大きいほど、より創造的なレスポンスまたはランダムなレスポンスが返されます。
禁止フレーズ
生成 AI で禁止されているフレーズのリスト。禁止されたフレーズがプロンプトまたは生成されたレスポンスにある場合、エージェントは代わりに代替レスポンスを返します。
安全フィルタ
責任ある AI(RAI)の各カテゴリに対して安全フィルタの感度レベルを構成します。コンテンツは、次の 4 つのカテゴリで評価されます。
カテゴリ 説明 ヘイトスピーチ ID や保護されている属性をターゲットとする否定的なコメントや有害なコメント。 危険なコンテンツ 有害な商品、サービス、アクティビティへのアクセスを促進または可能にする 性的描写が露骨なコンテンツ 性行為やわいせつな内容に関する情報が含まれるコンテンツ 嫌がらせ 他人をターゲットにした悪口、威圧表現、いじめ、虐待的な内容を含むコメント コンテンツは有害である可能性に基づいてブロックされます。 各カテゴリの感度レベルは、[少量をブロック](有害なコンテンツの確率が高いインスタンスのみをブロック)、[一部をブロック](確率が中程度または高いインスタンス)、[ほとんどをブロック](確率が低い、中程度、高い)のいずれかを選択してカスタマイズできます。また、プロジェクトのリスク認識リクエストを送信して承認を受けた後、カテゴリの RAI チェックを無効にする [Block none] 制限付きオプションにアクセスすることもできます。
詳細については、安全性属性を構成するをご覧ください。
プロンプトのセキュリティ
[enable prompt security check] 設定をオンにすると、プロンプトによるセキュリティ チェックを有効にできます。有効にすると、エージェントはプロンプト インジェクション攻撃を防ぐよう試みます。これらの攻撃は、エージェント プロンプトの一部を明らかにしたり、エージェントが提供すべきでないレスポンスを提供したりするために使用される場合があります。これは、ユーザーのクエリが悪意のあるものであるかどうかを確認する追加の LLM プロンプトを送信することで実現されます。
Git
これらの設定により、Git の統合が実現します。手順に沿ってインテグレーションを構成します。