このドキュメントでは、Dialogflow の使用に関する一般的な割り当てと上限について説明します。割り当てと上限の完全なリストを確認する方法については、以下をご覧ください。Google は、このような制限事項を変更できる権限を有し、このページにもその変更が反映されます。
割り当て
割り当ては、プロジェクトに適用されるデフォルトの制約です。生成機能を使用する場合、モデルとリージョンの組み合わせごとに独自の生成割り当てがあります。有料のエディションを使用している場合は、割り当ての引き上げをリクエストできます。割り当ての目的は、クライアントごとのサービスの負荷を調整することで、これによりサービスが過負荷になるのを防ぎ、予想外のリソースの使用からクライアントを保護します。
Dialogflow の割り当ては、エージェントのエディションによって異なります。割り当てはプロジェクトごとに適用され、プロジェクトを使用するすべてのアプリケーションと IP アドレス間で共有されます。
割り当ての時間境界の詳細:
- 月ごとの割り当ては、毎月 1 日の 12:00(太平洋時間)に補充されます。
- 1 日あたりの割り当ては、毎日午前 0 時(太平洋時間)に補充されます。太平洋時間の夏時間への移行が 1 日の長さを超えると、比例した割り当てボーナスが付与されます。ただし、夏時間への移行により、1 日が短くなっても、それに相当する差し引きはありません。
- 分単位の割り当ては、分に対して60 秒ごとにリセットされます。
割り当ての表に記載されている割り当ては、通常使用される割り当てです。すべての割り当てを確認するには、Google Cloud コンソール Dialogflow の割り当てページをご覧ください。
生成割り当て
エージェントが会話エージェント(Dialogflow CX)の生成機能を使用する場合、モデルとリージョンの組み合わせごとに一意の割り当てがあります。
割り当て識別子
ConversationalAgentLlmTokenConsumption 割り当ては、会話エージェント(Dialogflow CX)の大規模言語モデル(LLM)のトークン使用量を追跡するリージョン割り当てです。この割り当ては、さまざまな LLM ベースモデルで測定されます。現在、次のモデルがサポートされています。
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
ConversationalAgentLlmTokenConsumption 割り当ては、次の会話エージェント(Dialogflow CX)機能での LLM トークンの使用状況を追跡します。
- 生成ツール
- 生成的フォールバック
- ハンドブック
- Datastore
ConversationalAgentLlmTokenConsumption 割り当てのデフォルトの上限は、1 分あたり 600,000 トークンです。
マルチリージョン割り当ての増加リクエスト
マルチリージョンの割り当て増加をリクエストする必要がある場合は、次のいずれかの特定のリージョンに対してリクエストを送信します。
- 米国とグローバルのマルチリージョンにあるエージェントの場合は、us-central1 を使用します。
- EU マルチリージョンのエージェントの場合は、europe-west4 を使用します。
リージョンとモデル別のトークン使用量を可視化する
Metrics Explorer を使用して、さまざまなリージョンとモデルでの LLM トークンの使用状況を把握する手順は次のとおりです。
- Metrics Explorer にアクセスする: Metrics Explorer を開きます。
- 指標を選択する:
分析する指標として
Conversational Agent LLM tokens quota usageを選択します。 - 集計と整列指定子を構成する:
- 集計関数を
Sumに設定して、トークンの合計使用量を取得します。 Configure Alignerをクリックして、時系列の連続するデータポイント間の変化の計算を有効にします。これにより、時間の経過に伴う使用状況の傾向を把握できます。
- 集計関数を
- 集計ディメンションを定義する: トークンの使用状況を分類するには、集計のディメンションとして
locationとbase_modelを選択します。これにより、リージョンやモデルによってトークンの消費量がどのように異なるかを確認できます。 - 整列指定子関数を設定する:
整列指定子関数として
Sumを選択して、連続するデータポイント間のトークン使用量の合計変化量を計算します。
割り当て増加リクエスト
必要に応じて、割り当ての増加の調整をリクエストできます。
Dialogflow エージェントとサービス アカウントの認証に異なるプロジェクトを使用する場合は、ユーザー プロジェクトの割り当ての引き上げをリクエストしてください。詳細については、Dialogflow ES に複数のプロジェクトを使用するまたは 会話エージェント(Dialogflow CX)に複数のプロジェクトを使用するをご覧ください。
Dialogflow ES エージェントについては、割り当ての増加をリクエストする前に、Dialogflow のエディションにエージェントをアップグレードしてください。
割り当ての表
料金と割り当ての説明にあたっては以下の用語を使用します。
- リクエスト: リクエストとは、Dialogflow サービスの API 呼び出しのことです。API を使った直接的な呼び出しか、統合やコンソールを使った間接的な呼び出しかは問いません。エージェントのタスクとデザインに応じて、エンドユーザーが Dialogflow エージェントでタスクを達成するために必要なリクエスト数は、大幅に異なります。
- セッション: セッションは、Dialogflow エージェントとエンドユーザーとの間の会話を表します。セッションはアクティブのままで、そのセッションへの最後のリクエストの送信から 30 分間、データが保存されます。
セッションは、チャット セッションまたはボイス セッションのいずれかです。
- チャット セッション: チャット セッションは、リクエストとレスポンスにテキストのみを使用します。
- ボイス セッション:ボイス セッションは、リクエスト、レスポンス、あるいはその両方に音声を使用します。
- コンシューマ プロジェクトとリソース プロジェクト: 複数のプロジェクトを使用している場合、リクエスト認証に関連付けられたプロジェクト(コンシューマ プロジェクト)とリクエスト内のエージェントに関連付けられたプロジェクト(リソース プロジェクト)が異なる可能性があります。この場合、料金と割り当ての決定にはコンシューマ プロジェクトが使用されます。詳細については、Dialogflow ES に複数のプロジェクトを使用するまたは 会話エージェント(Dialogflow CX)に複数のプロジェクトを使用するをご覧ください。
次の表は、エージェント タイプ別にエディションの割り当てを比較したものです。付随機能として表中に記されていない限り、リクエストによって使用されるすべての機能に対して割り当ては累積していきます。
会話エージェント(Dialogflow CX)エージェント
| 機能 | 会話エージェント(Dialogflow CX)のエディション |
|---|---|
|
テキスト (音声付きではないすべての DetectIntent、StreamingDetectIntent、および FulfillIntent リクエストを含む) |
1 分あたり 1,200 回のリクエスト |
|
音声入出力 (音声認識、音声文字変換、STT、音声合成、テキスト読み上げ、TTS、電話通信) |
1 分あたり 600 回のリクエスト |
|
Chirp3 HD 音声による音声クエリ オペレーション (音声合成、テキスト読み上げ、TTS、電話通信) |
1 分あたり 25 件のリクエスト |
|
生成機能 (ハンドブック、データストア、生成ツール、生成的フォールバック) |
1 分あたり 600,000 個のトークン。生成割り当てをご覧ください。 |
|
Dialogflow ES Phone Gateway 音声入出力を含む。 |
1 分あたり合計 100 分の電話時間 ‡ |
|
設計時の書き込みリクエスト たとえば、エージェントの構築や更新のための呼び出しなど。 |
1 分あたり 60 回のリクエスト |
|
設計時の読み取りリクエスト たとえば、エージェント リソースの一覧表示や取得の呼び出しなど。 |
1 分あたり 300 回のリクエスト |
|
その他のセッション リクエスト たとえば、セッション エンティティの設定や取得です。 |
1 分あたり 100 回のリクエスト |
| 記号 | 説明 |
|---|---|
| ‡ | 「1 分あたりの電話時間」とは、電話システムから発信したすべてのユーザーが使用する 1 分あたりの時間の合計です。たとえば、60 秒間に 1 人のユーザーが 60 秒、2 人目のユーザーが 30 秒、3 人目のユーザーが 30 秒使用した場合、1 分あたりの電話時間は合計 2 分になります。1 分あたりの時間が増えるほど、多くのユーザーがシステムを同時に使用できるようになります。 |
Dialogflow ES エージェント
| 機能 | Trial Edition | Essentials Edition |
|---|---|---|
|
テキスト (音声付きではないすべての DetectIntent と StreamingDetectIntent リクエストを含む) |
1 分あたりの 180 リクエスト | 1 分あたりの 600 リクエスト |
|
音声入力 (音声認識、音声文字変換、STT とも呼ばれる) |
1 分あたり 100 回のリクエスト † 1 日あたり 1,000 回のリクエスト † 1 か月あたり 15,000 回のリクエスト † 音声の長さはリクエストごとに最大 60 秒 † |
1 分あたり 300 リクエスト † リクエストあたり最大 60 秒の音声長 † |
|
音声出力 (音声合成、テキスト読み上げ、TTS とも呼ばれる) |
音声入力と同じ | 音声入力と同じ |
| ナレッジ コネクタ(ベータ版) | 最大 10 MB の合計ドキュメント サイズ 1,000 リクエスト/月 100 リクエスト/日 |
無制限 # |
| 感情分析 | 利用不可 | 無制限 # |
|
Dialogflow ES Phone Gateway 音声入出力を含む |
フリーダイヤル: 利用不可 1 分あたり合計 3 分の電話時間 ‡ 1 日あたり 30 分の電話 1 か月あたり 500 分 電話番号は 30 日間保持 |
1 分あたり合計 100 分の電話時間 ‡ |
| メガ エージェント | 1 日あたり 1,000 回のリクエスト | 無制限 # |
|
設計時の書き込みリクエスト たとえば、エージェントの構築や更新のための呼び出しなど。 |
1 分あたり 60 回のリクエスト | 1 分あたり 60 回のリクエスト |
|
設計時の読み取りリクエスト たとえば、エージェント リソースの一覧表示や取得の呼び出しなど。 |
1 分あたり 60 回のリクエスト | 1 分あたり 60 回のリクエスト |
|
その他のセッション リクエスト たとえば、セッション エンティティの設定や取得、コンテキストの更新とクエリなど。 |
1 分あたり 100 回のリクエスト | 1 分あたり 100 回のリクエスト |
| 記号 | 説明 |
|---|---|
| † | 各 StreamingDetectIntent ストリームは、ストリーム内に StreamingDetectIntentRequest 音声のフレームが複数含まれる場合でも、1 つのリクエストと見なされます。 |
| ‡ | 「1 分あたりの電話時間」とは、電話システムから発信したすべてのユーザーが使用する 1 分あたりの時間の合計です。たとえば、60 秒間に 1 人のユーザーが 60 秒、2 人目のユーザーが 30 秒、3 人目のユーザーが 30 秒使用した場合、1 分あたりの電話時間は合計 2 分になります。1 分あたりの時間が増えるほど、多くのユーザーがシステムを同時に使用できるようになります。 |
| # | 無制限とマークされている機能でも、他の機能を使用すると制限される可能性があります。たとえば、エディションでナレッジ コネクタの割り当てが無制限の場合でも、ナレッジ コネクタを使用するテキスト リクエストは、テキスト リクエストの割り当てによって制限されます。 |
| ¶ | Google アシスタントの音声入出力はテキスト リクエストと見なされます。 |
Agent Assist
Agent Assist を使用している場合、使用しているエージェント タイプに応じて、[会話エージェント(Dialogflow CX)エージェント] タブと [Dialogflow ES エージェント] タブに一覧表示されている割り当ても適用されます。
| 機能 | Trial Edition | Essentials Edition |
|---|---|---|
|
Agent Assist の会話のその他のオペレーション 会話と参加者を管理するすべてのリクエストが含まれます。 |
利用不可 | 1 分あたり 300 回のリクエスト |
|
Agent Assist のテキスト/音声分析オペレーション 任意の会話のステージのすべての AnalyzeContent リクエストまたは StreamingAnalyzeContent リクエストが含まれます。これには、テキスト、音声合成、音声認識に関するすべてのリクエストが含まれます。 |
利用不可 | 1 分あたり 300 回のリクエスト |
|
同時双方向ストリーミング セッション 任意の会話のステージのすべての BidiStreamingAnalyzeContent リクエストが含まれます。これには、音声合成や音声認識に関するすべてのリクエストが含まれます。 |
利用不可 | 50 件の同時リクエスト |
|
Agent Assist の会話の概要の提案のためのポーリング リクエスト 会話の概要を取得するためのすべてのリクエストが含まれます。 |
利用不可 | 1 分あたり 60 回のリクエスト |
|
Agent Assist の SearchKnowledge リクエスト 任意の会話のステージのすべての SearchKnowledge リクエストが含まれます。 |
利用不可 | 1 分あたり 60 回のリクエスト |
上限
上限は固定で、引き上げることはできません。多くのリソースやフィールドには数量、時間、または文字数の上限があり、これらはサービスの実装時に固定されます。
次の表に通常適用される上限を示します。機能固有のドキュメントおよび API リファレンス ドキュメントにその他の制限事項が記載されている場合があります。
数量上限
会話エージェント(Dialogflow CX)エージェント
| 説明 | 上限 |
|---|---|
| Google Cloud プロジェクトあたりのエージェントの最大数 | 1000 |
プロジェクトあたりの電話番号の最大数(global リージョンを除く) |
5 |
プロジェクトあたりのリージョンあたりの電話番号の最大数(global リージョンを除く) |
5 |
| エージェントごとのフローの最大数 | 50 |
| エージェントごとのエンティティ タイプの最大数 | 250 |
| エージェントごとの Webhook の最大数 | 100 |
| エージェントごとの環境の最大数 | 20 |
| エージェントごとのテストケースの最大数 | 2,000 |
| エージェントごとの変更ログの最大数 | 20,000 |
| フローごとのページの最大数 | 250 |
| フローごとのルートグループの最大数 | 100 |
| フローごとのバージョンの最大数 | 20 |
| エージェントごとのインテントの最大数 | 10,000 |
| フローごとの参照インテントの最大数 | 2,000 |
| インテントごとおよび言語ごとのトレーニング フレーズの最大数(「デフォルトのネガティブ インテント」を除く) | 2,000 |
| フローごとおよび言語ごとのトレーニング フレーズの最大数 | 100,000 |
| インテントごとのパラメータの最大数 | 20 |
| エンティティごとのエンティティ エントリの最大数 | 30,000 |
| エンティティ エントリごとのエンティティの類義語の最大数 | 200 |
| エージェントごとおよび言語ごとのエンティティ参照値と類義語の最大数 | 1,000,000 |
| ページごとのパラメータの最大数 | 20 |
| ページごとのルートの最大数 | 2,000 |
| ページごとのイベント ハンドラの最大数 | 100 |
| ルートグループごとのルートの最大数 | 2000 |
| エージェントごとのハンドブックの最大数 | 50 |
| 1 つの会話ターンでのハンドブック呼び出しの最大数 | 3 |
| 同じ会話ターンで 1 つのハンドブック呼び出しあたりの LLM 呼び出しの最大数 | 10 |
| エージェントごとのハンドブックの例の最大数 | デフォルトのサンプル取得戦略では、セッション コンテキストに対するサンプルの関連性に基づいて、使用されているモデルのトークン制限に収まるように、サンプルの数を自動的に制限します。 |
| ハンドブックあたりのバージョンの最大数 | 100 |
| エージェントごとのツールの最大数 | 100 |
Dialogflow ES エージェント
| 説明 | 上限 |
|---|---|
| リージョンごとおよび Google Cloud プロジェクトごとのエージェントの最大数 | 1 |
プロジェクトあたりの電話番号の最大数(global リージョンを除く) |
5 |
プロジェクトあたりのリージョンあたりの電話番号の最大数(global リージョンを除く) |
5 |
| インテントの最大数 | 2,000 |
| エンティティ タイプの最大数 | 250 |
| インテントごとおよび言語ごとのトレーニング フレーズの最大数 | 2,000 |
| エージェントごとおよび言語ごとのトレーニング フレーズの最大数 | 100,000 |
| エンティティ エントリの最大数 | 30000 |
| エンティティ エントリごとのエンティティの類義語の最大数 | 200 |
| エージェントごとおよび言語ごとのエンティティ参照値と類義語の最大数 | 1,000,000 |
| インテントごとのパラメータの最大数 | 20 |
| インテントごとの入力コンテキストの最大数 | 5 |
| インテントごとの出力コンテキストの最大数 | 30 |
| インテントごとおよび言語ごとのテキスト レスポンスの最大数 | 30 |
| パラメータごとおよび言語ごとのプロンプトの最大数 | 30 |
| エージェントごとの環境の最大数 | 10 |
| エージェントごとのバージョンの最大数 | 1000 |
| ¶ | アカウントあたりのエージェントの最大数は、アカウントで作成できる Google プロジェクトの数によって異なります。プロジェクトの追加をリクエストする方法をご覧ください。 |
Agent Assist
Agent Assist を使用している場合、使用しているエージェント タイプに応じて、[会話エージェント(Dialogflow CX)エージェント] タブと [Dialogflow ES] タブに一覧表示されている制限も適用されます。
| 説明 | 上限 |
|---|---|
| モデルのトレーニングに必要な最小の会話数 | 30,000 |
| プロジェクトあたりの同時にトレーニングされるモデルの最大数 | 1 |
プロジェクトあたりの電話番号の最大数(global リージョンを除く) |
5 |
プロジェクトあたりのリージョンあたりの電話番号の最大数(global リージョンを除く) |
5 |
| 1 か月あたりのトレーニング ノード GPU 時間の最大数 | 4200 |
| 会話プロファイルの最大数 | 100 |
時間上限
会話エージェント(Dialogflow CX)エージェント
| 説明 | 上限 |
|---|---|
| Webhook ごとの最長タイムアウト | 30 秒 |
| 音声入力の最長時間 | 120 秒 |
Dialogflow ES エージェント
| 説明 | 上限 |
|---|---|
| Webhook の最大タイムアウト | 5 秒 |
| テレフォニー通話の最長時間 | 3.5 時間 |
文字数上限
会話エージェント(Dialogflow CX)エージェント
| 説明 | 上限 |
|---|---|
| トレーニング フレーズの最大文字数 | 768 文字 |
| テキスト レスポンスの最大文字数 | 4,000 文字 |
| 非生成インテントまたはパラメータによって一致したインテントを検出するためのテキスト入力の最大文字数 | 256 文字 |
Dialogflow ES エージェント
| 説明 | 上限 |
|---|---|
| エージェント名の最小文字数 | 1 文字 |
| エージェント名の最大文字数 | 150 文字 |
| エージェントの説明の最大文字数 | 500 文字 |
| インテント名の最大文字数 | 100 文字 |
| エンティティ タイプ名の最大文字数 | 30 文字 |
| トレーニング フレーズの最大文字数 | 768 文字 |
| アクション名の最大文字数 | 250 文字 |
| コンテキスト名の最大文字数 | 250 文字 |
| エントリ値の最大文字数 | 512 文字 |
| パラメータ名の最大文字数 | 30 文字 |
| テキスト レスポンスの最大文字数 | 4,000 文字 |
| インテントのテキスト入力の最大検出文字数* | 256 文字 |
| イベント名の最大文字数 | 150 文字 |
| * | この上限は Dialogflow サービスによって適用されます。統合を使用している場合、統合プラットフォームの上限の方が小さい場合があります。統合に関する詳細をご覧ください。 |
サイズの制限
会話エージェント(Dialogflow CX)エージェント
| 説明 | 上限 |
|---|---|
| 音声合成リクエストの最大サイズ | TTS API コンテンツの上限を確認する |
| 最大ツール仕様サイズ | 20KB |
Dialogflow ES エージェント
| 説明 | 上限 |
|---|---|
| エージェントをインポート / 復元する際の最大エージェント サイズ(解凍したコンテンツ) | 50 MB |
| 音声合成リクエストの最大サイズ | TTS API コンテンツの上限を確認する |