此页面由 Cloud Translation API 翻译。

配额和限制

本文档介绍了使用 Dialogflow 时经常遇到的配额和限制。下文介绍了如何查找配额和限制的完整列表。我们保留更改这些限制的权利。若有任何更改，我们会相应地更新本页面，以反映这些更改。

配额

配额是应用于您的项目的默认限额。使用生成式功能时，每种模型与区域的组合都有自己的生成式配额。如果您使用的是付费版本，则可以申请增加配额。设置配额的目的是限制每个客户端的服务负载，防止服务过载以及防止客户端使用的资源数量超出预期。

Dialogflow 配额因代理版本不同而异。配额应用于每个项目，由使用该项目的所有应用和 IP 地址共享。

配额时间边界详情：

每月配额将于每月 1 日零点（美国太平洋时间）补充。
每日配额每天在美国太平洋时间零点补充。当美国太平洋时间转为夏令时并导致一天的时长增加时，系统将按比例分配额外的配额。不过，如果由于夏令时转换而导致一天的时间缩短，则则不会有同等的配额扣减。
每分钟配额按每隔 60 秒刷新一次。

配额表中列出的配额是通常会遇到的配额。如需查看所有配额，请参阅 Google Cloud 控制台 Dialogflow 配额页面。

生成式配额

当您的代理使用 Conversational Agents (Dialogflow CX) 生成式功能时，每种模型和区域组合都有唯一的配额。

配额标识符

ConversationalAgentLlmTokenConsumption 配额是一种区域配额，用于跟踪对话智能体 (Dialogflow CX) 中大语言模型 (LLM) 的 token 使用情况。此配额是针对不同的 LLM 基础模型进行衡量的，目前支持以下模型：

gemini-1.5-pro
gemini-1.5-pro-002
gemini-1.5-flash
gemini-1.5-flash-002
gemini-2.0-flash-001
gemini-2.0-flash-lite-001
gemini-2.5-flash
gemini-2.5-flash-lite

ConversationalAgentLlmTokenConsumption 配额用于跟踪以下 Conversational Agents (Dialogflow CX) 功能的 LLM 令牌使用情况：

生成器
生成式后备
Playbook
Datastore

ConversationalAgentLlmTokenConsumption 配额的默认限制为每分钟 60 万个令牌。

多区域配额增加申请

如果您需要为多区域申请增加配额，请针对以下特定区域之一提交申请：

对于美国和全球多区域中的代理，请使用 us-central1。
对于位于欧盟多区域的代理，请使用 europe-west4。

按区域和模型直观呈现 token 使用情况

如需深入了解不同区域和模型中的 LLM 令牌消耗情况，请使用 Metrics Explorer 按照以下步骤操作：

访问 Metrics Explorer：打开 Metrics Explorer。
选择指标：选择 Conversational Agent LLM tokens quota usage 作为要分析的指标。
配置聚合器和校准器：
- 将聚合函数设置为 Sum，以获取令牌总用量。
- 点击 Configure Aligner 可启用时序中连续数据点之间的变化计算。这有助于了解一段时间内的使用情况趋势。
定义汇总维度：如需细分令牌用量，请选择 location 和 base_model 作为汇总维度。这样一来，您就可以了解不同区域和模型之间的令牌消耗量差异。
设置校准器函数：选择 Sum 作为校准器函数，以计算连续数据点之间令牌使用量的总变化。

申请增加配额

如有必要，您可以申请调整配额增加量。

如果您将不同项目用于 Dialogflow 代理，并且使用不同项目通过服务账号进行身份验证，请为使用方项目申请增加配额。如需了解详情，请参阅将多个项目用于 Dialogflow ES 或将多个项目用于 Conversational Agents (Dialogflow CX)。

对于 Dialogflow ES 代理，请务必将该代理升级到 Dialogflow Essentials 版本，然后再申请增加配额。

配额表

以下术语用于说明价格和配额：

请求：“请求”是指对 Dialogflow 服务的任何 API 调用，无论是使用 API 直接调用，还是使用集成或控制台间接调用。最终用户通过 Dialogflow 代理完成一项任务所需的请求数可能相差很大，具体取决于任务以及代理的设计。
会话：“会话”是指最终用户与 Dialogflow 代理之间的对话。在会话的最后一个请求发送后的 30 分钟内，会话将保持活动状态并且其数据会被保存。会话可以是聊天会话或语音会话。
- 聊天会话：在聊天会话中，请求和响应均采用文本形式。
- 语音会话：在语音会话中，请求或响应采用音频形式，或二者均采用音频形式。
使用方项目和资源项目：如果您有多个项目，您的请求身份关联的项目（使用方项目）可能不同于请求中的代理所关联的项目（资源项目）。在这种情况下，价格和配额由使用方项目决定。如需了解详情，请参阅将多个项目用于 Dialogflow ES 或将多个项目用于 Conversational Agents (Dialogflow CX)。

下表按代理类型比较了各个版本的配额。除非指明某项功能已包含在内，否则配额将针对请求使用的所有功能累积计算。

Conversational Agents (Dialogflow CX) 代理

功能	Conversational Agents (Dialogflow CX) 版
Text （包括不包含音频的所有 DetectIntent、StreamingDetectIntent 和 FulfillIntent 请求）	每分钟 1200 个请求
音频输入/输出（语音识别、语音转文字、STT、语音合成、文字转语音、TTS、电话）	每分钟 600 个请求
使用 Chirp3 高清语音的音频查询操作（语音合成、文字转语音、TTS、电话）	每分钟 25 个请求
生成式功能（Playbook、数据存储区、生成器、生成式回退）	每分钟 60 万个 token，请参阅生成式配额
Dialogflow CX 电话网关包括音频输入和输出。	总计 100 分钟的每分钟通话时长 ‡
设计时写入请求例如，用于构建或更新代理的调用。	每分钟 60 个请求
设计时读取请求例如，用于列出或获取代理资源的调用。	每分钟 300 个请求
其他会话请求例如，设置或获取会话实体。	每分钟 100 个请求

符号	说明
‡	“每分钟通话时长”是指每分钟内所有用户使用电话系统的通话时间总和。例如：在一个 60 秒的时间段内，第一个用户通话 60 秒，第二个用户通话 30 秒，第三个用户通话 30 秒。此例中，每分钟的通话时长将计为 2 分钟。提高每分钟的通话时长上限可允许更多用户同时使用系统。

Dialogflow ES 代理

功能	Trial Edition	Essentials Edition
Text （包括不包含音频的所有 DetectIntent 和 StreamingDetectIntent 请求）	每分钟 180 个请求 ¶	每分钟 600 个请求 ¶
音频输入（也称作语音识别、语音转文字、STT）	每分钟 100 个请求 † 每天 1000 个请求 † 每月 15000 个请求 † 每个请求的音频长度上限为 60 秒 †	每分钟 300 个请求 † 每个请求的音频长度上限为 60 秒 †
音频输出（也称作语音合成、文字转语音、TTS）	与音频输入相同	与音频输入相同
知识连接器（Beta 版）	文档总大小上限为 10 MB 每月 1000 个请求每天 100 个请求	无限制 #
情感分析	不可用	无限制 #
Dialogflow ES 手机 Gateway 包括音频输入和输出。	免费号码：不可用总计 3 分钟的每分钟通话时长 ‡ 每天 30 分钟通话每月 500 分钟通话电话号码保留 30 天	总计 100 分钟的每分钟通话时长 ‡
超级代理	每天 1000 个请求	无限制 #
设计时写入请求例如，用于构建或更新代理的调用。	每分钟 60 个请求	每分钟 60 个请求
设计时读取请求例如，用于列出或获取代理资源的调用。	每分钟 60 个请求	每分钟 60 个请求
其他会话请求例如，设置或获取会话实体或更新/查询上下文。	每分钟 100 个请求	每分钟 100 个请求

符号	说明
†	每个 StreamingDetectIntent 流都被视为单个请求，即使该流中可能包含多帧 `StreamingDetectIntentRequest` 音频也是如此。
‡	“每分钟通话时长”是指每分钟内所有用户使用电话系统的通话时间总和。例如：在一个 60 秒的时间段内，第一个用户通话 60 秒，第二个用户通话 30 秒，第三个用户通话 30 秒。此例中，每分钟的通话时长将计为 2 分钟。提高每分钟的通话时长上限可允许更多用户同时使用系统。
#	标记为“无限制”的功能仍有可能因使用其他功能而受到限制。例如，即使您的版本对于知识连接器不设限额，但使用知识连接器的文本请求仍会受到文本请求配额的限制。
¶	Google 助理的音频输入和输出被视为文本请求。

客服助手

如果您使用的是 Agent Assist，则 Conversational Agents (Dialogflow CX) Agent 和 Dialogflow ES Agent 标签页下列出的配额还取决于您使用的代理类型。

功能	Trial Edition	Essentials Edition
Agent Assist 对话其他操作包括管理对话和参与者的所有请求。	不可用	每分钟 300 个请求
Agent Assist 分析文本/音频操作包括任何会话阶段的所有 AnalyzeContent 或 StreamingAnalyzeContent 请求。这包括所有涉及文本、语音合成和/或语音识别的此类请求。	不可用	每分钟 300 个请求
Agent Assist 对话摘要建议轮询请求包括获取对话摘要的所有请求。	不可用	每分钟 60 个请求
Agent Assist SearchKnowledge 请求包括任何对话阶段的所有 SearchKnowledge 请求。	不可用	每分钟 60 个请求

限制

限制是固定限额，无法提高。许多资源和字段有计数、时长或字符长度限制，这些限制是服务实现的固定限额。

下表列出了经常遇到的限制。特定功能的文档和 API 参考文档可能会介绍更多限制。

计数限制

Conversational Agents (Dialogflow CX) 代理

说明	限制
每个 Google Cloud 项目的代理数量上限	1000
每个项目的手机号码数量上限（`global` 区域除外）	5
每个项目在每个区域（`global` 区域除外）中的手机号码数量上限	5
每个代理的工作流数量上限	50
每个代理的实体类型数量上限	250
每个代理的 Webhook 数量上限	100
每个代理的环境数量上限	20
每个代理的测试用例数量上限	2000
每个代理的更改日志数量上限	20,000
每个流的页面数量上限	250
每个流的路由组数量上限	100
每个流的版本数量上限	20
每个代理的意图数量上限	10000
每个流的引用意图数量上限	2000
每个意图和每种语言（“默认负意图”除外）的训练词组数量上限	2000
每个流和每种语言的训练词组数量上限	10 万
每个意图的参数数量上限	20
每个实体的条目数量上限	30000
每个实体条目的同义词数量上限	200
每个代理和每种语言的实体参考值和同义词数量上限	100 万
每个页面的参数数量上限	20
每个页面的路由数量上限	2000
每个页面的事件处理程序数量上限	100
每个路由组的路由数量上限	2000
每个代理的剧本数量上限	50
一个对话回合中的 playbook 调用次数上限	3
在同一对话轮次中，每次执行 playbook 时 LLM 调用的次数上限	10
每个代理的 playbook 示例数量上限	使用默认的示例检索策略时，系统会根据示例与会话的相关性，自动限制示例数量，使其不超过所用模型的令牌限制。
每个剧本的版本数量上限	100
每个代理的工具数量上限	100

Dialogflow ES 代理

说明	限制
每个区域和每个 Google Cloud 项目的代理数量上限	1
每个项目的手机号码数量上限（`global` 区域除外）	5
每个项目在每个区域（`global` 区域除外）中的手机号码数量上限	5
意图数量上限	2000
实体类型数量上限	250
每个意图和每种语言的训练词组数量上限	2000
每个代理和每种语言的训练词组数量上限	10 万
实体条目数量上限	30000
每个实体条目的同义词数量上限	200
每个代理和每种语言的实体参考值和同义词数量上限	100 万
每个意图的参数数量上限	20
每个意图的输入上下文数量上限	5
每个意图的输出上下文数量上限	30
每个意图和每种语言的文本响应数量上限	30
每个参数和每种语言的提示数量上限	30
每个代理的环境数量上限	10
每个代理的版本数量上限	1000

客服助手

如果您使用的是 Agent Assist，则 Conversational Agents (Dialogflow CX) 代理和 Dialogflow ES 标签页下列出的限额还取决于您使用的代理类型。

说明	限制
模型训练所需的对话数下限	30000
每个项目同时训练的模型数上限	1
每个项目的手机号码数量上限（`global` 区域除外）	5
每个项目在每个区域（`global` 区域除外）中的手机号码数量上限	5
每月训练节点 GPU 小时数上限	4200
对话配置文件的数量上限	100

时长限制

Conversational Agents (Dialogflow CX) 代理

说明	限制
每个 Webhook 的超时时长上限	30 秒
音频输入时长上限	120 秒

Dialogflow ES 代理

说明	限制
Webhook 超时时长上限	5 秒
电话通话时长上限	3.5 小时

字符长度限制

Conversational Agents (Dialogflow CX) 代理

说明	限制
训练词组长度上限	768 个字符
文本响应长度上限	4000 个字符
通过非生成式 intent 或参数检测意图时，文本输入长度上限	256 个字符

Dialogflow ES 代理

说明	限制
代理名称长度下限	1 个字符
代理名称长度上限	150 个字符
代理描述长度上限	500 个字符
意图名称长度上限	100 个字符
实体类型名称长度上限	30 个字符
训练词组长度上限	768 个字符
操作名称长度上限	250 个字符
上下文名称长度上限	250 个字符
条目值长度上限	512 个字符
参数名称长度上限	30 个字符
文本响应长度上限	4000 个字符
检测意图文本输入长度上限*	256 个字符
事件名称长度上限	150 个字符

大小限制

Conversational Agents (Dialogflow CX) 代理

说明	限制
语音合成请求大小上限	请参阅 TTS API 内容限制
工具规范大小上限	20KB

Dialogflow ES 代理

说明	限制
代理导入/恢复操作支持的代理大小上限（未压缩的内容）	50 MB
语音合成请求大小上限	请参阅 TTS API 内容限制

配额和限制 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

配额

生成式配额

配额标识符

多区域配额增加申请

按区域和模型直观呈现 token 使用情况

申请增加配额

配额表

Conversational Agents (Dialogflow CX) 代理

Dialogflow ES 代理

客服助手

限制

计数限制

Conversational Agents (Dialogflow CX) 代理

Dialogflow ES 代理

客服助手

时长限制

Conversational Agents (Dialogflow CX) 代理

Dialogflow ES 代理

字符长度限制

Conversational Agents (Dialogflow CX) 代理

Dialogflow ES 代理

大小限制

Conversational Agents (Dialogflow CX) 代理

Dialogflow ES 代理

配额和限制