本文說明使用 Dialogflow 時常見的配額與限制。如要查看配額和限制的完整清單,請參閱下方說明。Google 保留變更這些限制條件的權利。如有任何異動,我們會同步更新這個頁面上的資訊。
配額
配額是指已套用至專案的預設限制條件。使用生成功能時,每個模型和區域的組合都有自己的生成配額。 如果您使用的是付費版本,則可以要求增加配額。我們設定配額限制的目的是為了調節每個用戶端的服務負載,藉此預防服務超載的情況,以及避免用戶端產生超出預期的資源用量。
Dialogflow 的配額會因代理程式的版本而有所不同。配額限制適用於每項專案,且使用同一項專案的所有應用程式和 IP 位址會共用這些配額。
配額時間界線詳細資料:
- 每月配額會在太平洋時間每月 1 日的凌晨 12 點補充。
- 每日配額會在太平洋時間每天凌晨 12 點補充。太平洋時區日光節約時間轉換會增加一天長度,因此系統會按比例增加配額。不過,如果因日光節約時間轉換而導致當天時間較短,則不會有相應的扣除額。
- 每分鐘配額會每 60 秒補充一次。
配額表列出常見的配額。如要查看所有配額,請參閱 Google Cloud console Dialogflow 配額頁面。
生成配額
如果服務專員使用 Conversational Agents (Dialogflow CX) 的生成功能,每種模型和區域組合都有專屬配額。
配額 ID
ConversationalAgentLlmTokenConsumption
配額是區域配額,用於追蹤 Conversational Agents (Dialogflow CX) 中大型語言模型 (LLM) 的權杖用量。這項配額是針對不同的 LLM 基礎模型計算,目前支援下列模型:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
ConversationalAgentLlmTokenConsumption
配額會追蹤下列 Conversational Agents (Dialogflow CX) 功能的 LLM 權杖用量:
- 生成器
- 生成式備用答覆
- 應對手冊
- Datastore
ConversationalAgentLlmTokenConsumption
配額的預設上限為每分鐘 60 萬個權杖。
多區域配額提高要求
如要申請提高多區域的配額,請為下列其中一個特定區域提出要求:
- 如果代理程式位於「美國」和「全球」多區域,請使用 us-central1。
- 如果代理程式位於「歐盟」多區域,請使用 europe-west4。
以視覺化方式呈現各區域和模型的權杖用量
如要深入瞭解不同區域和模型中的 LLM 權杖用量,請按照下列步驟使用 Metrics Explorer:
- 存取 Metrics Explorer: 開啟 Metrics Explorer。
- 選取指標:
選擇
Conversational Agent LLM tokens quota usage
做為要分析的指標。 - 設定匯總和對齊器:
- 將匯總函式設為
Sum
,即可取得權杖總用量。 - 按一下
Configure Aligner
,即可啟用時間序列中連續資料點之間的變更計算。這有助於瞭解一段時間內的使用趨勢。
- 將匯總函式設為
- 定義匯總維度:
如要細分權杖用量,請選取
location
和base_model
做為匯總維度。 這樣就能瞭解不同區域和模型之間的符記用量差異。 - 設定校正函式:
選擇
Sum
做為校正函式,計算連續資料點之間詞元用量的總變化。
要求提高配額
如有需要,您可以要求調整配額上限。
如果您使用不同的專案來處理 Dialogflow 代理程式,以及透過服務帳戶進行驗證,請為消費者專案申請提高配額。詳情請參閱為 Dialogflow ES 使用多項專案或為對話式虛擬服務專員 (Dialogflow CX) 使用多項專案。
如果是 Dialogflow ES 代理程式,請務必先將代理程式升級至 Dialogflow Essentials 版本,再申請增加配額。
配額表
說明定價和配額時,我們會使用下列字詞:
- 要求:「要求」是指向 Dialogflow 服務發出的任何 API 呼叫,無論是透過 API 直接呼叫,或透過整合功能或主控台間接呼叫,均包含在內。視工作和虛擬服務專員的設計而定,使用者透過 Dialogflow 虛擬服務專員完成工作所需的要求數量可能大相逕庭。
- 工作階段:「工作階段」是指 Dialogflow 虛擬服務專員和使用者之間的對話。最後一項要求傳送完畢之後,工作階段會持續運作 30 分鐘,並儲存這段期間內的所有資料。工作階段可以分為「即時通訊工作階段」或「語音工作階段」。
- 即時通訊工作階段:「即時通訊工作階段」只會以文字傳送要求與回應。
- 語音工作階段:「語音工作階段」會透過音訊發出要求與回應。
- 消費者專案和資源專案:如果您使用多項專案,與要求驗證相關聯的專案 (消費者專案) 不一定是與要求中的虛擬服務專員相關聯的專案 (資源專案)。在這種情況下,系統會依據消費者專案決定價格與配額。詳情請參閱為 Dialogflow ES 使用多項專案或為 Conversational Agents (Dialogflow CX) 使用多項專案。
下表按照虛擬服務專員類型比較不同版本的配額。除非某項功能已註明為包含在配額中,否則系統會按照要求使用的所有功能來累計配額的耗用量。
Conversational Agents (Dialogflow CX) Agent
功能 | Conversational Agents (Dialogflow CX) 版本 |
---|---|
文字 (包括所有不含音訊的 DetectIntent、StreamingDetectIntent 和 FulfillIntent 要求) |
每分鐘 1,200 個要求 |
音訊輸入/輸出 (語音辨識、語音轉文字或 STT、語音合成、文字轉語音或 TTS、電話) |
每分鐘 600 次要求 |
使用 Chirp3 HD 語音的語音查詢作業 (語音合成、文字轉語音或 TTS、電話) |
每分鐘 25 個要求 |
生成式功能 (應對手冊、資料存放區、生成器、生成式備用答覆) |
每分鐘 60 萬個權杖,請參閱生成配額 |
Dialogflow CX Phone Gateway 包含音訊輸入與輸出。 |
每分鐘總通話分鐘數:100 ‡ |
設計階段寫入要求 例如,建構或更新代理程式的呼叫。 |
每分鐘 60 個要求 |
設計階段讀取要求 例如,呼叫列出或取得代理程式資源。 |
每分鐘 300 個要求 |
其他工作階段要求 例如,設定或取得工作階段實體。 |
每分鐘 100 個要求 |
符號 | 說明 |
---|---|
‡ | 「每分鐘通話分鐘數」是指透過電話系統撥打電話的所有使用者每分鐘耗用的總時長。舉例來說,在 60 秒的時間範圍內,一位使用者通話 60 秒,第二位使用者通話 30 秒,第三位使用者通話 30 秒。在這種情況下,每分鐘通話分鐘數計為 2。每分鐘的通話分鐘數越多,可同時使用系統的使用者人數就越多。 |
Dialogflow ES 代理程式
功能 | Trial Edition | Essentials Edition |
---|---|---|
文字 (包括所有不含音訊的 DetectIntent 和 StreamingDetectIntent 要求) |
每分鐘 180 個要求 ¶ | 每分鐘 600 個要求 ¶ |
音訊輸入 (又稱為語音辨識、語音轉文字或 STT) |
每分鐘 100 個要求 † 每天 1,000 個要求 † 每月 15,000 個要求 † 每個要求的音訊長度上限:60 秒 † |
每分鐘 300 個要求 † 每個要求的音訊長度上限:60 秒 † |
音訊輸出 (又稱為語音合成、文字轉語音或 TTS) |
與音訊輸入相同 | 與音訊輸入相同 |
知識連接器 (Beta 版) | 總文件大小上限:10 MB 每月最多 1,000 個要求 每天最多 100 個要求 |
無限制 # |
情緒分析 | 無法使用 | 無限制 # |
Dialogflow ES Phone Gateway 包含音訊輸入與輸出。 |
免付費電話:不適用 每分鐘總通話分鐘數:3 ‡ 每日通話分鐘數:30 每月通話分鐘數:500 電話號碼保留 30 天 |
每分鐘總通話分鐘數:100 ‡ |
超級虛擬服務專員 | 每日 1,000 個要求 | 無限制 # |
設計階段寫入要求 例如,建構或更新代理程式的呼叫。 |
每分鐘 60 個要求 | 每分鐘 60 個要求 |
設計階段讀取要求 例如,呼叫列出或取得代理程式資源。 |
每分鐘 60 個要求 | 每分鐘 60 個要求 |
其他工作階段要求 例如設定或取得工作階段實體, 或更新/查詢情境資訊。 |
每分鐘 100 個要求 | 每分鐘 100 個要求 |
符號 | 說明 |
---|---|
† | 系統會將每個 StreamingDetectIntent 串流視為單一要求,即使串流可能含有多個 StreamingDetectIntentRequest 音訊音框也是如此。 |
‡ | 「每分鐘通話分鐘數」是指透過電話系統撥打電話的所有使用者每分鐘耗用的總時長。舉例來說,在 60 秒的時間範圍內,一位使用者通話 60 秒,第二位使用者通話 30 秒,第三位使用者通話 30 秒。在這種情況下,每分鐘通話分鐘數計為 2。每分鐘的通話分鐘數越多,可同時使用系統的使用者人數就越多。 |
# | 標示為無限制的功能仍可因為所使用的其他功能而受到限制。舉例來說,假設您的版本提供無上限的知識連接器配額,但使用知識連接器的文字要求仍會受到文字要求配額的限制。 |
¶ | 系統會將 Google 助理的音訊輸入和輸出視為文字要求。 |
Agent Assist
如果您使用 Agent Assist,則「Conversational Agents (Dialogflow CX) Agent」和「Dialogflow ES Agent」分頁中列出的配額也適用,具體視您使用的虛擬服務專員類型而定。
功能 | Trial Edition | Essentials Edition |
---|---|---|
Agent Assist 對話其他作業 包含管理對話和參與者的所有要求。 |
無法使用 | 每分鐘 300 個要求 |
Agent Assist 會分析文字/音訊作業 包含任何對話階段的所有 AnalyzeContent 或 StreamingAnalyzeContent 要求。 包括所有涉及文字、語音合成和/或語音辨識的要求。 |
無法使用 | 每分鐘 300 個要求 |
Agent Assist 對話摘要建議輪詢要求 包含取得對話摘要的所有要求。 |
無法使用 | 每分鐘 60 個要求 |
Agent Assist SearchKnowledge 要求 包含任何對話階段的所有 SearchKnowledge 要求。 |
無法使用 | 每分鐘 60 個要求 |
限制
「限制」為固定的條件,無法提高。許多資源和欄位都設有數量、時間或長度方面的固定限制,無法針對服務實作進行調整。
下表列出常見的限制。如要查看其他限制,請參閱特定功能的說明文件和 API 參考說明文件。
數量限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
每個 Google Cloud 專案的代理程式數量上限 | 1000 |
每個專案的電話號碼數量上限 (global 區域除外) |
5 |
每個區域每項專案的電話號碼數量上限 (global 區域除外) |
5 |
每個代理程式的流程數量上限 | 50 |
每個代理程式的實體類型數量上限 | 250 |
每個代理程式的 Webhook 數量上限 | 100 |
每個代理程式的環境數量上限 | 20 |
每個代理程式的測試案例數量上限 | 2000 |
每個代理程式的變更記錄數量上限 | 20,000 |
每個流程的頁數上限 | 250 |
每個流程的路徑群組數量上限 | 100 |
每個流程的版本數量上限 | 20 |
每個代理程式的意圖數量上限 | 10,000 |
每個流程的參照意圖數量上限 | 2000 |
每個意圖和每種語言的訓練詞組數量上限 (除了「預設排除意圖」) | 2000 |
每個流程和每種語言的訓練詞組數量上限 | 100,000 |
每個意圖的參數數量上限 | 20 |
每個實體的實體項目數量上限 | 30,000 |
每個實體項目的實體同義詞數量上限 | 200 |
每個代理程式和每種語言的實體參考值和同義詞數量上限 | 1,000,000 |
每頁的參數數量上限 | 20 |
每頁的路徑數量上限 | 2000 |
每頁的事件處理常式數量上限 | 100 |
每個路徑群組的路徑數量上限 | 2000 |
每個代理程式的劇本數量上限 | 50 |
單一對話回合中可叫用的劇本數量上限 | 3 |
在同一個對話回合中,每次執行劇本時的 LLM 呼叫次數上限 | 10 |
每個代理程式的劇本範例數量上限 | 使用預設範例擷取策略時,系統會根據範例與工作階段內容的關聯性,自動限制範例數量,確保範例符合所用模型的符記限制。 |
每個劇本的版本數量上限 | 100 |
每個代理程式的工具數量上限 | 100 |
Dialogflow ES 代理程式
說明 | 限制 |
---|---|
每個區域和每項 Google Cloud 專案的代理程式數量上限 ¶ | 1 |
每個專案的電話號碼數量上限 (global 區域除外) |
5 |
每個區域每項專案的電話號碼數量上限 (global 區域除外) |
5 |
意圖數量上限 | 2000 |
實體類型數量上限 | 250 |
每個意圖和每種語言的訓練詞組數量上限 | 2000 |
每個代理程式和每種語言的訓練詞組數量上限 | 100,000 |
實體項目數量上限 | 30000 |
每個實體項目的實體同義詞數量上限 | 200 |
每個代理程式和每種語言的實體參考值和同義詞數量上限 | 1,000,000 |
每個意圖的參數數量上限 | 20 |
每個意圖的輸入背景資訊數量上限 | 5 |
每個意圖的輸出背景資訊數量上限 | 30 |
每個意圖和每種語言的文字回應數量上限 | 30 |
每項參數和每種語言的提示數量上限 | 30 |
每個代理程式的環境數量上限 | 10 |
每個代理程式的版本數量上限 | 1000 |
¶ | 每個帳戶的代理程式數量上限取決於帳戶可建立的 Google 專案數量。請參閱如何要求更多專案。 |
Agent Assist
如果您使用 Agent Assist,則「Conversational Agents (Dialogflow CX) Agent」和「Dialogflow ES」分頁中列出的限制也會適用,視您使用的代理程式類型而定。
說明 | 限制 |
---|---|
訓練模型所需的對話數量下限 | 30,000 |
每個專案可同時訓練的模型數量上限 | 1 |
每個專案的電話號碼數量上限 (global 區域除外) |
5 |
每個區域每項專案的電話號碼數量上限 (global 區域除外) |
5 |
每月訓練節點 GPU 時數上限 | 4200 |
對話設定檔數量上限 | 100 |
時間限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
每個 Webhook 的逾時時間上限 | 30 秒 |
音訊輸入長度上限 | 120 秒 |
Dialogflow ES 代理程式
說明 | 限制 |
---|---|
Webhook 逾時時間上限 | 5 秒 |
電話通話時間上限 | 3.5 小時 |
長度限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
訓練詞組長度上限 | 768 個字元 |
文字回應長度上限 | 4,000 個字元 |
偵測意圖文字輸入長度上限 (由非生成意圖或參數比對) | 256 個字元 |
Dialogflow ES 代理程式
說明 | 限制 |
---|---|
代理程式名稱長度下限 | 1 個字元 |
代理程式名稱長度上限 | 150 個字元 |
代理程式說明長度上限 | 500 個字元 |
意圖名稱長度上限 | 100 個字元 |
實體類型名稱長度上限 | 30 個字元 |
訓練詞組長度上限 | 768 個字元 |
動作名稱長度上限 | 250 個字元 |
背景資訊名稱長度上限 | 250 個字元 |
項目值長度上限 | 512 個字元 |
參數名稱長度上限 | 30 個字元 |
文字回應長度上限 | 4,000 個字元 |
偵測意圖輸入文字長度上限* | 256 個字元 |
事件名稱長度上限 | 150 個字元 |
* | 這項限制由 Dialogflow 服務強制執行。如果您使用的是整合項目,整合平台的限制可能更為嚴格。詳情請參閱整合項目的詳細資料。 |
大小限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
語音合成要求大小上限 | 請參閱 TTS API 內容限制 |
工具規格大小上限 | 20KB |
Dialogflow ES 代理程式
說明 | 限制 |
---|---|
匯入/還原代理程式時,系統允許的代理程式大小上限 (未壓縮的內容) | 50 MB |
語音合成要求大小上限 | 請參閱 TTS API 內容限制 |