本文說明常見的 Dialogflow 使用配額與限制。如要瞭解如何查看完整的配額和限制清單,請參閱下方資訊。Google 保留變更這些限制條件的權利。如有任何異動,我們會同步更新這個頁面上的資訊。
配額
配額是指已套用至專案的預設限制條件。使用生成式功能時,每個模型和區域組合都有專屬的生成式配額。如果您使用的是付費版本,則可以要求增加配額。我們設定配額限制的目的是為了調節每個用戶端的服務負載,藉此預防服務超載的情況,以及避免用戶端產生超出預期的資源用量。
Dialogflow 的配額會因代理程式的版本而有所不同。配額限制適用於每項專案,且使用同一項專案的所有應用程式和 IP 位址會共用這些配額。
配額時間邊界詳細資料:
- 每月配額會在太平洋時間每月 1 日的凌晨 12 點補充。
- 系統會在太平洋時間凌晨 12 點補充每日配額。太平洋時間日光節約時間轉換後,一天的長度會增加,系統會依比例提供配額獎勵。不過,如果日光節約時間轉換導致天數減少,則不會有相應的扣款。
- 每分鐘配額會每 60 秒補充一次。
配額表中列出的配額是常見的配額。如要查看所有配額,請參閱 Google Cloud 主控台 Dialogflow 配額頁面。
生成式配額
當服務專員使用 Conversational Agents (Dialogflow CX) 生成式功能時,每個模型和區域組合都有獨特的配額。
配額 ID
ConversationalAgentLlmTokenConsumption
配額是區域配額,可追蹤 Conversational Agents (Dialogflow CX) 中大型語言模型 (LLM) 的符記使用情形。這個配額是根據不同 LLM 基礎模型來評估,目前支援下列模型:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
ConversationalAgentLlmTokenConsumption
配額會追蹤下列 Conversational Agents (Dialogflow CX) 功能中的 LLM 符記使用情形:
- 發電機
- 生成式備用答覆
- 應對手冊
- Datastore
ConversationalAgentLlmTokenConsumption
配額的預設上限為每分鐘 600,000 個符記。
多區域配額提高要求
如果您需要為多個區域申請提高配額,請針對下列其中一個特定區域提交要求:
- 如果是美國和全球多地區的服務專員,請使用 us-central1。
- 如果是歐盟多區域中的服務專員,請使用 europe-west4。
按地區和模型呈現權杖用量
如要深入瞭解不同區域和模型的 LLM 權杖用量,請使用 Metrics Explorer 執行下列步驟:
- 存取 Metrics Explorer:開啟 Metrics Explorer。
- 選取指標:選擇要分析的指標
Conversational Agent LLM tokens quota usage
。 - 設定匯總和對齊器:
- 將匯總函式設為
Sum
,即可取得總符記使用量。 - 按一下
Configure Aligner
即可計算時間序列中連續資料點之間的變化。這有助於瞭解使用率隨時間變化的趨勢。
- 將匯總函式設為
- 定義匯總維度:如要細分符記使用情形,請選取
location
和base_model
做為匯總維度。這樣您就能瞭解不同區域和模型的符記消耗量有何差異。 - 設定校正函式:選擇
Sum
做為校正函式,計算連續資料點之間的符號使用情形總變化。
提高配額要求
如有需要,您可以申請增加配額調整。
如果您使用不同的專案來處理 Dialogflow 代理程式,並透過服務帳戶進行驗證,請為消費者專案申請提高配額。詳情請參閱「為 Dialogflow ES 使用多項專案」或「為對話式服務機器人 (Dialogflow CX) 使用多項專案」。
如為 Dialogflow ES 代理程式,請務必先升級代理程式至 Dialogflow Essentials 版本,再提出配額增加申請。
配額表
說明定價和配額時,我們會使用下列字詞:
- 要求:「要求」是指向 Dialogflow 服務發出的任何 API 呼叫,無論是透過 API 直接呼叫,或透過整合功能或主控台間接呼叫,均包含在內。視工作和虛擬服務專員的設計而定,使用者透過 Dialogflow 虛擬服務專員完成工作所需的要求數量可能大相逕庭。
- 工作階段:「工作階段」是指 Dialogflow 虛擬服務專員和使用者之間的對話。最後一項要求傳送完畢之後,工作階段會持續運作 30 分鐘,並儲存這段期間內的所有資料。工作階段可以分為「即時通訊工作階段」或「語音工作階段」。
- 即時通訊工作階段:「即時通訊工作階段」只會以文字傳送要求與回應。
- 語音工作階段:「語音工作階段」會以音訊傳送要求與回應。
- 消費者專案和資源專案:如果您使用多項專案,與要求驗證相關聯的專案 (消費者專案) 不一定是與要求中的虛擬服務專員相關聯的專案 (資源專案)。在這種情況下,系統會依據消費者專案決定價格與配額。詳情請參閱「為 Dialogflow ES 使用多項專案」或「為對話式服務專員 (Dialogflow CX) 使用多項專案」。
下表按照代理程式類型比較不同版本的配額。除非某項功能已註明為包含在配額中,否則系統會按照要求使用的所有功能累計配額。
Conversational Agents (Dialogflow CX) Agent
功能 | Conversational Agents (Dialogflow CX) 版 |
---|---|
文字 (包括所有不含音訊的 DetectIntent、StreamingDetectIntent 和 FulfillIntent 要求) |
每分鐘 1,200 個要求 |
音訊輸入/輸出 (語音辨識、語音轉文字或 STT、語音合成、文字轉語音或 TTS、電話) |
每分鐘 600 次要求 |
使用 Chirp3 HD 語音的音訊查詢作業 (語音合成、文字轉語音或 TTS、電話) |
每分鐘 25 個要求 * |
生成式功能 (應對手冊、資料儲存庫、產生器、生成式備用答覆) |
每分鐘 600,000 個符記,請參閱生成式配額 |
Dialogflow CX Phone Gateway 包含音訊輸入和輸出。 |
每分鐘總通話分鐘數:100 ‡ |
設計階段寫入要求 例如建構或更新代理程式的呼叫。 |
每分鐘 60 個要求 |
設計階段讀取要求 例如呼叫列出或取得代理程式資源。 |
每分鐘 300 個要求 |
其他工作階段要求 例如設定或取得工作階段實體。 |
每分鐘 100 個要求 |
符號 | 說明 |
---|---|
* | 如果您在 Google Cloud console Dialogflow 配額頁面上沒有看到這個配額,請與您的帳戶團隊聯絡,如果需要增加配額,請提交支援案件。 |
‡ | 「每分鐘通話分鐘數」是指透過電話系統撥打電話的所有使用者每分鐘耗用的總時長。舉例來說,在 60 秒的時間範圍內,一位使用者通話 60 秒,第二位使用者通話 30 秒,第三位使用者通話 30 秒。在這種情況下,每分鐘通話分鐘數計為 2。每分鐘的通話分鐘數越多,可同時使用系統的使用者人數就越多。 |
Dialogflow ES 服務機器人
功能 | Trial Edition | Essentials Edition |
---|---|---|
文字 (包括所有不含音訊的 DetectIntent 和 StreamingDetectIntent 要求) |
每分鐘 180 個要求 ¶ | 每分鐘 600 個要求 ¶ |
音訊輸入 (又稱為語音辨識、語音轉文字或 STT) |
每分鐘 100 次要求 † 每天 1000 次要求 † 每月 15,000 次要求 † 每個要求的音訊長度上限:60 秒 † |
每分鐘 300 個要求 † 每個要求的音訊長度上限:60 秒 † |
音訊輸出 (又稱為語音合成、文字轉語音或 TTS) |
與音訊輸入相同 | 與音訊輸入相同 |
知識連接器 (Beta 版) | 總文件大小上限:10 MB 每月 1000 個要求 每天 100 個要求 |
無限制 # |
情緒分析 | 無法使用 | 無限制 # |
Dialogflow ES Phone Gateway 包含音訊輸入和輸出。 |
免付費電話:不適用 每分鐘總通話分鐘數:3 分鐘 ‡ 每日通話分鐘數:30 分鐘 每月通話分鐘數:500 分鐘 電話號碼保留 30 天 |
每分鐘總通話分鐘數:100 ‡ |
超級虛擬服務專員 | 每日 1,000 個要求 | 無限制 # |
設計階段寫入要求 例如建構或更新代理程式的呼叫。 |
每分鐘 60 個要求 | 每分鐘 60 個要求 |
設計階段讀取要求 例如列出或取得虛擬服務專員資源的呼叫。 |
每分鐘 60 個要求 | 每分鐘 60 個要求 |
其他工作階段要求 例如設定或取得工作階段實體,或更新/查詢情境資訊。 |
每分鐘 100 個要求 | 每分鐘 100 個要求 |
符號 | 說明 |
---|---|
† | 系統會將每個 StreamingDetectIntent 串流視為一次要求,即使串流可能同時含有多個 StreamingDetectIntentRequest 音訊影格也是如此。 |
‡ | 「每分鐘通話分鐘數」是指透過電話系統撥打電話的所有使用者每分鐘耗用的總時長。舉例來說,在 60 秒的時間範圍內,一位使用者通話 60 秒,第二位使用者通話 30 秒,第三位使用者通話 30 秒。在這種情況下,每分鐘通話分鐘數計為 2。每分鐘的通話分鐘數越多,可同時使用系統的使用者人數就越多。 |
# | 標示為無限制的功能仍可能會受到其他功能的限制。舉例來說,假設您的版本提供無上限的知識連接器配額,但使用知識連接器的文字要求仍會受到文字要求配額的限制。 |
¶ | 系統會將 Google 助理的音訊輸入和輸出視為文字要求。 |
Agent Assist
如果您使用 Agent Assist,則根據您使用的代理程式類型,也會套用「Conversational Agents (Dialogflow CX) Agent」和「Dialogflow ES Agent」分頁下列出的配額。
功能 | Trial Edition | Essentials Edition |
---|---|---|
Agent Assist 對話其他作業 包含管理對話和參與者的所有要求。 |
無法使用 | 每分鐘 300 個要求 |
Agent Assist 會分析文字/音訊作業 包含任何對話階段的所有 AnalyzeContent 或 StreamingAnalyzeContent 要求。這包括所有涉及文字、語音合成和/或語音辨識的這類要求。 |
無法使用 | 每分鐘 300 個要求 |
Agent Assist 對話摘要建議輪詢要求 包含所有取得對話摘要的要求。 |
無法使用 | 每分鐘 60 個要求 |
Agent Assist SearchKnowledge 要求 包含任何對話階段的所有 SearchKnowledge 要求。 |
無法使用 | 每分鐘 60 個要求 |
限制
「限制」為固定的條件,無法提高。許多資源和欄位都設有數量、時間或長度方面的固定限制,無法針對服務實作進行調整。
下表列出常見的限制。如要查看其他限制,請參閱特定功能的說明文件和 API 參考說明文件。
數量限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
每項 Google Cloud 專案的代理程式數量上限 | 1000 |
每項專案的電話號碼數量上限 (global 區域除外) |
5 |
每個專案在每個區域的電話號碼數量上限 (global 區域除外) |
5 |
每個代理程式的流程數量上限 | 50 |
每個代理程式的實體類型數量上限 | 250 |
每個代理程式的 Webhook 數量上限 | 100 |
每個代理程式的環境數量上限 | 20 |
每個代理程式的測試案例數量上限 | 2000 |
每個代理程式的變更記錄數量上限 | 20,000 |
每個流程的頁數上限 | 250 |
每個流程的路徑群組數量上限 | 100 |
每個流程的版本數量上限 | 20 |
每個代理程式的意圖數量上限 | 10,000 |
每個流程的參照意圖數量上限 | 2000 |
每個意圖和每種語言的訓練詞組數量上限 (除了「預設排除意圖」) | 2000 |
每個流程和每種語言的訓練詞組數量上限 | 100,000 |
每個意圖的參數數量上限 | 20 |
每個實體的實體項目數量上限 | 30,000 |
每個實體項目的實體同義詞數量上限 | 200 |
每個代理程式和每種語言的實體參考值和同義詞數量上限 | 1,000,000 |
每頁的參數數量上限 | 20 |
每頁的路徑數量上限 | 2000 |
每頁的事件處理常式數量上限 | 100 |
每個路徑群組的路徑數量上限 | 2000 |
每個代理程式的 Playbook 數量上限 | 50 |
單一對話輪次中可叫用的劇本書數量上限 | 3 |
在同一對話回合中,每個 Playbook 叫用作業的 LLM 呼叫數量上限 | 10 |
每個代理程式的劇本範例數量上限 | 使用預設的範例擷取策略時,系統會根據範例與工作階段內容的關聯性,自動限制範例數量,以符合所用模型的符記限制。 |
每個劇本的版本數量上限 | 100 |
每個代理程式的工具數量上限 | 100 |
Dialogflow ES 服務代理人
說明 | 限制 |
---|---|
每個區域和每項 Google Cloud 專案的代理程式數量上限 ¶ | 1 |
每項專案的電話號碼數量上限 (global 區域除外) |
5 |
每個專案在每個區域的電話號碼數量上限 (global 區域除外) |
5 |
意圖數量上限 | 2000 |
實體類型數量上限 | 250 |
每個意圖和每種語言的訓練詞組數量上限 | 2000 |
每個代理程式和每種語言的訓練詞組數量上限 | 100,000 |
實體項目數量上限 | 30000 |
每個實體項目的實體同義詞數量上限 | 200 |
每個代理程式和每種語言的實體參考值和同義詞數量上限 | 1,000,000 |
每個意圖的參數數量上限 | 20 |
每個意圖的輸入背景資訊數量上限 | 5 |
每個意圖的輸出背景資訊數量上限 | 30 |
每個意圖和每種語言的文字回應數量上限 | 30 |
每項參數和每種語言的提示數量上限 | 30 |
每個代理程式的環境數量上限 | 10 |
每個代理程式的版本數量上限 | 1000 |
¶ | 每個帳戶的代理程式數量上限取決於您可以在帳戶中建立的 Google 專案數量。請參閱如何要求更多專案。 |
Agent Assist
如果您使用的是 Agent Assist,則「Conversational Agents (Dialogflow CX) Agent」和「Dialogflow ES」分頁下列出的限制,也會根據您使用的代理程式類型而有所不同。
說明 | 限制 |
---|---|
訓練模型所需的對話數量下限 | 30,000 |
每個專案同時訓練的模型數量上限 | 1 |
每項專案的電話號碼數量上限 (global 區域除外) |
5 |
每個專案在每個區域的電話號碼數量上限 (global 區域除外) |
5 |
每個月的訓練節點 GPU 小時數上限 | 4200 |
對話設定檔數量上限 | 100 |
時間限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
每個 Webhook 的逾時時間上限 | 30 秒 |
音訊輸入內容長度上限 | 120 秒 |
Dialogflow ES 服務代理人
說明 | 限制 |
---|---|
Webhook 逾時上限 | 5 秒 |
電話通話時間上限 | 3.5 小時 |
長度限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
訓練詞組長度上限 | 768 個字元 |
文字回應長度上限 | 4,000 個字元 |
由非生成意圖或參數比對的偵測意圖文字輸入長度上限 | 256 個字元 |
Dialogflow ES 服務代理人
說明 | 限制 |
---|---|
代理程式名稱長度下限 | 1 個字元 |
代理程式名稱長度上限 | 150 個字元 |
代理程式說明長度上限 | 500 個字元 |
意圖名稱長度上限 | 100 個字元 |
實體類型名稱長度上限 | 30 個字元 |
訓練詞組長度上限 | 768 個字元 |
動作名稱長度上限 | 250 個字元 |
背景資訊名稱長度上限 | 250 個字元 |
項目值長度上限 | 512 個字元 |
參數名稱長度上限 | 30 個字元 |
文字回應長度上限 | 4,000 個字元 |
偵測意圖輸入文字長度上限* | 256 個字元 |
事件名稱長度上限 | 150 個字元 |
* | 這項限制由 Dialogflow 服務強制執行。如果您使用的是整合項目,整合平台的限制可能更為嚴格。詳情請參閱整合項目的詳細資料。 |
大小限制
Conversational Agents (Dialogflow CX) Agent
說明 | 限制 |
---|---|
語音合成要求大小上限 | 請參閱 TTS API 內容限制 |
工具規格大小上限 | 20KB |
Dialogflow ES 服務代理人
說明 | 限制 |
---|---|
匯入/還原代理程式時,系統允許的代理程式大小上限 (未壓縮的內容) | 50 MB |
語音合成要求大小上限 | 請參閱 TTS API 內容限制 |