Dieses Dokument enthält die häufigsten Kontingente und Limits für die Nutzung von Dialogflow. Informationen dazu, wie Sie eine vollständige Liste der Kontingente und Limits finden, finden Sie unten. Wir behalten uns das Recht vor, diese Beschränkungen zu ändern. Die Seite wird bei Änderungen entsprechend aktualisiert.
Kontingente
Kontingente sind für Ihr Projekt geltende Standardbeschränkungen. Bei der Verwendung generativer Funktionen hat jede Kombination aus Modell und Region ein eigenes generatives Kontingent. Wenn Sie eine Bezahlversion verwenden, können Sie eine Kontingenterhöhung anfordern. Kontingente haben den Zweck, die Dienstlast pro Client zu beschränken. So werden Dienste nicht überlastet und es kommt zu keiner unerwartet hohen Ressourcennutzung auf einem Client.
Die Dialogflow-Kontingente hängen von der Version Ihres Agents ab. Sie gelten für alle Projekte sowie für sämtliche Anwendungen und IP-Adressen, die von diesem Projekt verwendet werden.
Details zur Kontingentzeitgrenze:
- Die monatlichen Kontingente werden am 1. eines jeden Monats um 12:00 Uhr (Pacific Time) aufgefüllt.
- Tageskontingente werden täglich um 12:00 Uhr (Pacific Time) aufgefüllt. Wenn die Umstellung der Pacific Time auf Winterzeit den Tag verlängert, wird ein proportionaler Kontingentrabatt gewährt. Wenn die Umstellung auf die Sommerzeit erfolgt, ist jedoch kein Abzug für den kürzeren Tag möglich.
- Minutenkontingente werden alle 60 Sekunden zur vollen Minute aktualisiert.
Die in der Kontingenttabelle aufgeführten Kontingente sind die häufigsten. Informationen zu allen Kontingenten finden Sie auf der Seite Dialogflow-Kontingente in derGoogle Cloud -Konsole.
Kontingente für generative KI
Wenn Ihr Agent generative Funktionen von Conversational Agents (Dialogflow CX) verwendet, gelten für jede Kombination aus Modell und Region eigene Kontingente.
Kontingent-ID
Das ConversationalAgentLlmTokenConsumption
-Kontingent ist ein regionales Kontingent, mit dem die Tokennutzung für Large Language Models (LLMs) in Konversations-Agents (Dialogflow CX) erfasst wird.
Dieses Kontingent wird für verschiedene LLM-Basismodelle gemessen und unterstützt derzeit die folgenden Modelle:
- gemini-1.5-pro
- gemini-1.5-pro-002
- gemini-1.5-flash
- gemini-1.5-flash-002
- gemini-2.0-flash-001
- gemini-2.0-flash-lite-001
- gemini-2.5-flash
- gemini-2.5-flash-lite
Das ConversationalAgentLlmTokenConsumption
-Kontingent erfasst die LLM-Tokennutzung für die folgenden Conversational Agents-Funktionen (Dialogflow CX):
- Generatoren
- Generativer Fallback
- Playbook
- Datastore
Das Standardlimit für das ConversationalAgentLlmTokenConsumption
-Kontingent beträgt 600.000 Tokens pro Minute.
Anfrage zur Kontingenterhöhung für mehrere Regionen
Wenn Sie eine Kontingenterhöhung für eine Multi-Region anfordern müssen, senden Sie Ihre Anfrage für eine der folgenden spezifischen Regionen:
- Verwenden Sie für Agents in den Multiregionen US und Global die Region us-central1.
- Verwenden Sie für Agents in der Multiregion EU europe-west4.
Tokennutzung nach Region und Modell visualisieren
So erhalten Sie mit dem Metrics Explorer Einblicke in den LLM-Tokenverbrauch in verschiedenen Regionen und Modellen:
- Auf den Metrics Explorer zugreifen:Öffnen Sie den Metrics Explorer.
- Messwert auswählen:Wählen Sie
Conversational Agent LLM tokens quota usage
als Messwert aus, den Sie analysieren möchten. - Aggregation und Ausrichter konfigurieren:
- Legen Sie die Aggregatfunktion auf
Sum
fest, um die Gesamtzahl der verwendeten Tokens zu ermitteln. - Klicken Sie auf
Configure Aligner
, um die Berechnung von Änderungen zwischen aufeinanderfolgenden Datenpunkten in Ihrer Zeitreihe zu aktivieren. So lassen sich Nutzungstrends im Zeitverlauf besser nachvollziehen.
- Legen Sie die Aggregatfunktion auf
- Aggregationsdimensionen definieren:Wenn Sie die Tokennutzung aufschlüsseln möchten, wählen Sie
location
undbase_model
als Dimensionen für die Aggregation aus. So können Sie sehen, wie sich der Tokenverbrauch in verschiedenen Regionen und Modellen unterscheidet. - Aligner-Funktion festlegen:Wählen Sie
Sum
als Aligner-Funktion aus, um die Gesamtänderung der Tokennutzung zwischen aufeinanderfolgenden Datenpunkten zu berechnen.
Anfrage zur Kontingenterhöhung
Bei Bedarf können Sie eine Anpassung der Kontingenterhöhung anfordern.
Wenn Sie verschiedene Projekte für Dialogflow-Agents und zur Authentifizierung über Dienstkonten verwenden, fordern Sie eine Kontingenterhöhung für das Nutzerprojekt an. Weitere Informationen finden Sie unter Mehrere Projekte für Dialogflow ES verwenden oder Mehrere Projekte für Conversational Agents (Dialogflow CX) verwenden.
Dialogflow ES-Agents müssen ein Upgrade auf die Dialogflow Essentials-Version durchführen, bevor Sie eine Kontingenterhöhung anfordern können.
Tabelle mit den Kontingenten
Die folgenden Begriffe werden verwendet, um die Preise und Kontingente zu beschreiben:
- Anfrage: Eine Anfrage wird als ein API-Aufruf des Dialogflow-Dienstes definiert, sei es direkt mit der API oder indirekt mit Einbindung oder unter Verwendung der Console. Je nach Aufgabe und Aufbau des Agents kann eine sehr unterschiedliche Anzahl von Anfragen erforderlich sein, damit ein Endnutzer eine Aufgabe mit einem Dialogflow-Agent ausführen kann.
- Sitzung:
Eine Sitzung steht für eine Unterhaltung zwischen einem Dialogflow-Agent und einem Endnutzer.
Eine Sitzung bleibt aktiv und ihre Daten werden 30 Minuten nach dem Senden der letzten Anfrage für die Sitzung gespeichert.
Eine Sitzung kann entweder eine Chatsitzung oder eine Sprachsitzung sein.
- Chatsitzung:Bei einer Chatsitzung wird für Anfragen und Antworten nur Text verwendet.
- Sprachsitzung: Bei einer Sprachsitzung wird für Anfragen, Antworten oder beides Audio verwendet.
- Nutzerprojekte und Ressourcenprojekte: Wenn Sie mehrere Projekte verwenden, ist es möglich, dass das mit der Authentifizierung Ihrer Anfrage verbundene Projekt (Nutzerprojekt) nicht dasselbe Projekt ist, das mit dem Agent in der Anfrage verbunden ist (Ressourcenprojekt). In diesem Fall wird das Nutzerprojekt für die Festlegung von Preisen und Kontingenten verwendet. Weitere Informationen finden Sie unter Mehrere Projekte für Dialogflow ES verwenden oder Mehrere Projekte für konversationelle Agents (Dialogflow CX) verwenden.
Die folgenden Tabellen enthalten einen Kontingentvergleich der Versionen nach Agent-Typ. Die Preise für alle von einer Anfrage verwendeten Features werden kumuliert, es sei denn, ein Feature ist bereits ausdrücklich enthalten.
Konversations-Agents (Dialogflow CX) – Agent
Funktion | Conversational Agents (Dialogflow CX) Edition |
---|---|
Text (enthält alle Anfragen zu DetectIntent, StreamingDetectIntent und FulfillIntent, die keine Audiodaten enthalten) |
1.200 Anfragen pro Minute |
Audioeingabe/-ausgabe (Spracherkennung, Speech-to-Text, STT, Sprachsynthese, Sprachausgabe, Text-to-Speech, TTS, Telefonie) |
600 Anfragen pro Minute |
Audioanfragevorgänge mit Chirp3-HD-Stimme (Sprachsynthese, Text-to-Speech, TTS, Telefonie) |
25 Anfragen pro Minute * |
Generative Funktionen (Playbooks, Datenspeicher, Generatoren, generativer Fallback) |
600.000 Tokens pro Minute (siehe Kontingente für generative KI) |
Dialogflow CX-Telefonie-Gateway Umfasst Audioeingabe und -ausgabe. |
100 vollständige Telefonminuten pro Minute‡ |
Schreibanfragen während der Entwicklung z. B. Aufrufe zum Erstellen oder Aktualisieren eines Agents. |
60 Anfragen pro Minute |
Leseanfragen während der Entwicklung z. B. Aufrufe zum Auflisten oder Abrufen von Agent-Ressourcen. |
300 Anfragen pro Minute |
Andere Sitzungsanfragen z. B. Festlegen oder Abrufen von Sitzungsentitäten. |
100 Anfragen pro Minute |
Symbole | Beschreibung |
---|---|
* | Wenn dieses Kontingent nicht auf der Seite Google Cloud console Dialogflow-Kontingente angezeigt wird, wenden Sie sich an Ihr Kontoteam oder erstellen Sie eine Supportanfrage, wenn Sie eine Kontingenterhöhung benötigen. |
‡ | „Telefonminuten pro Minute“ gibt an, wie lange insgesamt alle Nutzer pro Minute Anrufe über das Telefonsystem tätigen. Beispiel: In einem 60-Sekunden-Zeitraum telefoniert ein Nutzer 60 Sekunden, ein zweiter 30 Sekunden und ein dritter ebenfalls 30 Sekunden. Daraus ergeben sich 2 Telefonminuten pro Minute. Je mehr Telefonminuten pro Minute möglich sind, desto mehr Nutzer können das System gleichzeitig verwenden. |
Dialogflow ES-Agent
Funktion | Testversion | Essentials Edition |
---|---|---|
Text (enthält alle Anfragen zu DetectIntent und StreamingDetectIntent, die keine Audiodaten enthalten) |
180 Anfragen pro Minute | 600 Anfragen pro Minute |
Audioeingabe (auch als Spracherkennung, Speech-to-Text oder STT bezeichnet) |
100 Anfragen pro Minute † 1.000 Anfragen pro Tag † 15.000 Anfragen pro Monat † Maximal 60 Sekunden Audiolänge pro Anfrage † |
300 Anfragen pro Minute † Maximal 60 Sekunden Audiolänge pro Anfrage † |
Audioausgabe (auch als Sprachsynthese, Text-to-Speech oder TTS bezeichnet) |
Wie Audioeingabe | Wie Audioeingabe |
Wissensconnectors (Beta) | Maximal 10 MB Gesamtgröße des Dokuments 1.000 Anfragen pro Monat 100 Anfragen pro Tag |
Unbegrenzt |
Sentimentanalyse | Nicht verfügbar | Unbegrenzt |
Dialogflow ES-Telefonie-Gateway Umfasst Audioeingabe und -ausgabe. |
Gebührenfreie Nummer: nicht verfügbar 3 vollständige Telefonminuten pro Minute ‡ 30 Telefonminuten pro Tag 500 Telefonminuten pro Monat Telefonnummer für 30 Tage reserviert |
100 vollständige Telefonminuten pro Minute‡ |
Mega-Agent | 1.000 Anfragen pro Tag | Unbegrenzt |
Schreibanfragen während der Entwicklung z. B. Aufrufe zum Erstellen oder Aktualisieren eines Agents. |
60 Anfragen pro Minute | 60 Anfragen pro Minute |
Leseanfragen während der Entwicklung z. B. Aufrufe zum Auflisten oder Abrufen von Agent-Ressourcen. |
60 Anfragen pro Minute | 60 Anfragen pro Minute |
Andere Sitzungsanfragen z. B. Festlegen oder Abrufen von Sitzungsentitäten oder Aktualisieren/Abfragen von Kontext. |
100 Anfragen pro Minute | 100 Anfragen pro Minute |
Symbole | Beschreibung |
---|---|
† | Jeder StreamingDetectIntent-Stream wird als Einzelanfrage erfasst, auch wenn der Stream mehrere Frames von StreamingDetectIntentRequest -Audio enthält. |
‡ | „Telefonminuten pro Minute“ gibt an, wie lange insgesamt alle Nutzer pro Minute Anrufe über das Telefonsystem tätigen. Beispiel: In einem 60-Sekunden-Zeitraum telefoniert ein Nutzer 60 Sekunden, ein zweiter 30 Sekunden und ein dritter ebenfalls 30 Sekunden. Daraus ergeben sich 2 Telefonminuten pro Minute. Je mehr Telefonminuten pro Minute möglich sind, desto mehr Nutzer können das System gleichzeitig verwenden. |
# | Als „Unbegrenzt“ gekennzeichnete Features können durch die Nutzung anderer Features begrenzt sein. Wenn Ihre Version beispielsweise ein unbegrenztes Kontingent für Wissensconnectors bietet, sind Textanfragen, die Wissensconnectors verwenden, durch das Kontingent für Textanfragen begrenzt. |
¶ | Audioeingaben und -ausgaben in Google Assistant gelten als Textanfragen. |
Agent Assist
Wenn Sie Agent Assist verwenden, gelten die unter den Tabs Conversational Agents (Dialogflow CX) Agent und Dialogflow ES-Agent aufgeführten Kontingente entsprechend dem verwendeten Agent-Typ.
Funktion | Testversion | Essentials Edition |
---|---|---|
Agent Assist-Unterhaltungen – andere Aktionen Umfasst alle Anfragen, mit denen Unterhaltungen und Teilnehmer verwaltet werden können. |
Nicht verfügbar | 300 Anfragen pro Minute |
Agent Assist-Analyse von Text/Audio-Vorgängen Enthält alle AnalyzeContent- oder StreamingAnalyzeContent-Anfragen für alle Unterhaltungsphasen. Dazu gehören alle Anfragen, die Text, Sprachsynthese und/oder Spracherkennung umfassen. |
Nicht verfügbar | 300 Anfragen pro Minute |
Polling-Anfragen für Vorschläge für Agent Assist-Unterhaltungszusammenfassungen Umfasst alle Anfragen zum Abrufen von Unterhaltungszusammenfassungen. |
Nicht verfügbar | 60 Anfragen pro Minute |
Agent Assist-SearchKnowledge-Anfragen Enthält alle SearchKnowledge-Anfragen für alle Unterhaltungsphasen. |
Nicht verfügbar | 60 Anfragen pro Minute |
Limits
Limits sind feste Beschränkungen und können nicht erhöht werden. Für viele Ressourcen und Felder gelten Limits hinsichtlich der Anzahl, Dauer oder Länge. Diese Beschränkungen sind für die Implementierung des Dienstes erforderlich.
In den folgenden Tabellen sind die häufigsten Limits aufgeführt. Weitere Limits finden Sie in der Dokumentation zu bestimmten Features und in der API-Referenzdokumentation.
Anzahllimits
Konversations-Agents (Dialogflow CX) – Agent
Beschreibung | Limit |
---|---|
Maximale Anzahl Agents pro Google Cloud Projekt | 1000 |
Maximale Anzahl von Telefonnummern pro Projekt (außer für die Region global ) |
5 |
Maximale Anzahl von Telefonnummern pro Projekt und Region (außer global ) |
5 |
Maximale Anzahl Abläufe pro Agent | 50 |
Maximale Anzahl Entitätstypen pro Agent | 250 |
Maximale Anzahl Webhooks pro Agent | 100 |
Maximale Anzahl Umgebungen pro Agent | 20 |
Maximale Anzahl Testläufe pro Agent | 2000 |
Maximale Anzahl von Versionshinweisen pro Agent | 20.000 |
Maximale Anzahl Seiten pro Ablauf | 250 |
Maximale Anzahl Route-Gruppen pro Ablauf | 100 |
Maximale Anzahl Versionen pro Ablauf | 20 |
Maximale Anzahl von Intents pro Agent | 10.000 |
Maximale Anzahl referenzierter Intents pro Ablauf | 2.000 |
Maximale Anzahl Trainingsformulierungen pro Intent und Sprache (außer „Standardmäßig auszuschließender Intent“) | 2000 |
Maximale Anzahl Trainingsformulierungen pro Ablauf und Sprache | 100.000 |
Maximale Anzahl Parameter pro Intent | 20 |
Maximale Anzahl Entitätseinträge pro Entität | 30.000 |
Maximale Anzahl Entitätssynonyme pro Entitätseintrag | 200 |
Maximale Anzahl Entitätsreferenzwerte und -synonyme pro Agent und Sprache | 1.000.000 |
Maximale Anzahl Parameter pro Seite | 20 |
Maximale Anzahl Routes pro Seite | 2000 |
Maximale Anzahl Event-Handler pro Seite | 100 |
Maximale Anzahl Routes pro Route-Gruppe | 2000 |
Maximale Anzahl von Playbooks pro Agent | 50 |
Maximale Anzahl von Playbook-Aufrufen in einer Unterhaltungsrunde | 3 |
Maximale Anzahl von LLM-Aufrufen pro Playbook-Aufruf im selben Gesprächsabschnitt | 10 |
Maximale Anzahl von Playbook-Beispielen pro Agent | Bei der standardmäßigen Strategie zum Abrufen von Beispielen wird die Anzahl der Beispiele automatisch an das Tokenlimit des verwendeten Modells angepasst. Dabei wird die Relevanz der Beispiele für den Sitzungskontext berücksichtigt. |
Maximale Anzahl von Versionen pro Playbook | 100 |
Maximale Anzahl von Tools pro Agent | 100 |
Dialogflow ES-Agent
Beschreibung | Limit |
---|---|
Maximale Anzahl Agents pro Region und Google Cloud-Projekt | 1 |
Maximale Anzahl von Telefonnummern pro Projekt (außer für die Region global ) |
5 |
Maximale Anzahl von Telefonnummern pro Projekt und Region (außer global ) |
5 |
Maximale Anzahl Intents | 2.000 |
Maximale Anzahl an Entitätstypen | 250 |
Maximale Anzahl von Trainingsformulierungen pro Intent und Sprache | 2000 |
Maximale Anzahl von Trainingsformulierungen pro Agent und Sprache | 100.000 |
Maximale Anzahl an Entitätseinträgen | 30.000 |
Maximale Anzahl an Entitätssynonymen pro Entitätseintrag | 200 |
Maximale Anzahl von Entitätsreferenzwerten und -synonymen pro Agent und Sprache | 1.000.000 |
Maximale Anzahl Parameter pro Intent | 20 |
Maximale Anzahl Eingabekontexte pro Intent | 5 |
Maximale Anzahl Ausgabekontexte pro Intent | 30 |
Maximale Anzahl von Textantworten pro Intent und Sprache | 30 |
Maximale Anzahl Aufforderungen pro Parameter und Sprache | 30 |
Maximale Anzahl Umgebungen pro Agent | 10 |
Maximale Anzahl Versionen pro Agent | 1000 |
¶ | Die maximale Anzahl von Agents pro Konto hängt von der Anzahl der Google-Projekte ab, die Sie in Ihrem Konto erstellen können. Weitere Informationen finden Sie unter Weitere Projekte anfordern. |
Agent Assist
Wenn Sie Agent Assist verwenden, gelten die unter den Tabs Conversational Agents (Dialogflow CX) und Dialogflow ES aufgeführten Limits entsprechend dem verwendeten Agent-Typ.
Beschreibung | Limit |
---|---|
Mindestanzahl der Unterhaltungen, die für das Modelltraining erforderlich sind | 30.000 |
Maximale Anzahl Modelle, die gleichzeitig pro Projekt trainiert werden | 1 |
Maximale Anzahl von Telefonnummern pro Projekt (außer für die Region global ) |
5 |
Maximale Anzahl von Telefonnummern pro Projekt und Region (außer global ) |
5 |
Maximale Anzahl von GPU-Stunden für Trainingsknoten pro Monat | 4200 |
Maximale Anzahl von Unterhaltungsprofilen | 100 |
Dauerlimits
Konversations-Agents (Dialogflow CX) – Agent
Beschreibung | Limit |
---|---|
Maximales Zeitlimit pro Webhook | 30 Sekunden |
Maximale Dauer der Audioeingabe | 120 Sekunden |
Dialogflow ES-Agent
Beschreibung | Limit |
---|---|
Maximales Webhook-Zeitlimit | 5 Sekunden |
Maximale Anrufdauer | 3,5 Stunden |
Längenlimits
Konversations-Agents (Dialogflow CX) – Agent
Beschreibung | Limit |
---|---|
Maximale Länge von Trainingsformulierungen | 768 Zeichen |
Maximale Länge von Textantworten | 4.000 Zeichen |
Maximale Texteingabelänge für die Intent-Erkennung, die von nicht generativen Intents oder Parametern abgeglichen wird | 256 Zeichen |
Dialogflow ES-Agent
Beschreibung | Limit |
---|---|
Mindestlänge des Agent-Namens | 1 Zeichen |
Maximale Länge des Agent-Namens | 150 Zeichen |
Maximale Länge der Agent-Beschreibung | 500 Zeichen |
Maximale Länge von Intent-Namen | 100 Zeichen |
Maximale Länge von Entitätsnamen | 30 Zeichen |
Maximale Länge von Trainingsformulierungen | 768 Zeichen |
Maximale Länge von Aktionsnamen | 250 Zeichen |
Maximale Länge von Kontextnamen | 250 Zeichen |
Maximale Länge von Eingabewerten | 512 Zeichen |
Maximale Länge von Parameternamen | 30 Zeichen |
Maximale Länge von Textantworten | 4.000 Zeichen |
Maximale Texteingabelänge der Intent-Erkennung* | 256 Zeichen |
Maximale Länge von Ereignisnamen | 150 Zeichen |
* | Dieses Limit wird vom Dialogflow-Dienst erzwungen. Bei einer Integration kann für die Integrationsplattform ein geringeres Limit gelten. Informationen dazu finden Sie in den Angaben zur jeweiligen Integration. |
Größenbeschränkungen
Konversations-Agents (Dialogflow CX) – Agent
Beschreibung | Limit |
---|---|
Maximale Größe von Anfragen zur Sprachsynthese | Grenzwerte für TTS API-Inhalte |
Maximale Größe von Tool-Spezifikationen | 20 KB |
Dialogflow ES-Agent
Beschreibung | Limit |
---|---|
Maximale Agent-Größe (nicht komprimierte Inhalte) zum Importieren/Wiederherstellen von Agents | 50 MB |
Maximale Größe von Anfragen zur Sprachsynthese | Grenzwerte für TTS API-Inhalte |