Kontingente und Limits

In diesem Dokument sind die Kontingente und Limits für Vertex AI Agent Builder aufgeführt.

  • Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud-Diensten wie Vertex AI Agent Builder definiert.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

  • Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
  • Ihren Verbrauch dieser Ressourcen einschränken
  • Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Für Vertex AI Agent Builder-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.

Zuteilungskontingente

Die folgenden Kontingente werden im Laufe der Zeit nicht zurückgesetzt und stattdessen freigegeben, wenn Sie die Ressource freigeben:

Kontingente Wert
Anzahl der Dokumente pro Projekt 1.000.000
Anzahl der Dokumente pro Organisation 5.000.000
Anzahl der ausstehenden lang andauernden Importvorgänge pro Projekt 300
Anzahl der ausstehenden lang andauernden Importvorgänge pro Organisation 1500
Anzahl der ausstehenden lang andauernden Vorgänge zum Löschen von Dokumenten pro Projekt 100
Anzahl der ausstehenden lang andauernden Vorgänge zum Löschen von Dokumenten pro Organisation 500
Anzahl der Bereitstellungssteuerungen pro Projekt 1.000
Anzahl der Steuerelemente für die optimierte Auslieferung pro Bereitstellungskonfiguration 100
Anzahl der Filterbereitstellungssteuerungen pro Bereitstellungskonfiguration 100
Anzahl der Steuerelemente für die Weiterleitungsbereitstellung pro Bereitstellungskonfiguration 100
Anzahl der Steuerelemente für die Bereitstellung von Synonyme pro Bereitstellungskonfiguration 100
Anzahl der Nutzerereignisse pro Projekt 40.000.000.000
Anzahl der Nutzerereignisse pro Organisation 200.000.000.000

Anfragekontingente

Für Vertex AI Agent Builder-Anfragen gelten die folgenden Kontingente:

Kontingente Wert
Abgeschlossene Abfrageanfragen pro Minute und Projekt 300
Abgeschlossene Abfrageanfragen pro Minute und Organisation 1.500
Leseanfragen pro Minute und Projekt für die Konversationssuche 300
Leseanfragen der Konversationssuche pro Minute und Organisation 500
Schreibanfragen pro Minute und Projekt für die Konversationssuche 300
Schreibanfragen für die Konversationssuche pro Minute und Organisation 500
Batchanfragen pro Minute und Projekt 100
Batchanfragen für Dokumente pro Minute und Organisation 500
Leseanfragen pro Minute und Projekt 300
Dokumentleseanfragen pro Minute und Organisation 1500
Schreibanfragen pro Minute und Projekt 12.000
Schreibanfragen für Dokumente pro Minute und Organisation 60.000
Anfragen zur Bewertungserstellung pro Tag und Organisation 5
Erstellungsanfragen für Bewertungen pro Tag und Projekt 5
Leseanfragen für die Bewertung pro Minute und Organisation 500
Leseanfragen für die Bewertung pro Minute und Projekt 100
Schreibanfragen für die Bewertung pro Minute und Organisation 500
Schreibanfragen für die Bewertung pro Minute und Projekt 100
LLM-Anfrageanfragen (Suchsummarisierung, mehrstufige Suche) pro Minute und Projekt 15
LLM-Suchanfragen (Suchzusammenfassung, Suche mit mehreren Schritten) pro Minute und Organisation 75
Anzahl der ausstehenden FHIR-/BQ-Streaming-Schreibvorgänge pro Minute 6.000
Anzahl der Beispielabfragesätze pro Organisation 500
Anzahl der Beispielabfragesätze pro Projekt 100
Ranking-API-Anfragen pro Minute und Projekt 500
Empfehlungen pro Minute und Projekt 60.000
Empfehlungen pro Minute und Organisation Unbegrenzt
Beispiel für Leseanfragen pro Minute und Organisation 1000
Beispiel für Leseanfragen pro Minute und Projekt 200
Beispiel für Leseanfragen pro Minute und Organisation 500
Leseanfragen pro Minute und Projekt für Beispielabfragesätze 100
Beispiel für Schreibanfragen pro Minute und Organisation 500
Beispiel für Schreibanfragen pro Minute und Projekt 100
Beispiel für Schreibanfragen pro Minute und Organisation 1000
Beispiel für Schreibanfragen pro Minute und Projekt 200
Schemaleseanfragen pro Minute und Projekt 100
Schemaleseanfragen pro Minute und Organisation 500
Schemaschreibanfragen pro Minute und Projekt 100
Schemaschreibanfragen pro Minute und Organisation 500
Suchanfragen pro Minute und Projekt 300
Suchanfragen pro Minute und Organisation Unbegrenzt
Batchanfragen für Nutzerereignisse (z. B. Import und Löschen) pro Minute und Projekt 100
Batchanfragen für Nutzerereignisse (z. B. Import und Löschen) pro Minute und Organisation 500
Nutzerereignis – Anfragen zum Erfassen pro Minute, Projekt und Nutzer 240
Nutzerereignis – Anfragen zum Erfassen pro Minute, Organisation und Nutzer 1.200
Schreibanfragen für Nutzerereignisse pro Minute und Projekt 60.000
Schreibanfragen für Nutzerereignisse pro Minute und Organisation 300.000

Kontingent für die Indexierung von Webseiten

Wenn für einen Datenspeicher die erweiterte Websiteindexierung aktiviert ist, wird jede von Ihnen indexierte Webseite auf das Kontingent „Anzahl der Dokumente pro Projekt“ in der Liste Allokationskontingente angerechnet. Die Anzahl der Seiten in Ihrem Projekt und das Seitenkontingent für dieses Projekt finden Sie im Feld Projektseiten im Vergleich zum Kontingent auf der Seite Daten für einen Datenspeicher.

Wenn Sie einem Datenspeicher in einem Projekt Websites hinzufügen und das Kontingent für das Projekt durch die Webseiten auf diesen Websites überschritten wird, werden die Websites nicht indexiert. Wenn sich in Ihrem Datenspeicher bereits indexierte Websites befinden, werden diese wie bisher indexiert. Sie können jederzeit ein Upgrade für Ihr Kontingent beantragen.

Kontingenterhöhung anfordern

Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.