Diese Seite wurde von der Cloud Translation API übersetzt.

Kontingente und Limits

In diesem Dokument sind die Kontingente und Systemlimits für AI Applications aufgeführt.

Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud Diensten wie AI Applications definiert.
Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud -Ressource Ihr Google Cloud -Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud -Ressourcen.

Das Cloud-Kontingentsystem ermöglicht Folgendes:

Ihren Verbrauch von Google Cloud Produkten und ‑Diensten überwachen
Ihren Verbrauch dieser Ressourcen einschränken
Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern und Kontingentanpassungen zu automatisieren

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.

Kontingente gelten in der Regel auf Google Cloud Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

Für AI Applications-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.

Zuteilungskontingente

Die folgenden Kontingente werden im Laufe der Zeit nicht zurückgesetzt. Stattdessen werden sie freigegeben, wenn Sie die Ressource freigeben. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung anfordern.

Kontingent	Wert
Anzahl der Dokumente pro Projekt	10.000.000
Anzahl der Datenspeicher pro Projekt	100^*
Anzahl der Engines pro Projekt	150^†
Anzahl der ausstehenden lang andauernden Importvorgänge pro Projekt	300
Anzahl der ausstehenden lang andauernden Vorgänge zum Bereinigen von Dokumenten pro Projekt	100
Anzahl der Bereitstellungssteuerungen pro Projekt	1.000
Anzahl der Steuerelemente für die Boost-Bereitstellung pro Bereitstellungskonfiguration	100
Anzahl der Filter-Serving-Steuerelemente pro Serving-Konfiguration	100
Anzahl der Weiterleitungssteuerungen pro Bereitstellungskonfiguration	100
Anzahl der Synonym-Bereitstellungssteuerungen pro Bereitstellungskonfiguration	100
Anzahl der Nutzerereignisse pro Projekt	40.000.000.000
Regionale Anzahl von Datenspeichern pro Projekt und Standort für „Global“ oder `global`	100
Regionale Anzahl der Datenspeicher pro Projekt und Standort für die multiregionale EU oder `eu`	100
Regionale Anzahl der Datenspeicher pro Projekt und Standort für die multiregionale Region USA oder `us`	100
Regionale Anzahl der Dokumente pro Projekt und Standort für „Global“ oder `global`	10.000.000
Regionale Anzahl der Dokumente pro Projekt und Standort für die multiregionale EU oder `eu`	10.000.000
Regionale Anzahl der Dokumente pro Projekt und Standort für die multiregionale US-Region oder `us`	10.000.000
Regionale Anzahl von Engines pro Projekt und Standort für Global oder `global`	150
Regionale Anzahl von Engines pro Projekt und Standort für die EU-Multiregion oder `eu`	150
Regionale Anzahl von Engines pro Projekt und Standort für die US-Multiregion oder `us`	150
Regionale Anzahl der Nutzerereignisse pro Projekt und Standort für „Global“ oder `global`	40.000.000.000
Regionale Anzahl der Nutzerereignisse pro Projekt und Standort für die EU-Multiregion oder `eu`	40.000.000.000
Regionale Anzahl der Nutzerereignisse pro Projekt und Standort für multiregionale US-Standorte oder `us`	40.000.000.000

^* Aufgrund einer technischen Einschränkung beträgt das maximale Kontingent für Datenspeicher 500 pro Projekt. Wenn Sie weitere Datenspeicher benötigen, verwenden Sie neue Projekte.

^† Aus technischen Gründen beträgt das maximale Kontingent für Engines 500 pro Projekt. Wenn Sie mehr Engines benötigen, verwenden Sie neue Projekte.

Ratenkontingente

Für AI Applications API-Anfragen gelten die folgenden Kontingente. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung anfordern.

Kontingent	Wert
Vollständige Anfragen pro Minute und Projekt	300
Leseanfragen für die konversationelle Suche pro Minute und Projekt	300
Schreibanfragen für die konversationelle Suche pro Minute und Projekt	300
Dokument-Batchanfragen (z. B. Inline-Import und Bereinigung) pro Minute und Projekt	100
Dokumentieren Sie asynchrone Importanfragen (Cloud Storage, BigQuery usw.) pro Minute und Projekt.	5
Anfragen zum Löschen von Dokumenten pro Minute und Projekt	100
Dokumentleseanfragen pro Minute und Projekt	300
Dokumentschreibanfragen pro Minute und Projekt	12.000
Erstellungsanfragen für Bewertungen pro Tag und Projekt	5
Leseanfragen für die Bewertung pro Minute und Projekt	100
Bewertungsschreibanfragen pro Minute und Projekt	100
LLM-Anfragen (Zusammenfassung der Suche, Suche mit mehreren Anfragen) pro Minute und Projekt	60
Anzahl der ausstehenden FHIR- oder BigQuery-Streaming-Schreibvorgänge pro Minute	6.000
Anzahl der Beispielabfragesätze pro Projekt	100
Ranking API-Anfragen pro Minute und Projekt	500
Empfehlungsanfragen pro Minute und Projekt	60.000
Leseanfragen für Beispielabfragen pro Minute und Projekt	200
Leseanfragen für Beispielanfragesätze pro Minute und Projekt	100
Schreibanfragen für Beispielanfragesätze pro Minute und Projekt	100
Beispiel für Schreibanfragen pro Minute und Projekt	200
Schemaleseanfragen pro Minute und Projekt	100
Schema-Schreibanfragen pro Minute und Projekt	100
Suchanfragen pro Minute und Projekt	300
Batchanfragen für Nutzerereignisse (z. B. Import und Bereinigung) pro Minute und Projekt	100
Anfragen zum Erfassen von Nutzerereignissen pro Minute, Projekt und Nutzer	240
Schreibanfragen für Nutzerereignisse pro Minute und Projekt	60.000

Kontingent für die Indexierung von Webseiten

Wenn Sie einen Datenspeicher mit aktivierter erweiterter Website-Indexierung haben, wird jede von Ihnen indexierte Webseite auf das Kontingent „Anzahl der Dokumente pro Projekt“ in der Liste Zuweisungskontingente angerechnet. Die Anzahl der Seiten in Ihrem Projekt und das Seitenkontingent für dieses Projekt finden Sie auch auf der Seite Daten eines Datenspeichers im Feld Projektseiten im Vergleich zum Kontingent.

Wenn Sie einem Datenspeicher in einem Projekt Websites hinzufügen und die Webseiten auf diesen Websites das Kontingent des Projekts überschreiten, werden die Websites nicht indexiert. Wenn in Ihrem Datenspeicher Websites vorhanden sind, die bereits indexiert sind, werden diese weiterhin wie bisher indexiert. Sie können jederzeit ein Upgrade für Ihr Kontingent anfordern.

Kontingenterhöhung anfordern

Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.