In diesem Dokument sind die für Gemini für Google Cloudgeltenden Kontingente und Limits aufgeführt.
- Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud Diensten wie Gemini für Google Clouddefiniert.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud -Ressource Ihr Google Cloud -Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud -Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud Produkten und ‑Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern und Kontingentanpassungen zu automatisieren
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Für Gemini für Google Cloud werden Kontingente für Anfragen pro Sekunde für jeden Nutzer in einem Projekt erzwungen.
Kontingent | Wert |
---|---|
Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Bei Gemini für Google Cloud wird ein Kontingent für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt erzwungen.
Kontingent | Wert |
---|---|
Anfragen pro Tag für Gemini Code Assist oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. | 6000 |
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans für Datenstatistiken, Metadatengenerierung, Datenvorbereitung und andere Anfragen, für die Antworten im Bereich Cloud Assist in der Google Cloud -Konsole und in IDEs angezeigt werden. | 960 |
Kontingente für Gemini Code Assist
Gemini Code Assist erzwingt Kontingente für bestimmte Funktionen.
Kontingent | Wert |
---|---|
Einbeziehung der lokalen Codebasis | Kontextfenster mit 128.000 Tokens |
Repositories für Codeanpassungen | 20.000 |
Kontingente für den Agent-Modus und die Gemini CLI
Kontingente für Anfragen aus dem Gemini Code Assist-Agentenmodus und der Gemini CLI werden kombiniert. Im Agent-Modus oder bei Verwendung der Gemini CLI kann ein Prompt zu mehreren Anfragen führen.
Kontingent | Gemini Code Assist-Version | Wert |
---|---|---|
Anfragen pro Nutzer und Minute | Standard | 120 |
Unternehmen | 120 | |
Anfragen pro Nutzer und Tag | Standard | 1500 |
Unternehmen | 2000 |
Kontingente für Gemini in BigQuery
Für Funktionen zur Codeunterstützung ist das Kontingent für Gemini Code Assist- und Gemini in BigQuery-Codeanfragen für Funktionen wie Codevervollständigung und ‑generierung identisch.
Für Kunden, die Gemini in BigQuery mit BigQuery On-Demand-Compute oder mit Enterprise- oder Enterprise Plus-Versionen verwenden, werden die Kontingente für erweiterte Funktionen wie Datenstatistiken basierend auf der durchschnittlichen täglichen Nutzung von TiB gescannt oder den Slot-Stunden für den letzten vollständigen Kalendermonat bereitgestellt. Dieses Kontingent gilt auf Organisationsebene und ist für alle Projekte in der Organisation verfügbar. Kontingente werden auf die nächste 100-Slot-Stunde aufgerundet.
Kontingente pro 100 Slot-Stunden (durchschnittliche tägliche Nutzung in der Enterprise- oder Enterprise Plus-Version) oder pro TiB, das mit dem On-Demand-Compute-Modell gescannt wird | Wert |
---|---|
Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, für die Antworten im Bereich Cloud Assist in der Google Cloud Konsole angezeigt werden. | 5 |
Beispiel: Eine Organisation mit einer Enterprise-Reservierung mit 100 Slots als Baseline verwendet durchschnittlich 2.400 Slot-Stunden pro Tag (100 Slots × 24 Stunden = 2.400 Slot-Stunden). Im Folgemonat erhalten sie daher die folgenden täglichen Kontingente:
- 120 Chats, Visualisierungen, Tabellenscans für Data Insights und automatische Metadatengenerierungen pro Tag
Wenn Ihre Organisation bisher keine BigQuery Enterprise- oder Enterprise Plus-Slots oder On-Demand-Compute-Einheiten (TiB) erworben hat, erhalten Sie nach der ersten Nutzung für den ersten vollen Kalendermonat das Standardkontingent für Folgendes:
- 250 Chats, Visualisierungen, Tabellenscans für Data Insights und automatische Metadatengenerierungen pro Tag
Wenn Sie die On-Demand-Compute-Reservierungen der Enterprise- oder Enterprise Plus-Versionen erst Mitte des Monats verwenden, gilt das Standardkontingent bis zum Ende des Folgemonats.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.