In diesem Dokument sind die Kontingente und Limits für Gemini für Google Cloudaufgeführt.
- Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud Diensten wie Gemini für Google Clouddefiniert.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Verbrauch von Google Cloud Produkten und Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern und Kontingentanpassungen zu automatisieren
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud -Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Bei Gemini for Google Cloud werden Kontingente für Anfragen pro Sekunde für jeden Nutzer in einem Projekt erzwungen.
Kontingent | Wert |
---|---|
Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Gemini for Google Cloud erzwingt Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt.
Kontingent | Wert |
---|---|
Anzahl der Anfragen pro Tag für Gemini Code Assist oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. | 6000 |
Anzahl der Anfragen pro Tag für Chat, Visualisierung, Datenerkenntnisse, Tabellenscans, Metadatengenerierung, Datenvorbereitung und andere Anfragen, für die Antworten im Bereich Cloud Assist in der Google Cloud Console und in IDEs angezeigt werden. | 960 |
Kontingente für Gemini Code Assist
Für bestimmte Funktionen gelten bei Gemini Code Assist Quoten.
Kontingent | Wert |
---|---|
Einbeziehung der lokalen Codebasis | Kontextfenster mit 128.000 Tokens |
Repositories für Codeanpassungen | 20.000 |
Kontingente für Gemini in BigQuery
Für Code-Assist-Funktionen ist das Kontingent für Gemini Code Assist und Gemini in BigQuery für Codeanfragen für Funktionen wie Codevervollständigung und Codegenerierung gleich.
Für Kunden, die Gemini in BigQuery mit BigQuery On-Demand-Computing oder mit der Enterprise- oder Enterprise Plus-Version verwenden, werden die Kontingente für erweiterte Funktionen wie Datenerkenntnisse basierend auf der durchschnittlichen täglichen Nutzung von gescannten TiB oder den Slot-Stunden für den letzten vollen Kalendermonat bereitgestellt. Dieses Kontingent gilt für die Organisationsebene und ist für alle Projekte in dieser Organisation verfügbar. Kontingente werden auf die nächste 100-Slot-Stunde aufgerundet.
Kontingente pro 100 Slot-Stunden (tägliche durchschnittliche Nutzung der Enterprise- oder Enterprise Plus-Version) oder pro TiB, die mit dem On-Demand-Rechenmodell gescannt werden | Wert |
---|---|
Anzahl der Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, für die Antworten im Bereich Cloud Assist in der Google Cloud -Konsole angezeigt werden. | 5 |
Beispiel: Eine Organisation mit einer Reservierung für die Enterprise-Version mit 100 Slots als Baseline nutzt durchschnittlich 2.400 Slot-Stunden pro Tag (100 Slots × 24 Stunden = 2.400 Slot-Stunden). Im folgenden Monat erhält er daher die folgenden täglichen Kontingente:
- 120 Scans pro Tag für Chats, Visualisierungen, Tabellen mit Datenanalysen und automatische Metadatengenerierung
Wenn Ihre Organisation bisher keine Slots für die BigQuery Enterprise-Version, die Enterprise Plus-Version oder On-Demand-Rechenleistung (TiB) erworben hat, erhalten Sie nach der ersten Nutzung für den ersten vollen Kalendermonat das Standardkontingent für Folgendes:
- 250 Chats, Visualisierungen, Datenanalysen und automatische Metadatengenerierung pro Tag
Wenn Sie Mitte des Monats mit der Nutzung von On-Demand-Reservierungen, der Enterprise-Version oder der Enterprise Plus-Version beginnen, gilt das Standardkontingent bis zum Ende des Folgemonats.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.