In diesem Dokument sind die Kontingente und Limits für Gemini für Google Cloud aufgeführt.
- Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud-Diensten wie Gemini for Google Cloud definiert.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Gemini-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Anfragen pro Sekunde
Gemini for Google Cloud setzt Kontingente für Anfragen pro Sekunde für jeden Nutzer in einem Projekt durch.
Kontingent | Wert |
---|---|
Anfragen pro Sekunde | 2 |
Anfragen pro Tag
Gemini for Google Cloud setzt Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt durch.
Kontingent | Wert |
---|---|
Anzahl der Anfragen pro Tag für Gemini Code Assist oder Gemini in BigQuery-Codeanfragen, z. B. Codegenerierung und Codevervollständigung. | 6000 |
Anzahl der Anfragen pro Tag für Chat, Visualisierung, Datenanalysen und andere Anfragen, für die Antworten im Bereich Gemini in der Google Cloud Console und in IDEs angezeigt werden. | 240 |
Kontingente für Gemini Code Assist
Für bestimmte Funktionen von Gemini Code Assist gelten Kontingente.
Kontingent | Wert |
---|---|
Einbeziehung der lokalen Codebasis | Kontextfenster mit 128.000 Tokens |
Repositories für Codeanpassungen | 950 |
Kontingente für Gemini in BigQuery
Für Kunden, die Gemini in BigQuery mit der BigQuery Enterprise Plus-Version verwenden, werden die Kontingente basierend auf der durchschnittlichen täglichen Nutzung der Enterprise Plus-Slot-Stunden im letzten vollen Kalendermonat bereitgestellt. Dieses Kontingent gilt für die Organisationsebene und ist für alle Projekte in dieser Organisation verfügbar, denen Slots für die Enterprise Plus-Version zugewiesen sind. Kontingente werden auf die nächsten 100 Slot-Stunden aufgerundet.
Kontingente pro 100 Slot-Stunden (tägliche durchschnittliche Nutzung der Enterprise Plus-Version) | Wert |
---|---|
Codevervollständigungsanfragen pro Tag | 150 |
Codegenerierungsanfragen pro Tag | 10 |
Anzahl der Anfragen pro Tag für Chat, Visualisierung, Tabellenscans und andere Anfragen, für die Antworten im Bereich Gemini in der Google Cloud Console angezeigt werden. | 5 |
Beispiel: Eine Organisation mit einer Reservierung für die Enterprise Plus-Version mit 100 Slots als Baseline nutzt durchschnittlich 2.400 Slotstunden pro Tag (100 Slots × 24 Stunden = 2.400 Slotstunden). Im folgenden Monat erhält er daher die folgenden täglichen Kontingente:
- 3.600 Codevervollständigungsanfragen pro Tag
- 240 Codegenerierungsanfragen pro Tag
- 120 Tabellenscans für Chats, Visualisierungen und Datenerkenntnisse pro Tag
Wenn Ihre Organisation bisher keine Reservierungen für die BigQuery Enterprise Plus-Version gekauft hat, erhalten Sie nach dem Kauf einer Reservierung für die Enterprise Plus-Version für den ersten vollen Kalendermonat das Standardkontingent der folgenden Ressourcen:
- 7.500 Codevervollständigungsanfragen pro Tag
- 500 Codegenerierungsanfragen pro Tag
- 250 Tabellenscans für Chats, Visualisierungen und Datenstatistiken pro Tag
Wenn Sie erst Mitte des Monats mit der Verwendung von Reservierungen für die Enterprise Plus-Version beginnen, gilt das Standardkontingent bis zum Ende des Folgemonats.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.