Ce document répertorie les quotas et limites système qui s'appliquent à Gemini pour Google Cloud.
- Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Les quotas sont définis par les services Google Cloud , tels que Gemini pour Google Cloud.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de Google Cloud produits et services
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur du quota et d'automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Des limites système s'appliquent également aux ressources Gemini. Les limites système ne peuvent pas être modifiées.
Requêtes par seconde
Gemini pour Google Cloud applique des quotas de requêtes par seconde pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par seconde | 2 |
Requêtes par jour
Gemini pour Google Cloud applique des quotas pour le nombre total de requêtes par jour pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Nombre de requêtes par jour pour Gemini Code Assist ou Gemini dans BigQuery, comme la génération et la complétion de code. | 6000 |
Requêtes par jour pour les discussions, les visualisations, les analyses de données, la génération de métadonnées, la préparation des données et les autres requêtes qui affichent des réponses dans le panneau Assistance Cloud de la console Google Cloud et des IDE. | 960 |
Quotas pour Gemini Code Assist
Gemini Code Assist applique des quotas pour certaines fonctionnalités.
Quota | Valeur |
---|---|
Visibilité du codebase local | Fenêtre de contexte de 128 000 jetons |
Dépôts de personnalisation du code | 20 000 |
Quotas pour le mode Agent et Gemini CLI
Les quotas pour les requêtes du mode agent Gemini Code Assist et de l'interface de ligne de commande Gemini sont combinés. En mode agent ou lorsque vous utilisez la Gemini CLI, une requête peut générer plusieurs requêtes.
Quota | Édition Gemini Code Assist | Valeur |
---|---|---|
Requêtes par utilisateur et par minute | Standard | 120 |
Entreprise | 120 | |
Requêtes par utilisateur et par jour | Standard | 1500 |
Entreprise | 2000 |
Quotas pour Gemini dans BigQuery
Pour les fonctionnalités d'assistance au codage, le quota des requêtes de code Gemini Code Assist et Gemini dans BigQuery pour des fonctionnalités telles que la complétion et la génération de code est le même.
Pour les clients qui utilisent Gemini dans BigQuery avec le calcul à la demande BigQuery ou avec les éditions Enterprise ou Enterprise Plus, les quotas pour les fonctionnalités avancées telles que les insights sur les données sont fournis en fonction de l'utilisation moyenne quotidienne des Tio analysés ou des heures d'emplacement pour le dernier mois civil complet. Ce quota s'applique au niveau de l'organisation et est disponible pour tous les projets de cette organisation. Les quotas sont arrondis à la centaine d'heures-emplacements la plus proche.
Quotas par tranche de 100 heures d'emplacement (utilisation quotidienne moyenne de l'édition Enterprise ou Enterprise Plus) ou par Tio analysé à l'aide du modèle de calcul à la demande | Valeur |
---|---|
Requêtes par jour pour le chat, la visualisation, les analyses de tables et les autres requêtes qui affichent des réponses dans le panneau Assistance Cloud de la console Google Cloud . | 5 |
Exemple : Une organisation qui dispose d'une réservation Enterprise avec 100 emplacements comme référence utilisera en moyenne 2 400 heures-emplacements par jour (100 emplacements x 24 heures = 2 400 heures-emplacements). Par conséquent, le mois suivant, ils bénéficient des quotas quotidiens suivants :
- 120 discussions, visualisations, analyses de tableaux d'insights sur les données et générations de métadonnées automatisées par jour
Si votre organisation n'a pas encore acheté d'emplacements BigQuery Enterprise ou Enterprise Plus, ni de capacité de calcul à la demande (Tio), vous recevrez le quota par défaut suivant pour le premier mois calendaire complet après votre première utilisation :
- 250 discussions, visualisations, analyses de tables d'insights sur les données et générations de métadonnées automatisées par jour
Si vous commencez à utiliser des réservations de calcul à la demande, Enterprise ou Enterprise Plus en milieu de mois, le quota par défaut s'applique jusqu'à la fin du mois suivant.
Demander une augmentation du quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez Demander un ajustement de quota.