Ce document liste les quotas et limites système qui s'appliquent à Gemini pour Google Cloud.
- Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Ils sont définis par des services Google Cloud tels que Gemini pour Google Cloud.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas permet d'effectuer les opérations suivantes :
- Surveiller votre consommation de produits et services Google Cloud
- Limiter votre consommation de ces ressources
- Demander des modifications de la valeur du quota et automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Des limites système s'appliquent également aux ressources Gemini. Elles ne peuvent pas être modifiées.
Requêtes par seconde
Gemini pour Google Cloud applique des quotas de requêtes par seconde pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par seconde | 2 |
Requêtes par jour
Gemini pour Google Cloud applique des quotas pour le nombre total de requêtes par jour pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes de code par jour pour Gemini Code Assist ou Gemini dans BigQuery, comme la génération et la complétion de code. | 6000 |
Requêtes par jour pour le chat, la visualisation, les analyses de tableaux d'insights sur les données, la génération de métadonnées, la préparation des données et les autres requêtes qui affichent des réponses dans le panneau Cloud Assist de la console Google Cloud et des IDE. | 960 |
Quotas pour Gemini Code Assist
Gemini Code Assist applique des quotas pour certaines fonctionnalités.
Quota | Valeur |
---|---|
Visibilité du codebase local | Fenêtre de contexte d'un million de jetons |
Dépôts de personnalisation du code | 20 000 |
Quotas pour le mode Agent et la CLI Gemini
Les quotas pour les requêtes du mode Agent Gemini Code Assist et de la CLI Gemini sont combinés. En mode Agent ou lorsque vous utilisez la CLI Gemini, un prompt peut générer plusieurs requêtes.
Quota | Édition Gemini Code Assist | Valeur |
---|---|---|
Requêtes par utilisateur et par minute | Standard | 120 |
Entreprise | 120 | |
Requêtes par utilisateur et par jour | Standard | 1500 |
Entreprise | 2000 |
Quotas pour Gemini dans BigQuery
Pour les fonctionnalités d'assistance au codage, le quota des requêtes de code Gemini Code Assist et Gemini dans BigQuery pour des fonctionnalités telles que la complétion et la génération de code est le même.
Pour les clients qui utilisent Gemini dans BigQuery avec le calcul à la demande BigQuery, ou avec les éditions Enterprise ou Enterprise Plus, les quotas des fonctionnalités avancées telles que les insights sur les données sont fournis en fonction de l'utilisation moyenne quotidienne des Tio analysés ou des heures d'utilisation des emplacements pour le dernier mois calendaire complet. Ce quota s'applique au niveau de l'organisation et est disponible pour tous les projets de cette organisation. Les quotas sont arrondis à la centaine d'heures d'utilisation des emplacements la plus proche.
Quotas par tranche de 100 heures d'utilisation des emplacements (utilisation quotidienne moyenne de l'édition Enterprise ou Enterprise Plus) ou par Tio analysé à l'aide du modèle de calcul à la demande | Valeur |
---|---|
Requêtes par jour pour le chat, la visualisation, les analyses de tableaux et les autres requêtes qui affichent des réponses dans le panneau Cloud Assist de la console Google Cloud . | 5 |
Exemple : Une organisation qui dispose d'une réservation Enterprise avec 100 emplacements comme référence enregistrera en moyenne 2 400 heures d'utilisation des emplacements par jour (100 emplacements x 24 heures = 2 400 heures d'utilisation des emplacements). Par conséquent, le mois suivant, elle bénéficiera de ces quotas quotidiens :
- 120 requêtes par jour pour le chat, les visualisations, les analyses de tableaux d'insights sur les données et la génération automatique de métadonnées
Si votre organisation n'a pas encore acheté d'emplacements BigQuery Enterprise ou Enterprise Plus, ni de capacité de calcul à la demande (Tio), vous bénéficierez d'un quota par défaut pour le premier mois calendaire complet après votre première utilisation :
- 250 requêtes par jour pour le chat, les visualisations, les analyses de tableaux d'insights sur les données et la génération automatique de métadonnées
Si vous commencez à utiliser des réservations de calcul à la demande, d'édition Enterprise ou d'édition Enterprise Plus en milieu de mois, le quota par défaut s'applique jusqu'à la fin du mois suivant.
Demander une augmentation du quota
Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.