Ce document répertorie les quotas et limites système qui s'appliquent à Gemini pour Google Cloud.
- Les quotas spécifient la quantité d'une ressource partagée dénombrable que vous pouvez utiliser. Les quotas sont définis par des services Google Cloud tels que Gemini pour Google Cloud.
- Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.
Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de produits et services Google Cloud
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur du quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.
Des limites système s'appliquent également aux ressources Gemini. Les limites système ne peuvent pas être modifiées.
Requêtes par seconde
Gemini pour Google Cloud applique des quotas sur le nombre de requêtes par seconde pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par seconde | 2 |
Requêtes par jour
Gemini pour Google Cloud applique des quotas au nombre total de requêtes par jour pour chaque utilisateur d'un projet.
Quota | Valeur |
---|---|
Requêtes par jour pour Gemini Code Assist ou Gemini dans les requêtes de code BigQuery, telles que la génération et la complétion de code. | 6000 |
Requêtes par jour pour le chat, la visualisation, l'analyse des tableaux d'insights sur les données et d'autres requêtes qui affichent des réponses dans le volet Gemini de la console Google Cloud et des IDE. | 240 |
Quotas pour Gemini Code Assist
Gemini Code Assist applique des quotas pour certaines fonctionnalités.
Quota | Valeur |
---|---|
Visibilité du codebase local | Fenêtre de contexte de 128 000 jetons |
Dépôts de personnalisation du code | 950 |
Quotas pour Gemini dans BigQuery
Pour les clients qui utilisent Gemini dans BigQuery avec l'édition BigQuery Enterprise Plus, les quotas sont fournis en fonction de l'utilisation moyenne quotidienne des heures d'emplacement Enterprise Plus pour le dernier mois calendaire complet. Ce quota s'applique au niveau de l'organisation et est disponible pour tous les projets de cette organisation auxquels des emplacements de l'édition Enterprise Plus sont attribués. Les quotas sont arrondis à la centaine d'emplacements-heures d'utilisation la plus proche.
Quotas par 100 emplacements-heures (utilisation moyenne quotidienne de l'édition Enterprise Plus) | Valeur |
---|---|
Requêtes de complétion de code par jour | 150 |
Requêtes de génération de code par jour | 10 |
Requêtes par jour pour le chat, la visualisation, l'analyse de tableaux et d'autres requêtes qui affichent des réponses dans le volet Gemini de la console Google Cloud. | 5 |
Exemple: Une organisation qui dispose d'une réservation de l'édition Enterprise Plus avec 100 emplacements de référence utilisera en moyenne 2 400 emplacements-heures par jour (100 emplacements * 24 heures = 2 400 emplacements-heures). Par conséquent, le mois suivant, il reçoit les quotas quotidiens suivants:
- 3 600 requêtes de saisie de code par jour
- 240 requêtes de génération de code par jour
- 120 analyses de tableaux de chat, de visualisation et d'insights sur les données par jour
Si votre organisation n'a jamais acheté de réservations pour l'édition BigQuery Enterprise Plus jusqu'à présent, vous recevrez le quota par défaut des éléments suivants pour le premier mois calendaire complet:
- 7 500 requêtes de complétion de code par jour
- 500 requêtes de génération de code par jour
- 250 analyses de tables Chat, de visualisations et d'insights sur les données par jour
Si vous commencez à utiliser des réservations pour l'édition Enterprise Plus en milieu de mois, le quota par défaut s'applique jusqu'à la fin du mois suivant.
Demander une augmentation du quota
Vous allez utiliser la console Google Cloud pour ajuster la plupart des quotas. Pour en savoir plus, consultez la section Demander un ajustement de quota.