Cette page a été traduite par l'API Cloud Translation.

Quotas et limites

Ce document liste les quotas et les limites système qui s'appliquent à Vertex AI Search.

Les quotas ont des valeurs par défaut, mais vous pouvez généralement demander des ajustements.
Les limites système sont des valeurs fixes qui ne peuvent pas être modifiées.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Surveiller votre consommation de produits et services Google Cloud
Limiter votre consommation de ces ressources
Demander des modifications de la valeur du quota et automatiser les ajustements de quota

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Des limites système s'appliquent également aux ressources Vertex AI Search. Elles ne peuvent pas être modifiées.

Les quotas d'allocation

Le tableau suivant répertorie les quotas pour l'API Discovery Engine. Ces quotas ne sont pas réinitialisés au fil du temps. Ils sont libérés lorsque vous libérez la ressource. Vous pouvez demander une augmentation de quota si le quota par défaut ne suffit pas.

Quota	Valeur
Nombre total de data stores par projet	100^*
Nombre total de moteurs par projet	150^†
Nombre d'opérations d'importation de longue durée en attente par projet	300
Nombre d'opérations de longue durée de suppression de documents en attente par projet	100
Nombre de contrôles de diffusion par projet	1 000
Nombre de contrôles de diffusion boostée par configuration de diffusion	100
Nombre de contrôles de diffusion de filtres par configuration de diffusion	100
Nombre de contrôles de diffusion de redirection par configuration de diffusion	100
Nombre de contrôles de diffusion de synonymes par configuration de diffusion	100
Nombre régional de data stores par projet et par emplacement (monde, États-Unis, UE)	100
Nombre régional de documents par projet et par emplacement (monde, États-Unis, UE)	10 000 000
Nombre régional de moteurs par projet et par emplacement (global, États-Unis, Europe)	150
Nombre régional d'événements utilisateur par projet et par emplacement (monde, États-Unis, UE)	40 000 000 000

^* En raison d'une limitation technique, le quota maximal de data stores est de 500 par projet. Si vous avez besoin d'autres data stores, utilisez de nouveaux projets.

^† En raison d'une limitation technique, le quota maximal de moteurs est de 500 par projet. Si vous avez besoin de plus de moteurs, utilisez de nouveaux projets.

Les quotas de débit

Les quotas suivants s'appliquent aux requêtes de l'API Discovery Engine. Si le quota par défaut ne suffit pas, vous pouvez demander une augmentation de quota.

Quota	Valeur
Requêtes complètes par minute et par projet	300
Requêtes de lecture de recherche conversationnelle par minute et par projet	300
Requêtes d'écriture de recherche conversationnelle par minute et par projet	300
Requêtes par lot de documents (comme l'importation et la suppression intégrées) par minute et par projet	100
Requêtes d'importation asynchrone de documents (Cloud Storage, BigQuery, etc.) par minute et par projet	5
Requêtes de suppression de documents par minute et par projet	100
Requêtes de lecture de documents par minute et par projet	300
Requêtes d'écriture de documents par minute et par projet	12 000
Requêtes de création d'évaluations par jour et par projet	5
Requêtes de lecture d'évaluation par minute et par projet	100
Requêtes d'écriture d'évaluation par minute et par projet	100
Requêtes de vérification de l'ancrage de la génération ancrée par minute et par projet	300
Requêtes LLM (résumé de recherche, recherche multitour) par minute et par projet	60
Nombre d'écritures en flux continu FHIR ou BigQuery en attente par minute	6 000
Nombre d'ensembles de requêtes exemples par projet	100
Requêtes API de classement par minute et par projet	500
Recommander des requêtes par minute et par projet	60 000
Exemple de requêtes de lecture par minute et par projet	200
Exemple de requêtes de lecture par minute et par projet	100
Exemple de requêtes d'écriture par minute et par projet	100
Exemple de requêtes d'écriture de requêtes par minute et par projet	200
Requêtes de lecture de schéma par minute et par projet	100
Requêtes d'écriture de schéma par minute et par projet	100
Requêtes de recherche régionales par minute, par projet et par zone géographique (États-Unis, Europe, monde)	300
Requêtes par lot d'événements utilisateur (comme l'importation et la suppression) par minute et par projet	100
Requêtes de collecte d'événements utilisateur par minute, par projet et par utilisateur	240
Nombre de requêtes d'écriture d'événements utilisateur par minute et par projet	60 000

Quota pour l'indexation des pages Web

Lorsque vous disposez d'un data store avec l'option Indexation avancée des sites Web activée, chaque page Web que vous indexez est comptabilisée dans le quota "Nombre de documents par projet" de la liste Quotas d'allocation. Vous pouvez également consulter le nombre de pages de votre projet et le quota de pages pour ce projet dans le champ Pages du projet vs quota de la page Données d'un data store.

Si vous ajoutez des sites Web à un data store dans un projet et que les pages Web de ces sites dépassent le quota du projet, les sites Web ne sont pas indexés. Si votre data store contient des sites Web déjà indexés, ils continueront de l'être comme avant. Vous pouvez demander à augmenter votre quota à tout moment.

Demander une augmentation du quota

Pour ajuster la plupart des quotas, utilisez la console Google Cloud . Pour en savoir plus, consultez la section Demander un ajustement de quota.