Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .
Le système Cloud Quotas effectue les opérations suivantes :
- Surveille votre consommation de Google Cloud produits et services
- Limite votre consommation de ces ressources
- Permet de demander des modifications de la valeur du quota et d'automatiser les ajustements de quota
Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.
Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.
Des limites s'appliquent également aux ressources Vertex AI. Ces limites ne sont pas liées au système de quotas. Les limites ne peuvent pas être modifiées.
Quotas de requêtes
Les quotas suivants s'appliquent aux requêtes de Vertex AI pour un projet et une région compatible donnés. Par exemple, pour un seul et même projet, vous pouvez envoyer jusqu'à 30 000 requêtes d'inférence en ligne par minute dans une région et 30 000 requêtes d'inférence en ligne par minute dans une autre région compatible.
Type de demande | Requêtes par minute |
---|---|
Requêtes de gestion des ressources (CRUD)1 | 600 |
Requêtes d'envoi de jobs ou d'opérations de longue durée (LRO) | 60 |
Requêtes d'inférence en ligne2 | 30 000 |
Débit des requêtes d'inférence en ligne | 1,5 Go |
Requêtes d'explication en ligne | 600 |
Requêtes de lecture de séries temporelles Vertex AI TensorBoard | 60 000 |
Requêtes de métadonnées de ML (CRUD) | 12 000 |
Requêtes de mise en cache de l'IA générative (CRUD) | 200 |
Requêtes Vertex AI Vizier (CRUD) | 6 000 |
Requêtes de livraison en ligne Vertex AI Feature Store | 300 000 |
Requêtes Vertex ML Metadata | 12 000 |
Nombre de requêtes de jetons de décompte ou de jetons de calcul | 3 000 |
1 Les requêtes de gestion des ressources incluent toutes les requêtes qui ne correspondent pas à des requêtes de tâche, d'opération de longue durée, d'inférence en ligne, Vertex AI Vizier, de métadonnées ML, de lecture de l'API Vertex AI TensorBoard Timeseries Insights, Vertex AI Feature Store, de flux Vertex AI Feature Store ou de recherche vectorielle.
2 Ce quota s'applique uniquement aux points de terminaison publics.
Les jobs ou opérations de longue durée incluent les requêtes suivantes :
- Créer ou supprimer un ensemble de données.
- Importer ou exporter des données vers ou depuis un ensemble de données.
- Créer un point de terminaison.
- Créer ou supprimer un job personnalisé.
- Créer ou supprimer un job d'étiquetage de données.
- Créer ou supprimer un job de réglage d'hyperparamètres.
- Créer ou supprimer un job d'inférence par lot.
- Créer ou supprimer un modèle.
- Importer, supprimer ou exporter un modèle.
- Créer ou supprimer un modèle d'environnement d'exécution de notebook.
- Attribuer, supprimer, démarrer ou mettre à niveau un environnement d'exécution de notebook.
- Créer, supprimer ou mettre à jour une surveillance de modèle.
- Créer ou supprimer une tâche de surveillance de modèle.
Pour plus d'informations sur les quotas des modèles d'IA générative, consultez la page Quotas et limites de l'IA générative sur Vertex AI.
Quotas de modèles AutoML
Les quotas suivants s'appliquent à chaque type de données et chaque objectif pour un projet et une région donnés. Par exemple, dans un projet et une région donnés, vous pouvez déployer 10 modèles de classification d'images AutoML et 10 modèles de détection d'objets image AutoML, soit un total de 20 modèles.
Image
Classification
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'entraînement simultanées avec Explainable AI | 2 |
Tâches d'inférence par lot simultanées | 5 |
Jobs simultanés de déploiement de modèle | 5 |
Jobs simultanés d'annulation de déploiement de modèle | 5 |
Nombre de modèles déployés | 10 |
Détection d'objets
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Nombre de modèles déployés | 10 |
Tabulaire
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Nombre de modèles déployés | 30 |
Texte
Classification
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Nombre de modèles déployés | 10 |
Extraction d'entités
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Nombre de modèles déployés | 10 |
Analyse des sentiments
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Nombre de modèles déployés | 10 |
Vidéo
Reconnaissance des actions
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Classification
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Suivi des objets
Quota | Valeur |
---|---|
Tâches d'entraînement simultanées | 5 |
Tâches d'inférence par lot simultanées | 5 |
Vertex AI Model Registry
Vertex AI Model Registry accepte des modèles d'une taille maximale de 1 To.
Limites des modèles AutoML
Les limites suivantes s'appliquent à chaque type de données pour un projet et une région donnés. Par exemple, dans un projet et une région donnés, vous pouvez inclure un maximum de 1 000 000 d'images dans une entrée de requête par lot.
Image
Type de limite | Valeur |
---|---|
Taille du fichier image | Maximum : 30 Mo |
Images par ensemble de données | Maximum : 1 000 000 |
Étiquettes par ensemble de données | Minimum : 2 Maximum : 5 000 |
Images par étiquette | Minimum : 10 Recommandé : 1 000 |
Taille du fichier CSV d'entrée par lot | Maximum : 100 Mo |
Nombre d'images dans l'entrée par lot | Maximum : 1 000 000 |
Tabulaire
Type de limite | Valeur |
---|---|
Taille maximale | 100 Go |
Nombre de lignes | Entre 1 000 et 200 000 000 de lignes |
Nombre de colonnes | Entre 2 et 1 000 colonnes |
Nombre d'importations d'ensembles de données exécutées simultanément | 5 importations |
Taille du fichier CSV | Maximum : 10 Go par fichier, jusqu'à un total maximal de 100 Go |
Texte
Le nombre de caractères prend en compte les caractères UTF-8.
Type de limite | Classification | Extraction d'entités | Analyse des sentiments |
---|---|---|---|
Éléments d'entraînement | 10 à 1 000 000 | 50 à 100 000 | 10 à 100 000 |
Étiquettes par ensemble de données | 2 à 5 000 | 1 à 100 | 2 à 11 |
Longueur du nom de l'étiquette | 1 à 32 | 1 à 32 | Nombre entier compris entre 0 et 10 |
Durée du délai annoté | N/A | 1 à 100 caractères | N/A |
Éléments d'entraînement par étiquette | 10 à 1 000 000 | 100 à 100 000 | 10 à 100 000 |
Taille de l'élément d'entraînement | 10 Mo
5 000 000 caractères |
128 ko (texte) ; 20 Mo (PDF)
De 10 à 300 000 caractères (texte) |
128 ko (texte) ; 2 Mo (PDF)
60 000 caractères |
Élément envoyé pour l'inférence | 128 ko (texte) ; 2 Mo (PDF)
60 000 caractères |
20 Mo | 128 ko (texte) ; 2 Mo (PDF)
60 000 caractères |
Éléments d'une requête par lot | 10 000 | 10 000 | 10 000 |
Vidéo
Type de limite | Valeur |
---|---|
Durée maximale de la vidéo | 3 heures |
Taille maximale du fichier vidéo | 50 Go |
Nombre minimal d'étiquettes par ensemble de données | 2 |
Nombre minimal de vidéos par étiquette | 10 (recommandé : 1 000) |
Taille du fichier CSV d'entrée par lot | Maximum : 100 Mo |
Nombre de séquences vidéo dans une entrée par lot | Maximum : 1 000 |
Quotas de modèles entraînés personnalisés
Les quotas suivants s'appliquent aux modèles personnalisés Vertex AI pour un projet et une région donnés.
Entraînement
Quota | Valeur |
---|---|
Pipelines d'entraînement personnalisés simultanés | 2 000 |
Nombre de processeurs N1 et E2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 2 200 |
us-west2 | 20 |
us-west3 | 2 200 |
us-west4 | 20 |
us-central1 | 2 200 |
us-east1 | 2 200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2 200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2 200 |
europe-west1 | 2 200 |
europe-west4 | 2 200 |
europe-west6 | 20 |
europe-west3 | 2 200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2 200 |
asia-southeast1 | 2 200 |
asia-southeast2 | 2 200 |
asia-east2 | 2 200 |
asia-east1 | 2 200 |
asia-northeast1 | 2 200 |
asia-northeast2 | 20 |
australia-southeast1 | 2 200 |
australia-southeast2 | 20 |
asia-northeast3 | 2 200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Nombre de processeurs N2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Nombre de processeurs M1 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Nombre de processeurs C2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Nombre de processeurs A2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | Illimité |
us-east1 | Illimité |
us-east4 | Illimité |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | Illimité |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Illimité |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Illimité |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de processeurs A3 simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Illimité |
us-west2 | Illimité |
us-west3 | Illimité |
us-west4 | Illimité |
us-central1 | Illimité |
us-east1 | Illimité |
us-east4 | Illimité |
us-east5 | Illimité |
us-south1 | Illimité |
northamerica-northeast1 | Illimité |
northamerica-northeast2 | Illimité |
southamerica-east1 | Illimité |
southamerica-west1 | Illimité |
europe-west2 | Illimité |
europe-west1 | Illimité |
europe-west4 | Illimité |
europe-west6 | Illimité |
europe-west3 | Illimité |
europe-north1 | Illimité |
europe-central2 | Illimité |
europe-west8 | Illimité |
europe-west9 | Illimité |
europe-southwest1 | Illimité |
asia-south1 | Illimité |
asia-southeast1 | Illimité |
asia-southeast2 | Illimité |
asia-east2 | Illimité |
asia-east1 | Illimité |
asia-northeast1 | Illimité |
asia-northeast2 | Illimité |
australia-southeast1 | Illimité |
australia-southeast2 | Illimité |
asia-northeast3 | Illimité |
me-west1 | Illimité |
me-central1 | Illimité |
me-central2 | Illimité |
europe-west12 | Illimité |
africa-south1 | Illimité |
Nombre de GPU H200 simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 8 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 0 |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU P4 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | 6 |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 6 |
us-east1 | Non disponible |
us-east4 | 1 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 6 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 6 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | 6 |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU T4 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 2 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | 6 |
europe-west1 | Non disponible |
europe-west4 | 2 |
europe-west6 | Non disponible |
europe-west3 | 0 |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | 6 |
asia-southeast1 | 1 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 6 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | 1 |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU L4 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | 0 |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | 0 |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | 0 |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU P100 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 30 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 30 |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 30 |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | 6 |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU V100 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 6 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 6 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 6 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 6 |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU A100 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 8 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 8 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 8 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU 80 Go A100 simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 0 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Pour en savoir plus, consultez la page Afficher et gérer les quotas.
Nombre de GPU H100 simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 0 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 0 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU B200 simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU H100 Mega simultanés pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 0 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 0 |
asia-northeast2 | Non disponible |
australia-southeast1 | 0 |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Pour en savoir plus, consultez la page Afficher et gérer les quotas.
Nombre de cœurs TPU V2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 8 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 8 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 8 |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de cœurs de pods TPU V2 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | Non disponible |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de cœurs TPU V3 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 8 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 8 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 8 |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de cœurs de pods TPU V3 pour l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | Non disponible |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Utilisation de HDD (Go) pendant l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 180 000 |
us-west2 | 3 600 |
us-west3 | 180 000 |
us-west4 | 3 600 |
us-central1 | 180 000 |
us-east1 | 180 000 |
us-east4 | 3 600 |
us-east5 | 3 600 |
us-south1 | 180 000 |
northamerica-northeast1 | 180 000 |
northamerica-northeast2 | 3 600 |
southamerica-east1 | 3 600 |
southamerica-west1 | 3 600 |
europe-west2 | 180 000 |
europe-west1 | 180 000 |
europe-west4 | 180 000 |
europe-west6 | 3 600 |
europe-west3 | 180 000 |
europe-north1 | 3 600 |
europe-central2 | 180 000 |
europe-west8 | 3 600 |
europe-west9 | 180 000 |
europe-southwest1 | 3 600 |
asia-south1 | 180 000 |
asia-southeast1 | 180 000 |
asia-southeast2 | 180 000 |
asia-east2 | 180 000 |
asia-east1 | 180 000 |
asia-northeast1 | 180 000 |
asia-northeast2 | 3 600 |
australia-southeast1 | 180 000 |
australia-southeast2 | 3 600 |
asia-northeast3 | 180 000 |
me-west1 | 180 000 |
me-central1 | 3 600 |
me-central2 | 3 600 |
europe-west12 | 3 600 |
africa-south1 | 3 600 |
Utilisation de SSD (Go) pendant l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 75 000 |
us-west2 | 450 |
us-west3 | 75 000 |
us-west4 | 450 |
us-central1 | 75 000 |
us-east1 | 75 000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75 000 |
northamerica-northeast1 | 75 000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75 000 |
europe-west1 | 75 000 |
europe-west4 | 75 000 |
europe-west6 | 450 |
europe-west3 | 75 000 |
europe-north1 | 450 |
europe-central2 | 75 000 |
europe-west8 | 450 |
europe-west9 | 75 000 |
europe-southwest1 | 450 |
asia-south1 | 75 000 |
asia-southeast1 | 75 000 |
asia-southeast2 | 75 000 |
asia-east2 | 75 000 |
asia-east1 | 75 000 |
asia-northeast1 | 75 000 |
asia-northeast2 | 450 |
australia-southeast1 | 75 000 |
australia-southeast2 | 450 |
asia-northeast3 | 75 000 |
me-west1 | 75 000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Utilisation d'Hyperdisk équilibré (Go) pendant l'entraînement, par région | |
---|---|
Région | Valeur |
us-west1 | 75 000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75 000 |
us-east1 | 450 |
us-east4 | 75 000 |
us-east5 | 450 |
us-south1 | 75 000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75 000 |
europe-west4 | 75 000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75 000 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Diffusion
Quota | Valeur |
---|---|
Nombre de répliques de modèles personnalisés déployées | 100 |
Nombre de processeurs pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 2 200 |
us-west2 | 2 200 |
us-west3 | 2 200 |
us-west4 | 16 |
us-central1 | 2 200 |
us-east1 | 2 200 |
us-east4 | 2 200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2 200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2 200 |
southamerica-west1 | 450 |
europe-west2 | 2 200 |
europe-west1 | 2 200 |
europe-west4 | 2 200 |
europe-west6 | 2 200 |
europe-west3 | 2 200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2 200 |
asia-southeast1 | 2 200 |
asia-southeast2 | 2 200 |
asia-east2 | 2 200 |
asia-east1 | 2 200 |
asia-northeast1 | 2 200 |
asia-northeast2 | 16 |
australia-southeast1 | 2 200 |
australia-southeast2 | 16 |
asia-northeast3 | 2 200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Nombre de GPU H200 simultanés pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 0 |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU P100 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 30 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 30 |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 30 |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU P4 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | 6 |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 6 |
us-east1 | Non disponible |
us-east4 | 6 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 6 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 6 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | 6 |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU T4 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 12 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | 12 |
europe-west1 | Non disponible |
europe-west4 | 12 |
europe-west6 | Non disponible |
europe-west3 | 0 |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | 6 |
asia-southeast1 | 6 |
asia-southeast2 | Non disponible |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | 6 |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU L4 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 28 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 28 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU V100 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 6 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 6 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 6 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU A100 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 14 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 14 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 14 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 14 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU A100 80 Go pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 1 |
us-east1 | Non disponible |
us-east4 | 1 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 1 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 1 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU B200 simultanés pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | Non disponible |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU H100 pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 8 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | 8 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | Non disponible |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 8 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 8 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de GPU H100 Mega pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 0 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Non disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | 0 |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 0 |
asia-northeast2 | Non disponible |
australia-southeast1 | 0 |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de puces TPU v5e pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | 4 |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | 0 |
us-central1 | 16 |
us-east1 | Non disponible |
us-east4 | Non disponible |
us-east5 | Non disponible |
us-south1 | 0 |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | Non disponible |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Nombre de puces TPU v6e pour la diffusion, par région | |
---|---|
Région | Valeur |
us-west1 | Non disponible |
us-west2 | Non disponible |
us-west3 | Non disponible |
us-west4 | Non disponible |
us-central1 | Non disponible |
us-east1 | 0 |
us-east4 | Non disponible |
us-east5 | 0 |
us-south1 | Non disponible |
northamerica-northeast1 | Non disponible |
northamerica-northeast2 | Non disponible |
southamerica-east1 | Non disponible |
southamerica-west1 | Non disponible |
europe-west2 | Non disponible |
europe-west1 | Non disponible |
europe-west4 | 0 |
europe-west6 | Non disponible |
europe-west3 | Non disponible |
europe-north1 | Non disponible |
europe-central2 | Non disponible |
europe-west8 | Non disponible |
europe-west9 | Non disponible |
europe-southwest1 | Non disponible |
asia-south1 | Non disponible |
asia-southeast1 | Non disponible |
asia-southeast2 | Non disponible |
asia-east2 | Non disponible |
asia-east1 | Non disponible |
asia-northeast1 | 0 |
asia-northeast2 | Non disponible |
australia-southeast1 | Non disponible |
australia-southeast2 | Non disponible |
asia-northeast3 | Non disponible |
me-west1 | Non disponible |
me-central1 | Non disponible |
me-central2 | Non disponible |
europe-west12 | Non disponible |
africa-south1 | Non disponible |
Limites des modèles entraînés personnalisés
Les limites suivantes s'appliquent aux modèles personnalisés Vertex AI pour un projet et une région donnés.
Diffusion
Limite | Valeur |
---|---|
Nombre de répliques par projet | 200 |
Nombre de conteneurs par cluster | 25 000 |
Vertex AI Feature Store
Cette section répertorie les quotas et limites pour les éléments suivants :
Vertex AI Feature Store
Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 200 nœuds de livraison en ligne dans us-central1
et 50 nœuds dans us-east4
.
Quota | Valeur |
---|---|
Requêtes de livraison en ligne par minute | 300 000 |
Nombre maximal d'instances FeatureOnlineStore |
10 |
Nombre maximal de requêtes de recherche par minute | 6 000 000 |
Nombre maximal de nœuds de diffusion en ligne sur toutes les instances FeatureOnlineStore optimisées du projet |
80 |
Nombre maximal d'instances FeatureView sur toutes les instances FeatureOnlineStore |
30 |
Vertex AI Feature Store peut également présenter les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :
Limite | Valeur |
---|---|
Nombre maximal de ressources FeatureGroup dans un projet et un emplacement |
250 |
Nombre maximal de ressources Feature dans un FeatureGroup |
10 000 |
Taille maximale des données de caractéristique par entité | 5 Mo |
Nombre d'ID d'entité par requête de livraison en ligne (FetchFeatureValues ) |
1 |
Longueur maximale d'un ID d'entité | 4 076 caractères |
Limite de stockage pour un nœud de livraison en ligne optimisée | 200 Go |
Vertex AI Feature Store (ancien)
Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 75 tâches par lot simultanées dans us-central1
et 75 autres tâches dans europe-west4
.
Quota | Valeur |
---|---|
Requêtes de livraison en ligne par minute | 300 000 |
Requêtes d'ingestion en flux continu par minute | 60 000 |
Débit d'écriture par minute pour l'ingestion en flux continu | 1,2 Go |
Requêtes de création de caractéristiques par minute | 100 |
Nœuds de livraison en ligne dans tous les magasins de caractéristiques | 30 |
Tâches par lot simultanées (ingestion, diffusion et suppression des valeurs de caractéristiques combinées) | 75 |
Requêtes simultanées pour supprimer les valeurs de caractéristiques | 1 |
Types d'entités dans tous les featurestores | 75 |
Vertex AI Feature Store (ancien) présente également les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :
Limite | Valeur |
---|---|
Limite de stockage pour un nœud de diffusion en ligne | 5 To |
Quantité totale de données dans le magasin hors connexion | Illimité |
Fonctionnalités par type d'entité | 5 000 |
Nombre de requêtes de création, de mise à jour et de suppression de featurestore par jour, par projet et par région | 500 |
Taille par requête pour l'ingestion en flux continu | 1 Mo |
Nombre d'entités pouvant être incluses par requête en lecture en streaming | 100 |
Nombre de fichiers pouvant être inclus par requête pour l'importation par lot | 5 000 pour Avro ou 500 pour CSV |
Nombre de caractéristiques pouvant être demandées pour la diffusion et l'exportation par lots | 5 000 |
Pour l'ingestion par lots et l'ingestion en flux continu, code temporel le plus ancien pour lequel des données de caractéristiques peuvent être ingérées | 4 000 jours à compter de la date actuelle |
La limite de conservation des données par défaut de Vertex AI Feature Store (ancien) (pouvant être ignorée) est la suivante :
Valeurs par défaut de conservation des données | Valeur par défaut |
---|---|
Conservation des données dans l'espace de stockage hors ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées) | 4 000 jours à partir de la date actuelle |
Conservation des données dans l'espace de stockage en ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées) | 4 000 jours à partir de la date actuelle |
Vous pouvez remplacer la limite de conservation des données de différentes manières :
Pour ignorer la limite de conservation des données de l'espace de stockage en ligne, définissez le paramètre
online_storage_ttl_days
lors de la création ou de la mise à jour d'un magasin de caractéristiques.Pour ignorer la limite de conservation des données du magasin hors connexion, définissez le paramètre
offline_storage_ttl_days
lors de la création ou de la mise à jour d'un type d'entité.
Vector Search
Les quotas suivants s'appliquent à Vector Search pour un projet donné dans chaque région.
Quota | Valeur |
---|---|
Opérations simultanées de création d'index | 5 |
Opérations simultanées de mise à jour d'index | 5 |
Nombre de nœuds d'index déployés | 50 |
Nombre de nœuds N2D d'index déployés | 5 |
Numéro d'index | 100 |
Requêtes de mise à jour en flux continu par minute | 6 000 |
Débit par minute (en Ko) pour la mise à jour en flux continu | 120 000 |
Vertex ML Metadata
Les limites suivantes s'appliquent à Vertex ML Metadata pour un projet donné dans chaque région.
Limite | Valeur |
---|---|
Taille sérialisée maximale du champ de métadonnées dans une ressource | 204 800 octets |
Taille sérialisée maximale des schémas de métadonnées | 204 800 octets |
Vertex AI Pipelines
Les quotas et limites suivants s'appliquent à Vertex AI Pipelines pour un projet donné dans chaque région.
Quota | Valeur |
---|---|
Exécuter des tâches de pipeline en parallèle* | 600 |
Exécutions simultanées du pipeline* | 300 |
* Les exécutions de pipeline / les requêtes de tâche dépassant cette limite sont mises en file d'attente jusqu'à ce que des ressources soient disponibles.
Vertex AI Pipelines est soumis aux limites suivantes. Notez que, contrairement aux quotas, vous ne pouvez pas demander d'augmentation de limite.
Limite | Valeur |
---|---|
Nombre de tâches de pipeline par tâche | 10 000 |
Artefacts d'entrée et de sortie par tâche de pipeline | 100 |
Artefacts d'entrée et de sortie par tâche de pipeline | 10 000 |
Taille maximale de la charge utile JSON contenant les paramètres de sortie et les artefacts par tâche de pipeline | 131 072 octets |
Durée d'exécution maximale d'une tâche de pipeline** | 7 jours |
* Les tâches de pipeline qui dépassent cette limite sont annulées.
Quotas et limites de Colab Enterprise
Les quotas et limites de Colab Enterprise sont répertoriés séparément. Consultez les quotas et limites de Colab Enterprise.
Augmentation des quotas
Si vous souhaitez augmenter vos quotas pour Vertex AI, vous pouvez en faire la demande via la console Google Cloud .
Pour en savoir plus sur l'envoi d'une demande d'augmentation de quota, consultez les sections suivantes de la page Afficher et gérer les quotas :
Quotas par région et par modèle
Afficher et modifier les quotas dans la console Google Cloud
Pour afficher et modifier les quotas dans la console Google Cloud , procédez comme suit :- Accédez à la page Quotas et limites du système.
- Pour ajuster le quota, copiez et collez la propriété
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
dans le filtre. Appuyez sur Entrée. - Cliquez sur les trois points à la fin de la ligne, puis sélectionnez Modifier le quota.
- Saisissez une nouvelle valeur de quota dans le volet, puis cliquez sur Envoyer la demande.
Accéder à la page "Quotas et limites du système"
Afficher les quotas de requêtes par minute (RPM) par région et par modèle
Par défaut, les modèles 2.0 et ultérieurs utilisent le quota partagé dynamique (QPD).
Choisissez une région pour afficher les quotas de chaque modèle disponible :
Augmenter les quotas
Si vous souhaitez augmenter vos quotas pour l'IA générative sur Vertex AI, vous pouvez en faire la demande via la console Google Cloud .
Quotas du moteur RAG
Pour que chaque service effectue une génération augmentée par récupération (RAG) à l'aide du moteur RAG, les quotas suivants s'appliquent. Ils sont mesurés en requêtes par minute (RPM).Service | Quota | Métrique |
---|---|---|
API de gestion des données du moteur RAG | 60 tr/min | VertexRagDataService requests per minute per region |
RetrievalContexts API |
1 500 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1 500 RPM | Online prediction requests per base model per minute per region per base_model Un autre filtre que vous pouvez spécifier est base_model: textembedding-gecko |
Service | Limite | Métrique |
---|---|---|
Requêtes ImportRagFiles simultanées |
3 RPM | VertexRagService concurrent import requests per region |
Nombre maximal de fichiers par requête ImportRagFiles |
10 000 | VertexRagService import rag files requests per region |
Pour en savoir plus sur les limites de débit et les quotas, consultez Limites de débit de l'IA générative sur Vertex AI.
Requêtes par lot
Les quotas et les limites des jobs d'inférence par lot sont les mêmes dans toutes les régions.Limites de tâches d'inférence par lot simultanées pour les modèles Gemini
Il n'existe aucune limite de quota prédéfinie pour l'inférence par lot pour les modèles Gemini. Au lieu de cela, le service de traitement par lot donne accès à un grand pool de ressources partagées, allouées de manière dynamique en fonction de la disponibilité en temps réel du modèle et de la demande pour ce modèle auprès de tous les clients. Lorsque davantage de clients sont actifs et que la capacité du modèle est saturée, vos requêtes par lot peuvent être mises en file d'attente en raison de la capacité.Quotas de tâches d'inférence par lot simultanées
Le tableau suivant répertorie les quotas pour le nombre de jobs d'inférence par lot simultanés, qui ne s'appliquent pas aux modèles Gemini :Quota | Valeur |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Quotas de modèles entraînés personnalisés
Les quotas suivants s'appliquent aux modèles réglés de l'IA générative sur Vertex AI pour un projet et une région donnés:Quota | Valeur |
---|---|
Cœurs de pods TPU V3 d'entraînement d'image restreint par région * Région compatible - europe-west4 |
64 |
GPU Nvidia A100 80 Go pour l'entraînement d'images restreint par région * Région compatible - us-central1 * Région compatible - us-east4 |
8 2 |
Limites d'embedding textuel
Chaque requête de modèle d'embedding de texte peut comporter jusqu'à 250 textes d'entrée (générant un embedding par texte d'entrée) et 20 000 jetons par requête. Seuls les 2 048 premiers jetons de chaque texte d'entrée sont utilisés pour calculer les embeddings. Pourgemini-embedding-001
, chaque requête ne peut inclure qu'un seul texte d'entrée.
Le quota pour ce modèle est indiqué sous le nom gemini-embedding
.
Jetons d'entrée de contenu à intégrer par minute et par modèle de base
Contrairement aux modèles d'embedding précédents, qui étaient principalement limités par des quotas de requêtes par minute, le quota du modèle Gemini Embedding limite le nombre de jetons pouvant être envoyés par minute et par projet.
Quota | Valeur |
---|---|
Jetons d'entrée de contenu à intégrer par minute | 200000 |
Quotas de Gen AI Evaluation Service
Le service d'évaluation de l'IA générative utilisegemini-2.0-flash
comme modèle d'évaluation par défaut pour les métriques basées sur un modèle.
Une seule requête d'évaluation pour une métrique basée sur un modèle peut entraîner plusieurs requêtes sous-jacentes adressées à Gen AI Evaluation Service. Le quota de chaque modèle est calculé par projet, ce qui signifie que toutes les requêtes dirigées vers gemini-2.0-flash
pour l'inférence de modèle et l'évaluation basée sur les modèles contribuent au quota.
Les quotas pour le service d'évaluation de l'IA générative et le modèle d'évaluation sous-jacent sont indiqués dans le tableau suivant :
Demander un quota | Quota par défaut |
---|---|
Requêtes de Gen AI Evaluation Service par minute | 1 000 requêtes par projet et par région |
Requêtes de prédiction en ligne par minute pourbase_model: gemini-2.0-flash |
Consultez la section Quotas par région et par modèle. |
Si vous recevez une erreur liée aux quotas lors de l'utilisation du service d'évaluation de l'IA générative, vous devrez peut-être envoyer une demande d'augmentation de quota. Pour en savoir plus, consultez Afficher et gérer les quotas.
Limite | Valeur |
---|---|
Délai de requête Gen AI Evaluation Service | 60 secondes |
Lorsque vous utilisez le service d'évaluation de l'IA générative pour la première fois dans un nouveau projet, vous pouvez rencontrer un délai de configuration initiale de deux minutes. Si votre première requête échoue, attendez quelques minutes, puis réessayez. Les requêtes d'évaluation ultérieures sont généralement traitées dans un délai de 60 secondes.
Le nombre maximal de jetons d'entrée et de sortie pour les métriques basées sur un modèle dépend du modèle utilisé comme modèle de jugement. Pour obtenir la liste des modèles, consultez Modèles Google.
Quotas d'évaluation de pipeline
Si vous recevez une erreur liée aux quotas lors de l'utilisation du service de pipelines d'évaluation, vous devrez peut-être envoyer une demande d'augmentation de quota. Pour en savoir plus, consultez Afficher et gérer les quotas. Le service de pipelines d'évaluation utilise Vertex AI Pipelines pour exécuterPipelineJobs
. Consultez les quotas correspondants pour Vertex AI Pipelines. Voici les recommandations générales de quotas:
Service | Quota | Recommandation |
---|---|---|
API Vertex AI | Tâches de prédiction par lot LLM simultanées par région | Par point : 1 * num_concurrent_pipelines Par pair : 2 * num_concurrent_pipelines |
API Vertex AI | Requêtes d'évaluation par minute et par région | 1000 * num_concurrent_pipelines |
Tasks | Quota | Modèle de base | Recommandation |
---|---|---|---|
summarization question_answering |
Requêtes de prédiction en ligne par modèle de base par minute, par région et par base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine
Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région :Description | Limite |
---|---|
Créer, supprimer ou mettre à jour Vertex AI Agent Engine par minute | 10 |
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute | 100 |
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute | 100 |
Query ou StreamQuery Vertex AI Agent Engine par minute |
60 |
Ajouter un événement aux sessions Vertex AI Agent Engine par minute | 100 |
Nombre maximal de ressources Vertex AI Agent Engine | 100 |
Créer, supprimer ou mettre à jour des ressources de mémoire Vertex AI Agent Engine par minute | 100 |
Obtenir, lister ou récupérer des données de la Memory Bank Vertex AI Agent Engine par minute | 300 |
Résoudre le code d'erreur 429
Pour résoudre l'erreur 429, consultez Code d'erreur 429.
Étapes suivantes
- Apprenez-en plus sur les quotas et limites de l'IA générative sur Vertex AI.