Quotas et limites de Vertex AI

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas effectue les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Des limites s'appliquent également aux ressources Vertex AI. Ces limites ne sont pas liées au système de quotas. Les limites ne peuvent pas être modifiées.

Quotas de requêtes

Les quotas suivants s'appliquent aux requêtes de Vertex AI pour un projet et une région compatible donnés. Par exemple, pour un seul et même projet, vous pouvez envoyer jusqu'à 30 000 requêtes d'inférence en ligne par minute dans une région et 30 000 requêtes d'inférence en ligne par minute dans une autre région compatible.

Type de demande Requêtes par minute
Requêtes de gestion des ressources (CRUD)1 600
Requêtes d'envoi de jobs ou d'opérations de longue durée (LRO) 60
Requêtes d'inférence en ligne2 30 000
Débit des requêtes d'inférence en ligne 1,5 Go
Requêtes d'explication en ligne 600
Requêtes de lecture de séries temporelles Vertex AI TensorBoard 60 000
Requêtes de métadonnées de ML (CRUD) 12 000
Requêtes de mise en cache de l'IA générative (CRUD) 200
Requêtes Vertex AI Vizier (CRUD) 6 000
Requêtes de livraison en ligne Vertex AI Feature Store 300 000
Requêtes Vertex ML Metadata 12 000
Nombre de requêtes de jetons de décompte ou de jetons de calcul 3 000

1 Les requêtes de gestion des ressources incluent toutes les requêtes qui ne correspondent pas à des requêtes de tâche, d'opération de longue durée, d'inférence en ligne, Vertex AI Vizier, de métadonnées ML, de lecture de l'API Vertex AI TensorBoard Timeseries Insights, Vertex AI Feature Store, de flux Vertex AI Feature Store ou de recherche vectorielle.

2 Ce quota s'applique uniquement aux points de terminaison publics.

Les jobs ou opérations de longue durée incluent les requêtes suivantes :

  • Créer ou supprimer un ensemble de données.
  • Importer ou exporter des données vers ou depuis un ensemble de données.
  • Créer un point de terminaison.
  • Créer ou supprimer un job personnalisé.
  • Créer ou supprimer un job d'étiquetage de données.
  • Créer ou supprimer un job de réglage d'hyperparamètres.
  • Créer ou supprimer un job d'inférence par lot.
  • Créer ou supprimer un modèle.
  • Importer, supprimer ou exporter un modèle.
  • Créer ou supprimer un modèle d'environnement d'exécution de notebook.
  • Attribuer, supprimer, démarrer ou mettre à niveau un environnement d'exécution de notebook.
  • Créer, supprimer ou mettre à jour une surveillance de modèle.
  • Créer ou supprimer une tâche de surveillance de modèle.


Pour plus d'informations sur les quotas des modèles d'IA générative, consultez la page Quotas et limites de l'IA générative sur Vertex AI.

Quotas de modèles AutoML

Les quotas suivants s'appliquent à chaque type de données et chaque objectif pour un projet et une région donnés. Par exemple, dans un projet et une région donnés, vous pouvez déployer 10 modèles de classification d'images AutoML et 10 modèles de détection d'objets image AutoML, soit un total de 20 modèles.

Image

Classification

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'entraînement simultanées avec Explainable AI 2
Tâches d'inférence par lot simultanées 5
Jobs simultanés de déploiement de modèle 5
Jobs simultanés d'annulation de déploiement de modèle 5
Nombre de modèles déployés 10

Détection d'objets

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5
Nombre de modèles déployés 10

Tabulaire

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5
Nombre de modèles déployés 30

Texte

Classification

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5
Nombre de modèles déployés 10

Extraction d'entités

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5
Nombre de modèles déployés 10

Analyse des sentiments

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5
Nombre de modèles déployés 10

Vidéo

Reconnaissance des actions

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5

Classification

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5

Suivi des objets

Quota Valeur
Tâches d'entraînement simultanées 5
Tâches d'inférence par lot simultanées 5

Vertex AI Model Registry

Vertex AI Model Registry accepte des modèles d'une taille maximale de 1 To.

Limites des modèles AutoML

Les limites suivantes s'appliquent à chaque type de données pour un projet et une région donnés. Par exemple, dans un projet et une région donnés, vous pouvez inclure un maximum de 1 000 000 d'images dans une entrée de requête par lot.

Image

Type de limite Valeur
Taille du fichier image Maximum : 30 Mo
Images par ensemble de données Maximum : 1 000 000
Étiquettes par ensemble de données Minimum : 2
Maximum : 5 000
Images par étiquette Minimum : 10
Recommandé : 1 000
Taille du fichier CSV d'entrée par lot Maximum : 100 Mo
Nombre d'images dans l'entrée par lot Maximum : 1 000 000

Tabulaire

Type de limite Valeur
Taille maximale 100 Go
Nombre de lignes Entre 1 000 et 200 000 000 de lignes
Nombre de colonnes Entre 2 et  1 000 colonnes
Nombre d'importations d'ensembles de données exécutées simultanément 5 importations
Taille du fichier CSV Maximum : 10 Go par fichier, jusqu'à un total maximal de 100 Go

Texte

Le nombre de caractères prend en compte les caractères UTF-8.

Type de limite Classification Extraction d'entités Analyse des sentiments
Éléments d'entraînement 10 à 1 000 000 50 à 100 000 10 à 100 000
Étiquettes par ensemble de données 2 à 5 000 1 à 100 2 à 11
Longueur du nom de l'étiquette 1 à 32 1 à 32 Nombre entier compris entre 0 et 10
Durée du délai annoté N/A 1 à 100 caractères N/A
Éléments d'entraînement par étiquette 10 à 1 000 000 100 à 100 000 10 à 100 000
Taille de l'élément d'entraînement 10 Mo
5 000 000 caractères
128 ko (texte) ; 20 Mo (PDF)
De 10 à 300 000 caractères (texte)
128 ko (texte) ; 2 Mo (PDF)
60 000 caractères
Élément envoyé pour l'inférence 128 ko (texte) ; 2 Mo (PDF)
60 000 caractères
20 Mo 128 ko (texte) ; 2 Mo (PDF)
60 000 caractères
Éléments d'une requête par lot 10 000 10 000 10 000

Vidéo

Type de limite Valeur
Durée maximale de la vidéo 3 heures
Taille maximale du fichier vidéo 50 Go
Nombre minimal d'étiquettes par ensemble de données 2
Nombre minimal de vidéos par étiquette 10 (recommandé : 1 000)
Taille du fichier CSV d'entrée par lot Maximum : 100 Mo
Nombre de séquences vidéo dans une entrée par lot Maximum : 1 000

Quotas de modèles entraînés personnalisés

Les quotas suivants s'appliquent aux modèles personnalisés Vertex AI pour un projet et une région donnés.

Entraînement

Quota Valeur
Pipelines d'entraînement personnalisés simultanés 2 000
Nombre de processeurs N1 et E2 pour l'entraînement, par région
RégionValeur
us-west1 2 200
us-west2 20
us-west3 2 200
us-west4 20
us-central1 2 200
us-east1 2 200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2 200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2 200
europe-west1 2 200
europe-west4 2 200
europe-west6 20
europe-west3 2 200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2 200
asia-southeast1 2 200
asia-southeast2 2 200
asia-east2 2 200
asia-east1 2 200
asia-northeast1 2 200
asia-northeast2 20
australia-southeast1 2 200
australia-southeast2 20
asia-northeast3 2 200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Nombre de processeurs N2 pour l'entraînement, par région
RégionValeur
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Nombre de processeurs M1 pour l'entraînement, par région
RégionValeur
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
Nombre de processeurs C2 pour l'entraînement, par région
RégionValeur
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
Nombre de processeurs A2 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 Illimité
us-east1 Illimité
us-east4 Illimité
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 Illimité
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Illimité
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Illimité
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de processeurs A3 simultanés pour l'entraînement, par région
RégionValeur
us-west1 Illimité
us-west2 Illimité
us-west3 Illimité
us-west4 Illimité
us-central1 Illimité
us-east1 Illimité
us-east4 Illimité
us-east5 Illimité
us-south1 Illimité
northamerica-northeast1 Illimité
northamerica-northeast2 Illimité
southamerica-east1 Illimité
southamerica-west1 Illimité
europe-west2 Illimité
europe-west1 Illimité
europe-west4 Illimité
europe-west6 Illimité
europe-west3 Illimité
europe-north1 Illimité
europe-central2 Illimité
europe-west8 Illimité
europe-west9 Illimité
europe-southwest1 Illimité
asia-south1 Illimité
asia-southeast1 Illimité
asia-southeast2 Illimité
asia-east2 Illimité
asia-east1 Illimité
asia-northeast1 Illimité
asia-northeast2 Illimité
australia-southeast1 Illimité
australia-southeast2 Illimité
asia-northeast3 Illimité
me-west1 Illimité
me-central1 Illimité
me-central2 Illimité
europe-west12 Illimité
africa-south1 Illimité
Nombre de GPU H200 simultanés pour l'entraînement, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 8
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 0
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU P4 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 6
us-west3 Non disponible
us-west4 Non disponible
us-central1 6
us-east1 Non disponible
us-east4 1
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 6
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 6
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 6
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 6
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU T4 pour l'entraînement, par région
RégionValeur
us-west1 2
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 12
us-east1 2
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 6
europe-west1 Non disponible
europe-west4 2
europe-west6 Non disponible
europe-west3 0
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 6
asia-southeast1 1
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 6
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 1
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU L4 pour l'entraînement, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 0
us-east4 0
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 0
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 0
asia-southeast1 0
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 0
me-west1 Non disponible
me-central1 Non disponible
me-central2 0
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU P100 pour l'entraînement, par région
RégionValeur
us-west1 30
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 56
us-east1 30
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 30
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 30
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 6
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU V100 pour l'entraînement, par région
RégionValeur
us-west1 6
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 6
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 6
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 6
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU A100 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 8
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 8
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 8
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU 80 Go A100 simultanés pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 0
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 0
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible

Pour en savoir plus, consultez la page Afficher et gérer les quotas.

Nombre de GPU H100 simultanés pour l'entraînement, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 0
us-east5 0
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 0
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 0
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU B200 simultanés pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU H100 Mega simultanés pour l'entraînement, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 0
us-central1 0
us-east1 Non disponible
us-east4 0
us-east5 0
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 0
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 0
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 0
asia-northeast2 Non disponible
australia-southeast1 0
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible

Pour en savoir plus, consultez la page Afficher et gérer les quotas.

Nombre de cœurs TPU V2 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 8
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 8
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 8
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de cœurs de pods TPU V2 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 Non disponible
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de cœurs TPU V3 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 8
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 8
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 8
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de cœurs de pods TPU V3 pour l'entraînement, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 Non disponible
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Utilisation de HDD (Go) pendant l'entraînement, par région
RégionValeur
us-west1 180 000
us-west2 3 600
us-west3 180 000
us-west4 3 600
us-central1 180 000
us-east1 180 000
us-east4 3 600
us-east5 3 600
us-south1 180 000
northamerica-northeast1 180 000
northamerica-northeast2 3 600
southamerica-east1 3 600
southamerica-west1 3 600
europe-west2 180 000
europe-west1 180 000
europe-west4 180 000
europe-west6 3 600
europe-west3 180 000
europe-north1 3 600
europe-central2 180 000
europe-west8 3 600
europe-west9 180 000
europe-southwest1 3 600
asia-south1 180 000
asia-southeast1 180 000
asia-southeast2 180 000
asia-east2 180 000
asia-east1 180 000
asia-northeast1 180 000
asia-northeast2 3 600
australia-southeast1 180 000
australia-southeast2 3 600
asia-northeast3 180 000
me-west1 180 000
me-central1 3 600
me-central2 3 600
europe-west12 3 600
africa-south1 3 600
Utilisation de SSD (Go) pendant l'entraînement, par région
RégionValeur
us-west1 75 000
us-west2 450
us-west3 75 000
us-west4 450
us-central1 75 000
us-east1 75 000
us-east4 450
us-east5 450
us-south1 75 000
northamerica-northeast1 75 000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75 000
europe-west1 75 000
europe-west4 75 000
europe-west6 450
europe-west3 75 000
europe-north1 450
europe-central2 75 000
europe-west8 450
europe-west9 75 000
europe-southwest1 450
asia-south1 75 000
asia-southeast1 75 000
asia-southeast2 75 000
asia-east2 75 000
asia-east1 75 000
asia-northeast1 75 000
asia-northeast2 450
australia-southeast1 75 000
australia-southeast2 450
asia-northeast3 75 000
me-west1 75 000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Utilisation d'Hyperdisk équilibré (Go) pendant l'entraînement, par région
RégionValeur
us-west1 75 000
us-west2 450
us-west3 450
us-west4 450
us-central1 75 000
us-east1 450
us-east4 75 000
us-east5 450
us-south1 75 000
northamerica-northeast1 450
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 450
europe-west1 75 000
europe-west4 75 000
europe-west6 450
europe-west3 450
europe-north1 450
europe-central2 450
europe-west8 450
europe-west9 450
europe-southwest1 450
asia-south1 75 000
asia-southeast1 450
asia-southeast2 450
asia-east2 450
asia-east1 450
asia-northeast1 450
asia-northeast2 450
australia-southeast1 450
australia-southeast2 450
asia-northeast3 450
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

Diffusion

Quota Valeur
Nombre de répliques de modèles personnalisés déployées 100
Nombre de processeurs pour la diffusion, par région
RégionValeur
us-west1 2 200
us-west2 2 200
us-west3 2 200
us-west4 16
us-central1 2 200
us-east1 2 200
us-east4 2 200
us-east5 16
us-south1 450
northamerica-northeast1 2 200
northamerica-northeast2 450
southamerica-east1 2 200
southamerica-west1 450
europe-west2 2 200
europe-west1 2 200
europe-west4 2 200
europe-west6 2 200
europe-west3 2 200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2 200
asia-southeast1 2 200
asia-southeast2 2 200
asia-east2 2 200
asia-east1 2 200
asia-northeast1 2 200
asia-northeast2 16
australia-southeast1 2 200
australia-southeast2 16
asia-northeast3 2 200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
Nombre de GPU H200 simultanés pour la diffusion, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 0
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 0
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU P100 pour la diffusion, par région
RégionValeur
us-west1 30
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 56
us-east1 30
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 30
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 30
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU P4 pour la diffusion, par région
RégionValeur
us-west1 Non disponible
us-west2 6
us-west3 Non disponible
us-west4 Non disponible
us-central1 6
us-east1 Non disponible
us-east4 6
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 6
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 6
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 6
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 6
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU T4 pour la diffusion, par région
RégionValeur
us-west1 12
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 12
us-east1 12
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 12
europe-west1 Non disponible
europe-west4 12
europe-west6 Non disponible
europe-west3 0
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 6
asia-southeast1 6
asia-southeast2 Non disponible
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 6
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU L4 pour la diffusion, par région
RégionValeur
us-west1 28
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 28
us-east1 28
us-east4 28
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 28
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 28
asia-northeast1 28
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU V100 pour la diffusion, par région
RégionValeur
us-west1 6
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 6
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 6
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU A100 pour la diffusion, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 14
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 14
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 14
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 14
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 14
me-west1 1
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU A100 80 Go pour la diffusion, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 1
us-east1 Non disponible
us-east4 1
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 1
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 1
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU B200 simultanés pour la diffusion, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 0
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 Non disponible
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU H100 pour la diffusion, par région
RégionValeur
us-west1 8
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 8
us-east1 Non disponible
us-east4 0
us-east5 Non disponible
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 8
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 8
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de GPU H100 Mega pour la diffusion, par région
RégionValeur
us-west1 0
us-west2 Non disponible
us-west3 Non disponible
us-west4 0
us-central1 0
us-east1 Non disponible
us-east4 0
us-east5 0
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 0
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 0
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 0
asia-northeast2 Non disponible
australia-southeast1 0
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de puces TPU v5e pour la diffusion, par région
RégionValeur
us-west1 4
us-west2 Non disponible
us-west3 Non disponible
us-west4 0
us-central1 16
us-east1 Non disponible
us-east4 Non disponible
us-east5 Non disponible
us-south1 0
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 Non disponible
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible
Nombre de puces TPU v6e pour la diffusion, par région
RégionValeur
us-west1 Non disponible
us-west2 Non disponible
us-west3 Non disponible
us-west4 Non disponible
us-central1 Non disponible
us-east1 0
us-east4 Non disponible
us-east5 0
us-south1 Non disponible
northamerica-northeast1 Non disponible
northamerica-northeast2 Non disponible
southamerica-east1 Non disponible
southamerica-west1 Non disponible
europe-west2 Non disponible
europe-west1 Non disponible
europe-west4 0
europe-west6 Non disponible
europe-west3 Non disponible
europe-north1 Non disponible
europe-central2 Non disponible
europe-west8 Non disponible
europe-west9 Non disponible
europe-southwest1 Non disponible
asia-south1 Non disponible
asia-southeast1 Non disponible
asia-southeast2 Non disponible
asia-east2 Non disponible
asia-east1 Non disponible
asia-northeast1 0
asia-northeast2 Non disponible
australia-southeast1 Non disponible
australia-southeast2 Non disponible
asia-northeast3 Non disponible
me-west1 Non disponible
me-central1 Non disponible
me-central2 Non disponible
europe-west12 Non disponible
africa-south1 Non disponible

Limites des modèles entraînés personnalisés

Les limites suivantes s'appliquent aux modèles personnalisés Vertex AI pour un projet et une région donnés.

Diffusion

Limite Valeur
Nombre de répliques par projet 200
Nombre de conteneurs par cluster 25 000

Vertex AI Feature Store

Cette section répertorie les quotas et limites pour les éléments suivants :

Vertex AI Feature Store

Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 200 nœuds de livraison en ligne dans us-central1 et 50 nœuds dans us-east4.

Quota Valeur
Requêtes de livraison en ligne par minute 300 000
Nombre maximal d'instances FeatureOnlineStore 10
Nombre maximal de requêtes de recherche par minute 6 000 000
Nombre maximal de nœuds de diffusion en ligne sur toutes les instances FeatureOnlineStore optimisées du projet 80
Nombre maximal d'instances FeatureView sur toutes les instances FeatureOnlineStore 30

Vertex AI Feature Store peut également présenter les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :

Limite Valeur
Nombre maximal de ressources FeatureGroup dans un projet et un emplacement 250
Nombre maximal de ressources Feature dans un FeatureGroup 10 000
Taille maximale des données de caractéristique par entité 5 Mo
Nombre d'ID d'entité par requête de livraison en ligne (FetchFeatureValues) 1
Longueur maximale d'un ID d'entité 4 076 caractères
Limite de stockage pour un nœud de livraison en ligne optimisée 200 Go

Vertex AI Feature Store (ancien)

Les quotas suivants s'appliquent à un projet et à une région donnés. Par exemple, dans un seul projet, vous pouvez avoir 75 tâches par lot simultanées dans us-central1 et 75 autres tâches dans europe-west4.

Quota Valeur
Requêtes de livraison en ligne par minute 300 000
Requêtes d'ingestion en flux continu par minute 60 000
Débit d'écriture par minute pour l'ingestion en flux continu 1,2 Go
Requêtes de création de caractéristiques par minute 100
Nœuds de livraison en ligne dans tous les magasins de caractéristiques 30
Tâches par lot simultanées (ingestion, diffusion et suppression des valeurs de caractéristiques combinées) 75
Requêtes simultanées pour supprimer les valeurs de caractéristiques 1
Types d'entités dans tous les featurestores 75

Vertex AI Feature Store (ancien) présente également les limites suivantes. Vous ne pouvez pas demander d'augmentation de ces limites dans le tableau suivant :

Limite Valeur
Limite de stockage pour un nœud de diffusion en ligne 5 To
Quantité totale de données dans le magasin hors connexion Illimité
Fonctionnalités par type d'entité 5 000
Nombre de requêtes de création, de mise à jour et de suppression de featurestore par jour, par projet et par région 500
Taille par requête pour l'ingestion en flux continu 1 Mo
Nombre d'entités pouvant être incluses par requête en lecture en streaming 100
Nombre de fichiers pouvant être inclus par requête pour l'importation par lot 5 000 pour Avro ou 500 pour CSV
Nombre de caractéristiques pouvant être demandées pour la diffusion et l'exportation par lots 5 000
Pour l'ingestion par lots et l'ingestion en flux continu, code temporel le plus ancien pour lequel des données de caractéristiques peuvent être ingérées 4 000 jours à compter de la date actuelle

La limite de conservation des données par défaut de Vertex AI Feature Store (ancien) (pouvant être ignorée) est la suivante :

Valeurs par défaut de conservation des données Valeur par défaut
Conservation des données dans l'espace de stockage hors ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées) 4 000 jours à partir de la date actuelle
Conservation des données dans l'espace de stockage en ligne (ancien code temporel de la valeur de caractéristique après lequel les valeurs sont supprimées) 4 000 jours à partir de la date actuelle

Vous pouvez remplacer la limite de conservation des données de différentes manières :

  • Pour ignorer la limite de conservation des données de l'espace de stockage en ligne, définissez le paramètre online_storage_ttl_days lors de la création ou de la mise à jour d'un magasin de caractéristiques.

  • Pour ignorer la limite de conservation des données du magasin hors connexion, définissez le paramètre offline_storage_ttl_days lors de la création ou de la mise à jour d'un type d'entité.

Les quotas suivants s'appliquent à Vector Search pour un projet donné dans chaque région.

Quota Valeur
Opérations simultanées de création d'index 5
Opérations simultanées de mise à jour d'index 5
Nombre de nœuds d'index déployés 50
Nombre de nœuds N2D d'index déployés 5
Numéro d'index 100
Requêtes de mise à jour en flux continu par minute 6 000
Débit par minute (en Ko) pour la mise à jour en flux continu 120 000

Vertex ML Metadata

Les limites suivantes s'appliquent à Vertex ML Metadata pour un projet donné dans chaque région.

Limite Valeur
Taille sérialisée maximale du champ de métadonnées dans une ressource 204 800 octets
Taille sérialisée maximale des schémas de métadonnées 204 800 octets

Vertex AI Pipelines

Les quotas et limites suivants s'appliquent à Vertex AI Pipelines pour un projet donné dans chaque région.

Quota Valeur
Exécuter des tâches de pipeline en parallèle* 600
Exécutions simultanées du pipeline* 300

* Les exécutions de pipeline / les requêtes de tâche dépassant cette limite sont mises en file d'attente jusqu'à ce que des ressources soient disponibles.

Vertex AI Pipelines est soumis aux limites suivantes. Notez que, contrairement aux quotas, vous ne pouvez pas demander d'augmentation de limite.

Limite Valeur
Nombre de tâches de pipeline par tâche 10 000
Artefacts d'entrée et de sortie par tâche de pipeline 100
Artefacts d'entrée et de sortie par tâche de pipeline 10 000
Taille maximale de la charge utile JSON contenant les paramètres de sortie et les artefacts par tâche de pipeline 131 072 octets
Durée d'exécution maximale d'une tâche de pipeline** 7 jours

* Les tâches de pipeline qui dépassent cette limite sont annulées.

Quotas et limites de Colab Enterprise

Les quotas et limites de Colab Enterprise sont répertoriés séparément. Consultez les quotas et limites de Colab Enterprise.

Augmentation des quotas

Si vous souhaitez augmenter vos quotas pour Vertex AI, vous pouvez en faire la demande via la console Google Cloud .

Pour en savoir plus sur l'envoi d'une demande d'augmentation de quota, consultez les sections suivantes de la page Afficher et gérer les quotas :

Quotas par région et par modèle

Afficher et modifier les quotas dans la console Google Cloud

Pour afficher et modifier les quotas dans la console Google Cloud , procédez comme suit :
  1. Accédez à la page Quotas et limites du système.
  2. Accéder à la page "Quotas et limites du système"

  3. Pour ajuster le quota, copiez et collez la propriété aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model dans le filtre. Appuyez sur Entrée.
  4. Cliquez sur les trois points à la fin de la ligne, puis sélectionnez Modifier le quota.
  5. Saisissez une nouvelle valeur de quota dans le volet, puis cliquez sur Envoyer la demande.

Afficher les quotas de requêtes par minute (RPM) par région et par modèle

Par défaut, les modèles 2.0 et ultérieurs utilisent le quota partagé dynamique (QPD).

Choisissez une région pour afficher les quotas de chaque modèle disponible :

Augmenter les quotas

Si vous souhaitez augmenter vos quotas pour l'IA générative sur Vertex AI, vous pouvez en faire la demande via la console Google Cloud .

Quotas du moteur RAG

Pour que chaque service effectue une génération augmentée par récupération (RAG) à l'aide du moteur RAG, les quotas suivants s'appliquent. Ils sont mesurés en requêtes par minute (RPM).
Service Quota Métrique
API de gestion des données du moteur RAG 60 tr/min VertexRagDataService requests per minute per region
RetrievalContexts API 1 500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1 500 RPM Online prediction requests per base model per minute per region per base_model

Un autre filtre que vous pouvez spécifier est base_model: textembedding-gecko
Les limites suivantes s'appliquent :
Service Limite Métrique
Requêtes ImportRagFiles simultanées 3 RPM VertexRagService concurrent import requests per region
Nombre maximal de fichiers par requête ImportRagFiles 10 000 VertexRagService import rag files requests per region

Pour en savoir plus sur les limites de débit et les quotas, consultez Limites de débit de l'IA générative sur Vertex AI.

Requêtes par lot

Les quotas et les limites des jobs d'inférence par lot sont les mêmes dans toutes les régions.

Limites de tâches d'inférence par lot simultanées pour les modèles Gemini

Il n'existe aucune limite de quota prédéfinie pour l'inférence par lot pour les modèles Gemini. Au lieu de cela, le service de traitement par lot donne accès à un grand pool de ressources partagées, allouées de manière dynamique en fonction de la disponibilité en temps réel du modèle et de la demande pour ce modèle auprès de tous les clients. Lorsque davantage de clients sont actifs et que la capacité du modèle est saturée, vos requêtes par lot peuvent être mises en file d'attente en raison de la capacité.

Quotas de tâches d'inférence par lot simultanées

Le tableau suivant répertorie les quotas pour le nombre de jobs d'inférence par lot simultanés, qui ne s'appliquent pas aux modèles Gemini :
Quota Valeur
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
Si le nombre de tâches envoyées dépasse le quota alloué, elles sont placées dans une file d'attente et traitées lorsque la capacité de quota devient disponible.

Quotas de modèles entraînés personnalisés

Les quotas suivants s'appliquent aux modèles réglés de l'IA générative sur Vertex AI pour un projet et une région donnés:
Quota Valeur
Cœurs de pods TPU V3 d'entraînement d'image restreint par région
* Région compatible - europe-west4
64
GPU Nvidia A100 80 Go pour l'entraînement d'images restreint par région
* Région compatible - us-central1
* Région compatible - us-east4

8
2
* Les scénarios de réglage comportent des réservations d'accélérateurs dans des régions spécifiques. Les quotas de réglage sont compatibles et doivent être demandés dans des régions spécifiques.

Limites d'embedding textuel

Chaque requête de modèle d'embedding de texte peut comporter jusqu'à 250 textes d'entrée (générant un embedding par texte d'entrée) et 20 000 jetons par requête. Seuls les 2 048 premiers jetons de chaque texte d'entrée sont utilisés pour calculer les embeddings. Pour gemini-embedding-001, chaque requête ne peut inclure qu'un seul texte d'entrée. Le quota pour ce modèle est indiqué sous le nom gemini-embedding.

Jetons d'entrée de contenu à intégrer par minute et par modèle de base

Contrairement aux modèles d'embedding précédents, qui étaient principalement limités par des quotas de requêtes par minute, le quota du modèle Gemini Embedding limite le nombre de jetons pouvant être envoyés par minute et par projet.

Quota Valeur
Jetons d'entrée de contenu à intégrer par minute 200000

Quotas de Gen AI Evaluation Service

Le service d'évaluation de l'IA générative utilise gemini-2.0-flash comme modèle d'évaluation par défaut pour les métriques basées sur un modèle. Une seule requête d'évaluation pour une métrique basée sur un modèle peut entraîner plusieurs requêtes sous-jacentes adressées à Gen AI Evaluation Service. Le quota de chaque modèle est calculé par projet, ce qui signifie que toutes les requêtes dirigées vers gemini-2.0-flash pour l'inférence de modèle et l'évaluation basée sur les modèles contribuent au quota. Les quotas pour le service d'évaluation de l'IA générative et le modèle d'évaluation sous-jacent sont indiqués dans le tableau suivant :
Demander un quota Quota par défaut
Requêtes de Gen AI Evaluation Service par minute 1 000 requêtes par projet et par région
Requêtes de prédiction en ligne par minute pour
base_model: gemini-2.0-flash
Consultez la section Quotas par région et par modèle.

Si vous recevez une erreur liée aux quotas lors de l'utilisation du service d'évaluation de l'IA générative, vous devrez peut-être envoyer une demande d'augmentation de quota. Pour en savoir plus, consultez Afficher et gérer les quotas.

Limite Valeur
Délai de requête Gen AI Evaluation Service 60 secondes

Lorsque vous utilisez le service d'évaluation de l'IA générative pour la première fois dans un nouveau projet, vous pouvez rencontrer un délai de configuration initiale de deux minutes. Si votre première requête échoue, attendez quelques minutes, puis réessayez. Les requêtes d'évaluation ultérieures sont généralement traitées dans un délai de 60 secondes.

Le nombre maximal de jetons d'entrée et de sortie pour les métriques basées sur un modèle dépend du modèle utilisé comme modèle de jugement. Pour obtenir la liste des modèles, consultez Modèles Google.

Quotas d'évaluation de pipeline

Si vous recevez une erreur liée aux quotas lors de l'utilisation du service de pipelines d'évaluation, vous devrez peut-être envoyer une demande d'augmentation de quota. Pour en savoir plus, consultez Afficher et gérer les quotas. Le service de pipelines d'évaluation utilise Vertex AI Pipelines pour exécuter PipelineJobs. Consultez les quotas correspondants pour Vertex AI Pipelines. Voici les recommandations générales de quotas:
Service Quota Recommandation
API Vertex AI Tâches de prédiction par lot LLM simultanées par région Par point : 1 * num_concurrent_pipelines

Par pair : 2 * num_concurrent_pipelines
API Vertex AI Requêtes d'évaluation par minute et par région 1000 * num_concurrent_pipelines
De plus, le quota approprié pour les métriques basées sur un modèle dépend du modèle de juge que vous utilisez :
Tasks Quota Modèle de base Recommandation
summarization
question_answering
Requêtes de prédiction en ligne par modèle de base par minute, par région et par base_model text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine

Les limites suivantes s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région :
Description Limite
Créer, supprimer ou mettre à jour Vertex AI Agent Engine par minute 10
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute 100
Créer, supprimer ou mettre à jour des sessions Vertex AI Agent Engine par minute 100
Query ou StreamQuery Vertex AI Agent Engine par minute 60
Ajouter un événement aux sessions Vertex AI Agent Engine par minute 100
Nombre maximal de ressources Vertex AI Agent Engine 100
Créer, supprimer ou mettre à jour des ressources de mémoire Vertex AI Agent Engine par minute 100
Obtenir, lister ou récupérer des données de la Memory Bank Vertex AI Agent Engine par minute 300

Résoudre le code d'erreur 429

Pour résoudre l'erreur 429, consultez Code d'erreur 429.

Étapes suivantes