Quotas Cloud TPU

Ce document liste les quotas qui s'appliquent à Cloud TPU. Pour en savoir plus sur les tarifs de Cloud TPU, consultez la section Tarifs de Cloud TPU.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressourcesGoogle Cloud que votre Google Cloud projet peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres Google Cloud ressources.

Le système Cloud Quotas effectue les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.

.

Quota de TPU

Les quotas TPU limitent le nombre de cœurs Cloud TPU que vous pouvez utiliser avec un projetGoogle Cloud . Chaque version de TPU est associée à son propre quota. De plus, chaque quota de version Cloud TPU est divisé en quota à la demande et en quota préemptif (ou ponctuel).

Lorsque vous créez des ressources Cloud TPU, vous créez par défaut des ressources à la demande. Vous pouvez créer des ressources préemptibles à l'aide du paramètre --spot lorsque vous créez des ressources avec la commande gcloud. Pour en savoir plus, consultez la page Gérer les ressources TPU.

Quotas Cloud TPU par défaut

Les tableaux suivants indiquent les valeurs par défaut des quotas à la demande et préemptibles pour chaque zone disponible. Ces valeurs spécifient le nombre maximal de cœurs de TPU que vous pouvez utiliser dans votre projet.

Quotas préemptifs

Version du TPU Quota par défaut (nombre de cœurs) Nom du quota
v6e 64 cœurs Cœurs TPU v6e préemptifs par projet et par zone
v5p 768 cœurs Cœurs TPU v5p préemptifs par projet et par zone
v5e 64 cœurs Cœurs de pod TPU v5 Lite préemptifs par projet et par zone
v4 0 cœurs Cœurs de pod TPU v4 préemptifs par projet et par zone
Pod v3 32 Cœurs Cœurs de pod TPU v3 préemptifs par projet et par zone
v3 120 Cœurs Cœurs TPU v3 préemptifs par projet et par zone
Pod v2 32 Cœurs Cœurs de pod TPU v2 préemptifs par projet et par zone
v2 120 Cœurs Cœurs TPU v2 préemptifs par projet et par zone

Quotas à la demande

Version du TPU Quota par défaut (nombre de cœurs) Nom du quota
v6e 32 Cœurs Cœurs TPU v6e par projet et par zone
v5p 128 Cœurs Cœurs TPU v5p par projet et par zone
v5e 32 Cœurs Cœurs de pod TPU v5 Lite par projet et par zone
v4 0 cœurs Cœurs de pod TPU v4 par projet et par zone
Pod v3 32 Cœurs Cœurs de pod TPU v3 par projet et par zone
v3 40 cœurs Cœurs TPU v3 par projet et par zone
Pod v2 32 Cœurs Cœurs TPU v2 par projet et par zone
v2 40 cœurs Cœurs de pod TPU v2 par projet et par zone

Afficher et demander un quota supplémentaire

Vous pouvez consulter le quota alloué à votre Google Cloud projet sur la page Quotas dans la console Google Cloud.

Vous pouvez demander un quota Cloud TPU supplémentaire sur la page Quotas. Recherchez le quota que vous souhaitez augmenter, cliquez sur les trois points verticaux, puis sélectionnez Modifier le quota. Pour en savoir plus, consultez Demander une limite de quota supérieure. Si vous demandez un quota inférieur au seuil d'approbation automatique, votre demande sera automatiquement approuvée.

Quotas préemptifs

Version du TPU Seuil d'approbation automatique Nom du quota
v6e Toutes les zones: 0 cœurs Cœurs TPU v6e préemptifs par projet et par zone
v5p Toutes les zones: 0 cœurs Cœurs TPU v5p préemptifs par projet et par zone
v5e
  • us-east5-b: 800 cœurs
  • us-west4-a: 1 600 cœurs
  • us-west4-b: 3 968 cœurs
  • us-west1-c: 576 cœurs
  • us-central1-a: 3 264 cœurs
  • europe-west4-a: 4 032 cœurs
Cœurs de pod TPU v5 Lite préemptifs par projet et par zone
v4 Toutes les zones: 0 cœurs Cœurs de pod TPU v4 préemptifs par projet et par zone
Pod v3
  • europe-west4-a: 512 cœurs
  • us-east1-d: 320 cœurs
Cœurs de pod TPU v3 préemptifs par projet et par zone
v3
  • us-central1-a: 64 cœurs
  • europe-west4-a: 128 cœurs
Cœurs TPU v3 préemptifs par projet et par zone
Pod v2
  • us-central1-a: 64 cœurs
  • europe-west4-a: 64 cœurs
Cœurs de pod TPU v2 préemptifs par projet et par zone
v2
  • us-central1-b: 128 cœurs
  • us-central1-c: 64 cœurs
  • us-central1-f: 128 cœurs
  • europe-west4-a: 32 cœurs
Cœurs TPU v2 préemptifs par projet et par zone

Quotas à la demande

Version du TPU Seuil d'approbation automatique Nom du quota
v6e Toutes les zones: 0 cœurs Cœurs TPU v6e par projet et par zone
v5p us-east5-a: 64 cœurs Cœurs TPU v5p par projet et par zone
v5e Toutes les zones: 64 cœurs Cœurs de pod TPU v5 Lite par projet et par zone
v4 Toutes les zones: 0 cœurs Cœurs de pod TPU v4 par projet et par zone
Pod v3
  • europe-west4-a: 128 cœurs
  • us-east1-d: 64 cœurs
Cœurs de pod TPU v3 par projet et par zone
v3
  • us-central1-a: 64 cœurs
  • europe-west4-a: 128 cœurs
Cœurs TPU v3 par projet et par zone
Pod v2
  • us-central1-a: 64 cœurs
  • europe-west4-a: 64 cœurs
Cœurs TPU v2 par projet et par zone
v2
  • us-central1-b: 128 cœurs
  • us-central1-c: 64 cœurs
  • us-central1-f: 128 cœurs
  • europe-west4-a: 32 cœurs
Cœurs de pod TPU v2 par projet et par zone

Vous recevrez un e-mail vous indiquant si votre demande de quota est approuvée ou refusée. Les augmentations de quota de serviceGoogle Cloud se produisent progressivement. Cela peut entraîner des déploiements en cours dans différentes régions ou ressources. Lors du déploiement, la valeur de quota qui s'affiche dans la console Google Cloud ou l'API Cloud Quotas ne reflète pas la nouvelle valeur de quota augmentée tant que le déploiement n'est pas terminé. Pour en savoir plus, consultez la section Afficher les déploiements en cours.