Quotas Cloud TPU

Ce document répertorie les quotas qui s'appliquent à Cloud TPU. Pour en savoir plus sur les tarifs de Cloud TPU, consultez Tarifs de Cloud TPU.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité d'une ressourceGoogle Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, ils peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Ils protègent la communauté des utilisateurs deGoogle Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud .

Le système Cloud Quotas permet d'effectuer les opérations suivantes :

Dans la plupart des cas, lorsque vous tentez d'utiliser une ressource plus que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud . Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud , les quotas sont partagés entre toutes les applications et adresses IP.

Pour en savoir plus, consultez la présentation de Cloud Quotas.

Quota de TPU

Les quotas de TPU sont des limites sur le nombre de cœurs Cloud TPU que vous pouvez utiliser avec un projetGoogle Cloud . Chaque version de TPU est associée à son propre quota. De plus, chaque quota de version Cloud TPU est divisé en quota à la demande et en quota préemptif (ou spot).

Lorsque vous créez des ressources Cloud TPU, vous créez par défaut des ressources à la demande. Vous pouvez créer des ressources préemptibles à l'aide du paramètre --spot lorsque vous créez des ressources avec la commande gcloud. Pour en savoir plus, consultez Gérer les ressources TPU.

Quotas Cloud TPU par défaut

Les tableaux suivants indiquent les valeurs par défaut des quotas à la demande et préemptifs pour chaque zone disponible. Ces valeurs spécifient le nombre maximal de cœurs de TPU que vous pouvez utiliser dans votre projet.

Quotas préemptifs

Version du TPU Quota par défaut (nombre de cœurs) Nom du quota
v6e 1 536 cœurs Cœurs TPU v6e préemptifs par projet et par zone
v5p 768 cœurs Cœurs TPU v5p préemptifs par projet et par zone
v5e 1 536 cœurs Cœurs de pod TPU v5 Lite préemptifs par projet et par zone
v4 0 cœur Cœurs de pod TPU v4 préemptifs par projet et par zone
Pod v3 32 Cœurs Cœurs de pod TPU v3 préemptifs par projet et par zone
v3 120 cœurs Cœurs TPU v3 préemptifs par projet et par zone
Pod v2 32 Cœurs Cœurs de pod TPU v2 préemptifs par projet et par zone
v2 120 cœurs Cœurs TPU v2 préemptifs par projet et par zone

Quotas à la demande

Version du TPU Quota par défaut (nombre de cœurs) Nom du quota
v6e 512 Cœurs Cœurs TPU v6e par projet et par zone
v5p 128 Cœurs Cœurs TPU v5p par projet et par zone
v5e 512 Cœurs Cœurs de pod TPU v5 Lite par projet et par zone
v4 0 cœur Cœurs de pod TPU v4 par projet et par zone
Pod v3 32 Cœurs Cœurs de pods TPU v3 par projet et par zone
v3 40 cœurs Cœurs TPU v3 par projet et par zone
Pod v2 32 Cœurs Cœurs de pod TPU v2 par projet et par zone
v2 40 cœurs Cœurs TPU v2 par projet et par zone

Afficher et demander un quota supplémentaire

Vous pouvez consulter le quota alloué à votre projet Google Cloud sur la page Quotas de la console Google Cloud .

Vous pouvez demander un quota Cloud TPU supplémentaire sur la page Quotas. Recherchez le quota que vous souhaitez augmenter, cliquez sur les trois points verticaux, puis sélectionnez Modifier le quota. Pour en savoir plus, consultez Demander un ajustement de quota. Si vous demandez un quota inférieur au seuil d'approbation automatique, votre demande sera automatiquement approuvée.

Quotas préemptifs

Version du TPU Seuil d'approbation automatique Nom du quota
v6e Toutes les zones : 0 cœur Cœurs TPU v6e préemptifs par projet et par zone
v5p Toutes les zones : 0 cœur Cœurs TPU v5p préemptifs par projet et par zone
v5e
  • us-east5-b : 800 cœurs
  • us-west4-a : 1 600 cœurs
  • us-west4-b : 3 968 cœurs
  • us-west1-c : 576 cœurs
  • us-central1-a : 3 264 cœurs
  • europe-west4-a : 4 032 cœurs
Cœurs de pod TPU v5 Lite préemptifs par projet et par zone
v4 Toutes les zones : 0 cœur Cœurs de pod TPU v4 préemptifs par projet et par zone
Pod v3
  • europe-west4-a : 512 cœurs
  • us-east1-d : 320 cœurs
Cœurs de pod TPU v3 préemptifs par projet et par zone
v3
  • us-central1-a : 64 cœurs
  • europe-west4-a : 128 cœurs
Cœurs TPU v3 préemptifs par projet et par zone
Pod v2
  • us-central1-a : 64 cœurs
  • europe-west4-a : 64 cœurs
Cœurs de pod TPU v2 préemptifs par projet et par zone
v2
  • us-central1-b : 128 cœurs
  • us-central1-c : 64 cœurs
  • us-central1-f : 128 cœurs
  • europe-west4-a : 32 cœurs
Cœurs TPU v2 préemptifs par projet et par zone

Quotas à la demande

Version du TPU Seuil d'approbation automatique Nom du quota
v6e Toutes les zones : 0 cœur Cœurs TPU v6e par projet et par zone
v5p us-east5-a : 64 cœurs Cœurs TPU v5p par projet et par zone
v5e Toutes les zones : 64 cœurs Cœurs de pod TPU v5 Lite par projet et par zone
v4 Toutes les zones : 0 cœur Cœurs de pod TPU v4 par projet et par zone
Pod v3
  • europe-west4-a : 128 cœurs
  • us-east1-d : 64 cœurs
Cœurs de pods TPU v3 par projet et par zone
v3
  • us-central1-a : 64 cœurs
  • europe-west4-a : 128 cœurs
Cœurs TPU v3 par projet et par zone
Pod v2
  • us-central1-a : 64 cœurs
  • europe-west4-a : 64 cœurs
Cœurs de pod TPU v2 par projet et par zone
v2
  • us-central1-b : 128 cœurs
  • us-central1-c : 64 cœurs
  • us-central1-f : 128 cœurs
  • europe-west4-a : 32 cœurs
Cœurs TPU v2 par projet et par zone

Vous recevrez un e-mail vous indiquant si votre demande de quota a été approuvée ou refusée. Les augmentations de quota de serviceGoogle Cloud sont appliquées progressivement. Cela peut entraîner des déploiements continus dans différentes régions ou ressources. Lors du déploiement, la valeur de quota qui s'affiche dans la console Google Cloud ou l'API Cloud Quotas ne reflète pas la nouvelle valeur de quota augmentée tant que le déploiement n'est pas terminé. Pour en savoir plus, consultez Afficher les déploiements en cours.