Gérer les ressources en file d'attente
Les ressources en mode file d'attente vous permettent de demander des ressources Cloud TPU via une file d'attente. Lorsque vous demandez des ressources en mode file d'attente, la demande est ajoutée à une file d'attente gérée par le service Cloud TPU. Lorsque la ressource demandée devient disponible, elle est attribuée à votre projet Google Cloud pour votre usage exclusif immédiat. Elle restera attribuée à votre projet, sauf si vous la supprimez ou si elle est préemptée. Seules les VM Spot TPU et les TPU préemptifs peuvent être préemptés.
Vous pouvez spécifier une heure de début et de fin facultatives dans une demande de ressource mise en file d'attente. L'heure de début indique l'heure la plus tôt à laquelle la demande doit être satisfaite. Si une demande n'a pas été traitée avant l'heure de fin spécifiée, elle expire. La demande reste dans la file d'attente après son expiration.
Les demandes de ressources mises en file d'attente peuvent avoir l'un des états suivants :
WAITING_FOR_RESOURCES
- La demande a passé la validation initiale et a été ajoutée à la file d'attente. Il reste dans cet état jusqu'à ce qu'il y ait suffisamment de ressources disponibles pour commencer à provisionner votre demande ou jusqu'à ce que l'intervalle d'allocation expire. Lorsque la demande est élevée, toutes les requêtes ne peuvent pas être provisionnées immédiatement. Si vous avez besoin d'une disponibilité plus fiable des TPU, envisagez d'acheter une réservation.
PROVISIONING
- La demande a été sélectionnée dans la file d'attente et ses ressources sont en cours d'attribution.
ACTIVE
- La demande a été attribuée. Lorsque les demandes de ressources en file d'attente sont à l'état
ACTIVE
, vous pouvez gérer vos VM TPU comme décrit dans Gérer les TPU. FAILED
- La demande n'a pas pu être traitée, soit parce qu'il y a un problème avec la demande, soit parce que les ressources demandées n'étaient pas disponibles dans l'intervalle d'allocation. La demande reste dans la file d'attente jusqu'à ce qu'elle soit explicitement supprimée.
SUSPENDING
- Les ressources associées à la demande sont en cours de suppression.
SUSPENDED
- Les ressources spécifiées dans la requête ont été supprimées. Lorsqu'une demande est à l'état
SUSPENDED
, elle n'est plus éligible à une allocation supplémentaire.
Prérequis
Avant d'exécuter les commandes de ce guide, vous devez installer Google Cloud CLI, créer un projet Google Cloud et activer l'API Cloud TPU. Pour obtenir des instructions, consultez Configurer l'environnement Cloud TPU.
Si vous utilisez l'une des bibliothèques clientes Cloud, suivez les instructions de configuration pour le langage que vous utilisez :
Demander une ressource en file d'attente à la demande
Les ressources à la demande ne seront pas préemptées, mais le quota à la demande ne garantit pas qu'il y aura suffisamment de ressources Cloud TPU disponibles pour répondre à votre demande. Pour en savoir plus sur les ressources à la demande, consultez Types de quotas.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Demander une ressource en file d'attente à l'aide d'une réservation
Vous pouvez demander une ressource en file d'attente à l'aide d'une réservation. Pour acheter une réservation, contactez l'équipe de gestion de votre compte Google Cloud .
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --reserved
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Développez la section Gestion.
Cochez la case Utiliser une réservation existante.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
Demander une ressource en file d'attente de VM Spot TPU
Une VM Spot est une ressource qui peut être préemptée et attribuée à une autre charge de travail à tout moment. Les ressources des VM Spot coûtent moins cher et vous pouvez y accéder plus rapidement qu'avec une demande de VM non Spot. Pour en savoir plus sur les VM Spot TPU, consultez Gérer les VM Spot TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --spot
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
spot
- : indicateur booléen spécifiant que la ressource mise en file d'attente est une VM spot.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
spot
- : indicateur booléen spécifiant que la ressource mise en file d'attente est une VM spot.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Développez la section Gestion.
Cochez la case Transformer en VM Spot TPU.
Cliquez sur Créer.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Demander l'allocation d'une ressource mise en file d'attente avant ou après une heure spécifiée
Vous pouvez spécifier une heure de début ou une heure de fin facultatives dans une demande de ressource mise en file d'attente. L'heure ou la durée de début spécifient l'heure la plus tôt à laquelle la demande doit être satisfaite. L'heure ou la durée de fin indiquent la durée de validité de la demande. Si une demande n'a pas été satisfaite à l'heure de fin spécifiée ou dans le délai spécifié, elle expire. Une fois la demande expirée, elle reste dans la file d'attente, mais n'est plus éligible à l'allocation.
Vous pouvez également spécifier un intervalle d'allocation en indiquant une heure ou une durée de début, et une heure ou une durée de fin.
Pour obtenir la liste des formats d'horodatage et de durée acceptés, consultez Date/Heure.
Demander qu'une ressource en file d'attente soit traitée après un délai spécifié
Dans une requête de ressources en file d'attente, vous pouvez spécifier une heure ou une durée après laquelle une ressource doit être allouée.
gcloud
La commande suivante demande l'allocation d'un TPU v5p-4096 après 9h le 14 décembre 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-time 2022-12-14T09:00:00Z
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Heure après laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez la page gcloud topic datetimes.
curl
La commande suivante demande l'allocation d'un TPU v5p-4096 après 9h le 14 décembre 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-time
- Heure après laquelle la ressource doit être allouée. Pour en savoir plus sur les formats de durée, consultez la page gcloud topic datetimes.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Dans le champ Heure de début de la demande, saisissez l'heure à partir de laquelle la ressource doit être allouée.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
L'exemple suivant demande l'attribution d'un v5p-32 après six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 6h
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-duration
- : durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez la documentation Google Cloud CLI sur les dates et heures.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-after-duration
- : durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez la documentation Google Cloud CLI sur les dates et heures.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Demander une ressource mise en file d'attente qui expire après une période spécifiée
Dans une demande de ressources en file d'attente, vous pouvez spécifier la durée de validité d'une demande de ressources en file d'attente. Si la demande n'a pas été traitée dans le délai ou la durée que vous avez spécifiés, elle expire.
gcloud
La commande suivante demande un TPU v5p-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h00, elle expirera.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-time 2022-12-14T09:00:00Z
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- : délai au-delà duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
curl
La commande suivante demande un TPU v5p-4096. Si la demande n'est pas traitée d'ici le 14 décembre 2022 à 9h00, elle expirera.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- : délai au-delà duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Dans le champ Annuler la demande le, saisissez l'heure à laquelle la demande de ressource mise en file d'attente doit expirer si elle n'est pas satisfaite.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
L'exemple suivant demande un v5p-32. La demande expire si elle n'est pas satisfaite au bout de six heures.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-duration 6h
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-duration
- Durée de validité de la demande. Pour en savoir plus sur les formats de durée, consultez la section datetime de Google Cloud CLI.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-duration
- Durée de validité de la demande. Pour en savoir plus sur les formats de durée, consultez la section datetime de Google Cloud CLI.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Demander l'allocation d'une ressource mise en file d'attente dans un intervalle spécifié
Vous pouvez spécifier un intervalle d'allocation en indiquant à la fois l'heure ou la durée de début et l'heure ou la durée de fin.
gcloud
La commande suivante demande une v5p-32 dans cinq heures et demie à partir de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h00.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-time
- : délai au-delà duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
valid-after-duration
- : durée avant laquelle le TPU ne doit pas être provisionné. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
curl
La commande suivante demande une v5p-32 dans cinq heures et demie à partir de l'heure actuelle, à créer au plus tard le 14 décembre 2022 à 9h00.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
valid-until-timw
- : délai au-delà duquel la demande est annulée. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
valid-until-duration
- Durée de validité de la demande. Pour en savoir plus sur les formats de durée, consultez la section gcloud topic datetimes.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Dans le champ Heure de début de la demande, saisissez l'heure à partir de laquelle la ressource doit être allouée.
Dans le champ Annuler la demande le, saisissez l'heure à laquelle la demande de ressource mise en file d'attente doit expirer si elle n'est pas satisfaite.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
Demander une ressource mise en file d'attente avec un script de démarrage
Vous pouvez spécifier un script à exécuter sur une ressource mise en file d'attente après son provisionnement.
gcloud
Lorsque vous utilisez la commande gcloud
, vous pouvez utiliser l'option --metadata
ou --metadata-from-file
pour spécifier respectivement une commande de script ou un fichier contenant le code du script. L'exemple suivant crée une demande de ressource mise en file d'attente qui exécutera le script startup-script.sh
.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --metadata-from-file='startup-script=startup-script.sh'
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Durée de validité de la demande, après laquelle elle est annulée. Pour en savoir plus sur les formats de durée, consultez la page Google Cloud CLI topic datetime.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande suppose qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui est exécuté lorsque la ressource mise en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.
curl
Lorsque vous utilisez curl
, vous devez inclure le code du script dans le contenu JSON.
L'exemple suivant inclut un script intégré dans le corps JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central1-a', node_id: 'your-node-id', node: { accelerator_type: 'v5e-8', runtime_version: 'v2-alpha-tpuv5-lite', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID défini par l'utilisateur du TPU créé en réponse à la requête.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
validInterval
- Durée de validité de la demande, après laquelle elle est annulée. Pour en savoir plus sur les formats de durée, consultez la page Google Cloud CLI topic datetime.
metadata-from-file
- Spécifie un fichier contenant des métadonnées. Si vous ne spécifiez pas de chemin d'accès complet au fichier de métadonnées, la commande suppose qu'il se trouve dans le répertoire actuel. Dans cet exemple, le fichier contient un script de démarrage qui est exécuté lorsque la ressource mise en file d'attente est provisionnée.
metadata
- Spécifie les métadonnées de la requête. Dans cet exemple, les métadonnées sont une commande de script de démarrage exécutée lorsque la ressource mise en file d'attente est provisionnée.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Demander une ressource mise en file d'attente avec un réseau et un sous-réseau spécifiés
Dans une demande de ressources en file d'attente, vous pouvez spécifier un réseau et un sous-réseau auxquels vous souhaitez connecter votre TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5e-8 \ --runtime-version v2-alpha-tpuv5-lite \ --network network-name \ --subnetwork subnetwork-name
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- : réseau auquel la ressource en file d'attente appartiendra.
subnetwork
- Sous-réseau auquel la ressource en file d'attente appartiendra.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5e-8', 'runtime_version': 'v2-alpha-tpuv5-lite', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Descriptions des paramètres de commande
queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
node-id
- ID attribué par l'utilisateur au TPU créé lorsque la demande de ressource mise en file d'attente est allouée.
project
- Votre projet Google Cloud .
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
accelerator-type
- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
runtime-version
- Version du logiciel Cloud TPU.
reserved
- Utilisez cet indicateur lorsque vous demandez des ressources en file d'attente dans le cadre d'une réservation Cloud TPU.
network
- : réseau auquel la ressource en file d'attente appartiendra.
subnetwork
- Sous-réseau auquel la ressource en file d'attente appartiendra.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez le nom de votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous souhaitez créer le TPU.
Dans la zone Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous souhaitez créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur le bouton Activer la mise en file d'attente.
Dans le champ Nom de la ressource mise en file d'attente, saisissez le nom de votre demande de ressource mise en file d'attente.
Développez la section Réseau.
Dans les champs Réseau et Sous-réseau, sélectionnez le réseau et le sous-réseau que vous souhaitez utiliser.
Cliquez sur Créer pour créer votre demande de ressource mise en file d'attente.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Supprimer une demande de ressource en file d'attente
Vous pouvez supprimer une demande de ressource en file d'attente et le TPU associé à la demande en supprimant la demande de ressource en file d'attente :
gcloud
Transmettez l'option --force
à la commande queued-resource delete
:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a \ --force \ --async
Description des options de commande
your-queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez à la fois la VM TPU et la demande de ressource en file d'attente.
curl
Utilisez le paramètre de requête force=true
dans votre requête curl
:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id?force=true
Description des options de commande
your-queued-resource-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
force
- Supprimez à la fois la VM TPU et la demande de ressource en file d'attente.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur l'onglet Ressources en file d'attente.
Cochez la case à côté de votre demande de ressource en file d'attente.
Cliquez sur
Supprimer.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Si vous supprimez directement le TPU, vous devez également supprimer la ressource en file d'attente, comme indiqué dans l'exemple suivant. Lorsque vous supprimez le TPU, la requête de ressource en file d'attente passe à l'état SUSPENDED
, après quoi elle peut être supprimée.
gcloud
Supprimez le TPU :
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project-id \ --zone=us-central1-a \ --quiet
Description des options de commande
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
your-node-id
- Nom de la TPU que vous souhaitez supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer :
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
curl
Supprimez le TPU :
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central1-a/nodes?node_id=your-node-id
Description des options de commande
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
your-node-id
- Nom de la TPU que vous souhaitez supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource mise en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer :
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone du Cloud TPU à supprimer.
Console
Supprimez votre TPU :
Dans la console Google Cloud , accédez à la page TPU :
Cochez la case située à côté de votre TPU.
Cliquez sur
Supprimer.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état En cours de suspension, puis à l'état Suspendue. Lorsque votre ressource en file d'attente est à l'état Suspendue, vous pouvez la supprimer :
- Cliquez sur l'onglet Ressources en file d'attente.
- Cochez la case à côté de votre demande de ressource en file d'attente.
- Cliquez sur Supprimer.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer :
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Lorsque vous supprimez votre TPU, la ressource en file d'attente associée passe à l'état SUSPENDING
, puis à l'état SUSPENDED
. Lorsque votre ressource en file d'attente est à l'état SUSPENDED
, vous pouvez la supprimer :
Récupérer des informations sur l'état et le diagnostic d'une demande de ressource en file d'attente
Récupérez l'état et les informations de diagnostic d'une demande de ressource en file d'attente :
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central1-a
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Description des options de commande
queued-resource-request-id
- ID attribué par l'utilisateur à la demande de ressource mise en file d'attente.
project
- ID du projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur l'onglet Ressources en file d'attente.
Cliquez sur le nom de votre demande de ressource mise en file d'attente.
Une fois votre TPU provisionné, vous pouvez également afficher des informations sur votre demande de ressources en file d'attente en accédant à la page TPU, en recherchant votre TPU et en cliquant sur le nom de la demande de ressources en file d'attente correspondante.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Si la requête échoue, le résultat contient des informations sur l'erreur. Pour une requête en attente de ressources, le résultat ressemble à ce qui suit :
gcloud
name: projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central1-a/queuedResources/your-queued-resource-id runtimeVersion: v2-alpha-tpuv5-lite schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central1-a
Console
Le champ État de la ressource en file d'attente affiche En attente de ressources.
Lister les demandes de ressources en file d'attente dans votre projet
Répertoriez les demandes de ressources en file d'attente dans votre projet :
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central1-a
Description des options de commande
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/your-zone/queuedResources
Description des options de commande
project
- Le Google Cloud projet dans lequel la ressource mise en file d'attente est allouée.
zone
- Zone dans laquelle vous prévoyez de créer votre Cloud TPU.
Console
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur l'onglet Ressources en file d'attente.
Java
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour vous authentifier auprès de Cloud TPU, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.