Ce document explique comment créer une demande de réservation future en mode calendrier. Pour en savoir plus sur ce type de réservation, consultez Présentation des requêtes de réservation futures en mode Agenda.
Créez une requête de réservation future en mode agenda pour réserver les ressources suivantes pendant 90 jours maximum :
Jusqu'à 80 instances de machines virtuelles (VM) auxquelles des GPU sont associés.
Jusqu'à 1 024 puces TPU.
À la date et à l'heure de livraison choisies, vous pouvez créer des VM GPU ou TPU en consommant la capacité réservée. Utilisez les requêtes de réservation futures en mode calendrier pour obtenir des ressources très demandées pour les charges de travail suivantes :
Jobs de pré-entraînement de modèles
Jobs d'affinage de modèles
Charges de travail de simulation de calcul hautes performances (HPC)
Augmentations à court terme des charges de travail d'inférence
Pour réserver plus de 80 VM GPU ou pour une durée supérieure à 90 jours dans une même demande, consultez plutôt Réserver de la capacité dans la documentation AI Hypercomputer.
Limites
Les sections suivantes expliquent les limites des demandes de réservation future en mode agenda.
Limites pour toutes les demandes
Toutes les demandes de réservations futures en mode Agenda sont soumises aux limites suivantes :
Vous pouvez réserver des ressources pour une période comprise entre 1 et 90 jours.
Une fois que vous avez créé et envoyé une demande, vous ne pouvez plus l'annuler, la supprimer ni la modifier.
Limites applicables aux requêtes de VM GPU
Vous ne pouvez réserver des VM GPU que comme suit :
Vous pouvez réserver entre 1 et 80 VM avec GPU par requête.
Vous pouvez réserver les séries de machines suivantes :
Vous ne pouvez réserver des VM avec GPU que dans des zones spécifiques.
Limites applicables aux demandes de TPU
Vous ne pouvez réserver des TPU que comme suit :
Vous pouvez réserver 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1 024 puces TPU par demande.
Vous pouvez réserver les versions de TPU suivantes :
Vous ne pouvez réserver que 1, 4 ou 8 puces TPU v5e pour les types de charges de travail de diffusion (
SERVING
).Vous ne pouvez réserver des TPU que dans les zones suivantes :
Pour les TPU v6e :
asia-northeast1-b
us-east5-a
us-east5-b
Pour les TPU v5p :
us-east5-a
Pour les TPU v5e :
Pour les types de charges de travail par lot (
BATCH
) :us-west4-b
Pour les types de charges de travail de diffusion (
SERVING
) :us-central1-a
Avant de commencer
- Si vous ne pouvez pas utiliser les demandes de réservation future en mode Agenda, vous ne pourrez peut-être pas accéder à cette fonctionnalité ni l'utiliser. Dans ce cas, contactez votre équipe chargée du compte ou l'équipe commerciale.
- Pour partager votre capacité réservée avec d'autres projets de votre organisation, assurez-vous que le projet dans lequel vous souhaitez créer des requêtes de réservation future en mode calendrier est autorisé à créer des réservations partagées. Sinon, vous rencontrerez des erreurs.
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification est le processus permettant de valider votre identité pour accéder aux services et aux API Google Cloud .
Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
Pour créer une requête de réservation future :
compute.futureReservations.create
sur le projet -
Pour permettre à Compute Engine de créer automatiquement des réservations :
compute.reservations.create
sur le projet -
Pour spécifier un modèle d'instance :
compute.instanceTemplates.useReadOnly
sur le modèle d'instance -
Pour afficher la disponibilité future des ressources :
compute.advice.calendarMode
sur le projet Affichez la disponibilité future des ressources. Consultez la disponibilité future des VM GPU ou des TPU que vous souhaitez réserver. Ensuite, lorsque vous créez une demande, spécifiez le nombre, le type et la durée de réservation des ressources que vous avez confirmées comme disponibles. Google Cloud est plus susceptible d'approuver votre demande si vous fournissez ces informations.
Créer une demande de réservation pour des VM avec GPU ou des TPU Créez et envoyez une demande de réservation future en mode calendrier pour des VM avec GPU ou des TPU. Si vous parvenez à créer une demande, Google Cloud l'approuve en une minute.
Pour les VM GPU : jusqu'à 60 jours à l'avance
Pour les TPU : jusqu'à 120 jours à l'avance
Pour afficher la disponibilité des VM GPU, incluez les indicateurs
--vm-count
et--machine-type
:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Pour afficher la disponibilité des TPU, incluez les indicateurs
--chip-count
et--tpu-version
:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
NUMBER_OF_VMS
: nombre de VM avec GPU à réserver.MACHINE_TYPE
: type de machine GPU à réserver.NUMBER_OF_CHIPS
: nombre de puces TPU à réserver.TPU_VERSION
: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU v6e :
V6E
Pour les TPU v5p :
V5P
Pour les TPU v5e :
V5E
Si vous spécifiez un TPU v5e, vous devez inclure l'option
--workload-type
. Définissez ce flag sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez
BATCH
.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez
SERVING
.
REGION
: région dans laquelle réserver des VM avec GPU ou des TPU. Pour vérifier les régions et les zones compatibles, consultez la section Limites de ce document.FROM_START_TIME
etTO_START_TIME
: dates de début et de fin de la période pour laquelle vous souhaitez réserver de la capacité. Mettez ces dates au format de code temporel RFC 3339 :YYYY-MM-DDTHH:MM:SSOFFSET
Remplacez les éléments suivants :
YYYY-MM-DD
: date respectant la syntaxe année à quatre chiffres, mois à deux chiffres et jour à deux chiffres, séparés par des traits d'union (-
).HH:MM:SS
: heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:
).OFFSET
: fuseau horaire mis en forme en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez-08:00
. Pour n'utiliser aucun décalage, spécifiezZ
.
FROM_END_TIME
etTO_END_TIME
: dates de début et de fin de la réservation de capacité. Mettez ces dates en forme en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez l'option--end-time-range
par l'option--duration-range
.Pour afficher la disponibilité des VM GPU, incluez les champs
instanceCount
etmachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Pour afficher la disponibilité des TPU, incluez les champs
acceleratorCount
etvmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
PROJECT_ID
: ID du projet dans lequel vous souhaitez réserver des ressources.REGION
: région dans laquelle vous souhaitez réserver des VM GPU ou des TPU. Pour vérifier les régions et les zones compatibles, consultez la section Limites de ce document.NUMBER_OF_VMS
: nombre de VM avec GPU à réserver.MACHINE_TYPE
: type de machine GPU à réserver.NUMBER_OF_CHIPS
: nombre de puces TPU à réserver.TPU_VERSION
: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU v6e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Pour les TPU v5p :
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Pour les TPU v5e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si vous spécifiez un TPU v5e, vous devez inclure le champ
workloadType
dans le champaggregateResources
. Définissez ce champ sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez
BATCH
.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez
SERVING
.
FROM_START_TIME
etTO_START_TIME
: dates de début et de fin de la période pour laquelle vous souhaitez réserver de la capacité. Mettez ces dates au format de code temporel RFC 3339 :YYYY-MM-DDTHH:MM:SSOFFSET
Remplacez les éléments suivants :
YYYY-MM-DD
: date respectant la syntaxe année à quatre chiffres, mois à deux chiffres et jour à deux chiffres, séparés par des traits d'union (-
).HH:MM:SS
: heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:
).OFFSET
: fuseau horaire mis en forme en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez-08:00
. Pour n'utiliser aucun décalage, spécifiezZ
.
FROM_END_TIME
etTO_END_TIME
: dates de début et de fin de la réservation de capacité. Mettez ces dates en forme en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez les champsendTimeNotEarlierThan
etendTimeNotLaterThan
par les champsminDuration
etmaxDuration
.Heure de début : en fonction des ressources que vous souhaitez réserver, vous devez spécifier une heure de début qui correspond à au moins l'une des valeurs suivantes à partir du moment où vous créez et envoyez une demande :
Pour les VM GPU : 87 heures (trois jours et 15 heures)
24 heures pour les TPU
Heure de fin : vous pouvez réserver des ressources pour une durée maximale de 90 jours.
Dans la console Google Cloud , accédez à la page Réservations.
Cliquez sur l'onglet Réservations futures.
Cliquez sur
Créer une réservation future. La page Créer une réservation future s'affiche et le volet Configuration matérielle est sélectionné.Dans la section Configuration, spécifiez les propriétés des VM GPU ou des TPU que vous souhaitez réserver en procédant de l'une des manières suivantes :
Pour spécifier directement les propriétés de la VM GPU ou de la TPU, procédez comme suit :
Sélectionnez Spécifier un type de machine.
Cliquez sur l'onglet GPU ou TPU, puis sélectionnez le type de machine GPU ou la version de TPU à réserver.
Pour spécifier les propriétés des VM avec GPU à l'aide d'un modèle d'instance existant, sélectionnez Modèle d'instance, puis sélectionnez le modèle.
Pour spécifier les propriétés d'une VM avec GPU en utilisant une VM existante comme référence, sélectionnez Utiliser une VM existante, puis sélectionnez la VM.
Si vous avez spécifié un TPU v5e (CT5LP) à l'étape précédente, sélectionnez l'une des options suivantes dans la liste Type de charge de travail TPU v5 :
Pour exécuter des charges de travail sur les TPU qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement ML, sélectionnez Batch.
Pour exécuter des charges de travail sur les TPU qui gèrent les requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, sélectionnez Diffusion.
Dans la section Rechercher une capacité, procédez comme suit :
Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour consulter les régions et zones compatibles, consultez la section Limites de ce document.
Dans le champ Capacité totale nécessaire (lors de la réservation de VM GPU) ou dans la liste Nombre de puces (lors de la réservation de TPU), spécifiez le nombre de VM GPU ou de puces TPU à réserver.
Dans la liste Heure de début, sélectionnez l'heure de début de votre demande.
Facultatif : Dans la liste Choisir la flexibilité de la date de début, sélectionnez le degré de précision de votre date de début.
Dans le champ Durée de la réservation, indiquez la durée pendant laquelle vous souhaitez réserver des ressources.
Cliquez sur Rechercher une capacité. Ensuite, dans le tableau Capacité disponible, sélectionnez l'une des options disponibles qui contiennent le type, le nombre et la période de réservation des VM GPU ou des TPU à réserver.
Cliquez sur Suivant.
Dans la section Type de partage, sélectionnez les projets avec lesquels vous souhaitez partager la capacité demandée :
Pour utiliser la capacité réservée uniquement dans votre projet, sélectionnez Local.
Pour partager la capacité réservée avec d'autres projets, sélectionnez Partagé, cliquez sur
Ajouter des projets, puis suivez les instructions pour sélectionner les projets.
Cliquez sur Suivant.
Dans le champ Nom de la réservation future, saisissez un nom pour la demande.
Dans le champ Nom de la réservation, saisissez le nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.
Cliquez sur Créer.
Pour réserver des VM avec GPU, incluez les options
--total-count
et--machine-type
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Pour réserver des TPU, incluez les options
--chip-count
et--tpu-version
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
FUTURE_RESERVATION_NAME
: nom de la demande.NUMBER_OF_VMS
: nombre de VM avec GPU à réserver.MACHINE_TYPE
: type de machine GPU à réserver.NUMBER_OF_CHIPS
: nombre de puces TPU à réserver.TPU_VERSION
: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU v6e :
V6E
Pour les TPU v5p :
V5P
Pour les TPU v5e :
V5E
Si vous spécifiez un TPU v5e, vous devez inclure l'option
--workload-type
. Définissez l'indicateur sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez
BATCH
.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez
SERVING
.
RESERVATION_NAME
: nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.SHARE_TYPE
: indique si d'autres projets de votre organisation peuvent consommer la capacité réservée. Spécifiez une des valeurs suivantes :Pour utiliser la capacité uniquement dans votre projet :
local
Pour partager de la capacité avec d'autres projets :
projects
Si vous spécifiez
projects
, vous devez inclure l'indicateur--share-with
défini sur une liste d'ID de projet séparés par une virgule (par exemple,project-1,project-2
). Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'incluez pas l'ID de votre projet dans cette liste. Vous pouvez utiliser la capacité réservée par défaut.START_TIME
: heure de début de la demande, au format de code temporel RFC 3339.END_TIME
: heure de fin de votre période de réservation, au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez l'indicateur--end-time
par l'indicateur--duration
.ZONE
: la zone dans laquelle vous souhaitez réserver des ressources.Pour réserver des VM GPU, incluez les champs
totalCount
etmachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Pour réserver des TPU, incluez les champs
acceleratorCount
etvmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
PROJECT_ID
: ID du projet dans lequel vous souhaitez créer la requête.ZONE
: la zone dans laquelle vous souhaitez réserver des ressources.FUTURE_RESERVATION_NAME
: nom de la demande.RESERVATION_NAME
: nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.SHARE_TYPE
: indique si d'autres projets de votre organisation peuvent consommer la capacité réservée. Spécifiez une des valeurs suivantes :Pour utiliser la capacité uniquement dans votre projet :
LOCAL
Pour partager de la capacité avec d'autres projets :
SPECIFIC_PROJECTS
Si vous spécifiez
SPECIFIC_PROJECTS
, vous devez inclure le champprojectMap
dans le champshareSettings
pour spécifier les projets avec lesquels partager la capacité. Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'indiquez pas l'ID de votre projet. Vous pouvez utiliser la capacité réservée par défaut.Par exemple, pour partager la capacité demandée avec deux autres projets, incluez les éléments suivants :
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }
Remplacez
CONSUMER_PROJECT_ID_1
etCONSUMER_PROJECT_ID_2
par les ID des deux projets que vous souhaitez autoriser à consommer la capacité demandée.NUMBER_OF_VMS
: nombre de VM avec GPU à réserver.MACHINE_TYPE
: type de machine GPU à réserver.NUMBER_OF_CHIPS
: nombre de puces TPU à réserver.TPU_VERSION
: version de TPU à réserver. Spécifiez l'une des valeurs suivantes :Pour les TPU v6e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Pour les TPU v5p :
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Pour les TPU v5e :
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si vous spécifiez un TPU v5e, vous devez inclure le champ
workloadType
dans le champaggregateResources
. Définissez le champ sur le type de charges de travail que vous souhaitez exécuter sur les TPU :Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement ML, spécifiez
BATCH
.Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez
SERVING
.
START_TIME
: heure de début de la demande, au format de code temporel RFC 3339.END_TIME
: heure de fin de votre période de réservation, au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez le champendTime
par le champduration
.Consommer une réservation créée automatiquement pour les VM avec GPU dans Compute Engine
Utiliser une réservation créée automatiquement pour les TPU dans Cloud TPU
Utiliser une réservation créée automatiquement avec des jobs de prédiction Vertex AI
Utiliser une réservation créée automatiquement avec des jobs d'entraînement Vertex AI
Afficher les réservations ou les demandes de réservations futures
REST
Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires pour créer une demande de réservation future en mode calendrier, demandez à votre administrateur de vous accorder le rôle IAM Administrateur des réservations futures Compute (
roles/compute.futureReservationAdmin
) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.Ce rôle prédéfini contient les autorisations requises pour créer une demande de réservation future en mode calendrier. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Vous devez disposer des autorisations suivantes pour créer une demande de réservation future en mode agenda :
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Présentation
Pour créer une requête de réservation future en mode calendrier, procédez comme suit :
Afficher la disponibilité future des ressources
Pour afficher la disponibilité future des VM GPU ou des TPU dans une région :
Pour afficher la disponibilité future des VM GPU ou TPU dans une région, sélectionnez l'une des options suivantes :
Console
Vous pouvez consulter la disponibilité future des VM avec GPU ou des TPU dans une région lorsque vous créez une requête de réservation future en mode calendrier. Pour en savoir plus, consultez Créer une demande de réservation pour des VM avec GPU ou des TPU dans ce document.
gcloud
Pour afficher la disponibilité future des VM GPU ou des TPU dans une région, utilisez l'une des commandes
gcloud beta compute advice calendar-mode
suivantes. En fonction des ressources que vous souhaitez afficher, incluez les indicateurs suivants :Remplacez les éléments suivants :
Le résultat ressemble à ce qui suit :
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'
Si les ressources demandées sont disponibles, la sortie contient les champs
startTime
,endTime
etlocation
. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.REST
Pour afficher la disponibilité future des VM avec GPU ou des TPU dans une région, envoyez une requête
GET
à la méthode bêtaadvice.calendarMode
. En fonction des ressources que vous souhaitez afficher, incluez les champs suivants dans le corps de la requête :Remplacez les éléments suivants :
Le résultat ressemble à ce qui suit :
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }
Si les ressources demandées sont disponibles, la sortie contient les champs
startTime
,endTime
etlocation
. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.Créer une demande de réservation pour des VM avec GPU ou des TPU
Lorsque vous créez une requête de réservation future en mode calendrier, vous ne pouvez spécifier une période de réservation que comme suit :
Pour créer une demande à l'aide d'une VM avec GPU existante comme référence, utilisez la consoleGoogle Cloud . Sinon, sélectionnez l'une des options suivantes :
Console
gcloud
Pour créer une demande de réservation future en mode agenda et l'envoyer pour examen, utilisez l'une des commandes
gcloud beta compute future-reservations create
suivantes. En fonction des ressources que vous souhaitez réserver, incluez les indicateurs suivants :Remplacez les éléments suivants :
REST
Pour créer une demande de réservation future en mode agenda et l'envoyer pour examen, envoyez la requête
POST
suivante à la méthode bêtafutureReservations.insert
. En fonction des ressources que vous souhaitez réserver, incluez les champs suivants dans le corps de la requête :Remplacez les éléments suivants :
Étapes suivantes
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/14 (UTC).
-