Créer une demande de réservation future en mode Agenda


Ce document explique comment créer une demande de réservation future en mode calendrier. Pour en savoir plus sur ce type de réservation, consultez Présentation des requêtes de réservation futures en mode Agenda.

Créez une requête de réservation future en mode agenda pour réserver les ressources suivantes pendant 90 jours maximum :

  • Jusqu'à 80 instances de machines virtuelles (VM) auxquelles des GPU sont associés.

  • Jusqu'à 1 024 puces TPU.

À la date et à l'heure de livraison choisies, vous pouvez créer des VM GPU ou TPU en consommant la capacité réservée. Utilisez les requêtes de réservation futures en mode calendrier pour obtenir des ressources très demandées pour les charges de travail suivantes :

  • Jobs de pré-entraînement de modèles

  • Jobs d'affinage de modèles

  • Charges de travail de simulation de calcul hautes performances (HPC)

  • Augmentations à court terme des charges de travail d'inférence

Pour réserver plus de 80 VM GPU ou pour une durée supérieure à 90 jours dans une même demande, consultez plutôt Réserver de la capacité dans la documentation AI Hypercomputer.

Limites

Les sections suivantes expliquent les limites des demandes de réservation future en mode agenda.

Limites pour toutes les demandes

Toutes les demandes de réservations futures en mode Agenda sont soumises aux limites suivantes :

  • Vous pouvez réserver des ressources pour une période comprise entre 1 et 90 jours.

  • Une fois que vous avez créé et envoyé une demande, vous ne pouvez plus l'annuler, la supprimer ni la modifier.

Limites applicables aux requêtes de VM GPU

Vous ne pouvez réserver des VM GPU que comme suit :

  • Vous pouvez réserver entre 1 et 80 VM avec GPU par requête.

  • Vous pouvez réserver les séries de machines suivantes :

  • Vous ne pouvez réserver des VM avec GPU que dans des zones spécifiques.

Limites applicables aux demandes de TPU

Vous ne pouvez réserver des TPU que comme suit :

  • Vous pouvez réserver 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1 024 puces TPU par demande.

  • Vous pouvez réserver les versions de TPU suivantes :

  • Vous ne pouvez réserver que 1, 4 ou 8 puces TPU v5e pour les types de charges de travail de diffusion (SERVING).

  • Vous ne pouvez réserver des TPU que dans les zones suivantes :

    • Pour les TPU v6e :

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Pour les TPU v5p :

      • us-east5-a
    • Pour les TPU v5e :

      • Pour les types de charges de travail par lot (BATCH) : us-west4-b

      • Pour les types de charges de travail de diffusion (SERVING) : us-central1-a

Avant de commencer

  • Si vous ne pouvez pas utiliser les demandes de réservation future en mode Agenda, vous ne pourrez peut-être pas accéder à cette fonctionnalité ni l'utiliser. Dans ce cas, contactez votre équipe chargée du compte ou l'équipe commerciale.
  • Pour partager votre capacité réservée avec d'autres projets de votre organisation, assurez-vous que le projet dans lequel vous souhaitez créer des requêtes de réservation future en mode calendrier est autorisé à créer des réservations partagées. Sinon, vous rencontrerez des erreurs.
  • Si ce n'est pas déjà fait, configurez l'authentification. L'authentification est le processus permettant de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .

Rôles requis

Pour obtenir les autorisations nécessaires pour créer une demande de réservation future en mode calendrier, demandez à votre administrateur de vous accorder le rôle IAM Administrateur des réservations futures Compute (roles/compute.futureReservationAdmin) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.

Ce rôle prédéfini contient les autorisations requises pour créer une demande de réservation future en mode calendrier. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :

Autorisations requises

Vous devez disposer des autorisations suivantes pour créer une demande de réservation future en mode agenda :

  • Pour créer une requête de réservation future : compute.futureReservations.create sur le projet
  • Pour permettre à Compute Engine de créer automatiquement des réservations : compute.reservations.create sur le projet
  • Pour spécifier un modèle d'instance : compute.instanceTemplates.useReadOnly sur le modèle d'instance
  • Pour afficher la disponibilité future des ressources : compute.advice.calendarMode sur le projet

Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.

Présentation

Pour créer une requête de réservation future en mode calendrier, procédez comme suit :

  1. Affichez la disponibilité future des ressources. Consultez la disponibilité future des VM GPU ou des TPU que vous souhaitez réserver. Ensuite, lorsque vous créez une demande, spécifiez le nombre, le type et la durée de réservation des ressources que vous avez confirmées comme disponibles. Google Cloud est plus susceptible d'approuver votre demande si vous fournissez ces informations.

  2. Créer une demande de réservation pour des VM avec GPU ou des TPU Créez et envoyez une demande de réservation future en mode calendrier pour des VM avec GPU ou des TPU. Si vous parvenez à créer une demande, Google Cloud l'approuve en une minute.

Afficher la disponibilité future des ressources

Pour afficher la disponibilité future des VM GPU ou des TPU dans une région :

  • Pour les VM GPU : jusqu'à 60 jours à l'avance

  • Pour les TPU : jusqu'à 120 jours à l'avance

Pour afficher la disponibilité future des VM GPU ou TPU dans une région, sélectionnez l'une des options suivantes :

Console

Vous pouvez consulter la disponibilité future des VM avec GPU ou des TPU dans une région lorsque vous créez une requête de réservation future en mode calendrier. Pour en savoir plus, consultez Créer une demande de réservation pour des VM avec GPU ou des TPU dans ce document.

gcloud

Pour afficher la disponibilité future des VM GPU ou des TPU dans une région, utilisez l'une des commandes gcloud beta compute advice calendar-mode suivantes. En fonction des ressources que vous souhaitez afficher, incluez les indicateurs suivants :

  • Pour afficher la disponibilité des VM GPU, incluez les indicateurs --vm-count et --machine-type :

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Pour afficher la disponibilité des TPU, incluez les indicateurs --chip-count et --tpu-version :

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Remplacez les éléments suivants :

  • NUMBER_OF_VMS : nombre de VM avec GPU à réserver.

  • MACHINE_TYPE : type de machine GPU à réserver.

  • NUMBER_OF_CHIPS : nombre de puces TPU à réserver.

  • TPU_VERSION : version de TPU à réserver. Spécifiez l'une des valeurs suivantes :

    • Pour les TPU v6e : V6E

    • Pour les TPU v5p : V5P

    • Pour les TPU v5e : V5E

    Si vous spécifiez un TPU v5e, vous devez inclure l'option --workload-type. Définissez ce flag sur le type de charges de travail que vous souhaitez exécuter sur les TPU :

    • Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez BATCH.

    • Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez SERVING.

  • REGION : région dans laquelle réserver des VM avec GPU ou des TPU. Pour vérifier les régions et les zones compatibles, consultez la section Limites de ce document.

  • FROM_START_TIME et TO_START_TIME : dates de début et de fin de la période pour laquelle vous souhaitez réserver de la capacité. Mettez ces dates au format de code temporel RFC 3339 :

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Remplacez les éléments suivants :

    • YYYY-MM-DD : date respectant la syntaxe année à quatre chiffres, mois à deux chiffres et jour à deux chiffres, séparés par des traits d'union (-).

    • HH:MM:SS : heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:).

    • OFFSET : fuseau horaire mis en forme en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez -08:00. Pour n'utiliser aucun décalage, spécifiez Z.

  • FROM_END_TIME et TO_END_TIME : dates de début et de fin de la réservation de capacité. Mettez ces dates en forme en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez l'option --end-time-range par l'option --duration-range.

Le résultat ressemble à ce qui suit :

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Si les ressources demandées sont disponibles, la sortie contient les champs startTime, endTime et location. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.

REST

Pour afficher la disponibilité future des VM avec GPU ou des TPU dans une région, envoyez une requête GET à la méthode bêta advice.calendarMode. En fonction des ressources que vous souhaitez afficher, incluez les champs suivants dans le corps de la requête :

  • Pour afficher la disponibilité des VM GPU, incluez les champs instanceCount et machineType :

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Pour afficher la disponibilité des TPU, incluez les champs acceleratorCount et vmFamily :

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Remplacez les éléments suivants :

  • PROJECT_ID : ID du projet dans lequel vous souhaitez réserver des ressources.

  • REGION : région dans laquelle vous souhaitez réserver des VM GPU ou des TPU. Pour vérifier les régions et les zones compatibles, consultez la section Limites de ce document.

  • NUMBER_OF_VMS : nombre de VM avec GPU à réserver.

  • MACHINE_TYPE : type de machine GPU à réserver.

  • NUMBER_OF_CHIPS : nombre de puces TPU à réserver.

  • TPU_VERSION : version de TPU à réserver. Spécifiez l'une des valeurs suivantes :

    • Pour les TPU v6e : VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Pour les TPU v5p : VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Pour les TPU v5e : VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Si vous spécifiez un TPU v5e, vous devez inclure le champ workloadType dans le champ aggregateResources. Définissez ce champ sur le type de charges de travail que vous souhaitez exécuter sur les TPU :

    • Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez BATCH.

    • Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez SERVING.

  • FROM_START_TIME et TO_START_TIME : dates de début et de fin de la période pour laquelle vous souhaitez réserver de la capacité. Mettez ces dates au format de code temporel RFC 3339 :

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Remplacez les éléments suivants :

    • YYYY-MM-DD : date respectant la syntaxe année à quatre chiffres, mois à deux chiffres et jour à deux chiffres, séparés par des traits d'union (-).

    • HH:MM:SS : heure respectant la syntaxe heures à deux chiffres sur 24 heures, minutes à deux chiffres et secondes à deux chiffres, séparés par des signes deux-points (:).

    • OFFSET : fuseau horaire mis en forme en tant que décalage par rapport au temps universel coordonné (UTC). Par exemple, pour utiliser l'heure normale du Pacifique (PST), spécifiez -08:00. Pour n'utiliser aucun décalage, spécifiez Z.

  • FROM_END_TIME et TO_END_TIME : dates de début et de fin de la réservation de capacité. Mettez ces dates en forme en tant que codes temporels RFC 3339. Si vous souhaitez spécifier une plage de durées pour votre période de réservation au lieu d'heures de fin, remplacez les champs endTimeNotEarlierThan et endTimeNotLaterThan par les champs minDuration et maxDuration.

Le résultat ressemble à ce qui suit :

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Si les ressources demandées sont disponibles, la sortie contient les champs startTime, endTime et location. Ces champs spécifient l'heure de début la plus tôt, l'heure de fin la plus tardive et les zones où les ressources sont disponibles.

Créer une demande de réservation pour des VM avec GPU ou des TPU

Lorsque vous créez une requête de réservation future en mode calendrier, vous ne pouvez spécifier une période de réservation que comme suit :

  • Heure de début : en fonction des ressources que vous souhaitez réserver, vous devez spécifier une heure de début qui correspond à au moins l'une des valeurs suivantes à partir du moment où vous créez et envoyez une demande :

    • Pour les VM GPU : 87 heures (trois jours et 15 heures)

    • 24 heures pour les TPU

  • Heure de fin : vous pouvez réserver des ressources pour une durée maximale de 90 jours.

Pour créer une demande à l'aide d'une VM avec GPU existante comme référence, utilisez la consoleGoogle Cloud . Sinon, sélectionnez l'une des options suivantes :

Console

  1. Dans la console Google Cloud , accédez à la page Réservations.

    Accéder à la page "Réservations"

  2. Cliquez sur l'onglet Réservations futures.

  3. Cliquez sur Créer une réservation future. La page Créer une réservation future s'affiche et le volet Configuration matérielle est sélectionné.

  4. Dans la section Configuration, spécifiez les propriétés des VM GPU ou des TPU que vous souhaitez réserver en procédant de l'une des manières suivantes :

    • Pour spécifier directement les propriétés de la VM GPU ou de la TPU, procédez comme suit :

      1. Sélectionnez Spécifier un type de machine.

      2. Cliquez sur l'onglet GPU ou TPU, puis sélectionnez le type de machine GPU ou la version de TPU à réserver.

    • Pour spécifier les propriétés des VM avec GPU à l'aide d'un modèle d'instance existant, sélectionnez Modèle d'instance, puis sélectionnez le modèle.

    • Pour spécifier les propriétés d'une VM avec GPU en utilisant une VM existante comme référence, sélectionnez Utiliser une VM existante, puis sélectionnez la VM.

  5. Si vous avez spécifié un TPU v5e (CT5LP) à l'étape précédente, sélectionnez l'une des options suivantes dans la liste Type de charge de travail TPU v5 :

    • Pour exécuter des charges de travail sur les TPU qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement ML, sélectionnez Batch.

    • Pour exécuter des charges de travail sur les TPU qui gèrent les requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, sélectionnez Diffusion.

  6. Dans la section Rechercher une capacité, procédez comme suit :

    1. Dans les listes Région et Zone, spécifiez la région et la zone dans lesquelles vous souhaitez réserver des ressources. Pour consulter les régions et zones compatibles, consultez la section Limites de ce document.

    2. Dans le champ Capacité totale nécessaire (lors de la réservation de VM GPU) ou dans la liste Nombre de puces (lors de la réservation de TPU), spécifiez le nombre de VM GPU ou de puces TPU à réserver.

    3. Dans la liste Heure de début, sélectionnez l'heure de début de votre demande.

    4. Facultatif : Dans la liste Choisir la flexibilité de la date de début, sélectionnez le degré de précision de votre date de début.

    5. Dans le champ Durée de la réservation, indiquez la durée pendant laquelle vous souhaitez réserver des ressources.

    6. Cliquez sur Rechercher une capacité. Ensuite, dans le tableau Capacité disponible, sélectionnez l'une des options disponibles qui contiennent le type, le nombre et la période de réservation des VM GPU ou des TPU à réserver.

  7. Cliquez sur Suivant.

  8. Dans la section Type de partage, sélectionnez les projets avec lesquels vous souhaitez partager la capacité demandée :

    • Pour utiliser la capacité réservée uniquement dans votre projet, sélectionnez Local.

    • Pour partager la capacité réservée avec d'autres projets, sélectionnez Partagé, cliquez sur Ajouter des projets, puis suivez les instructions pour sélectionner les projets.

  9. Cliquez sur Suivant.

  10. Dans le champ Nom de la réservation future, saisissez un nom pour la demande.

  11. Dans le champ Nom de la réservation, saisissez le nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.

  12. Cliquez sur Créer.

gcloud

Pour créer une demande de réservation future en mode agenda et l'envoyer pour examen, utilisez l'une des commandes gcloud beta compute future-reservations create suivantes. En fonction des ressources que vous souhaitez réserver, incluez les indicateurs suivants :

  • Pour réserver des VM avec GPU, incluez les options --total-count et --machine-type :

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Pour réserver des TPU, incluez les options --chip-count et --tpu-version :

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Remplacez les éléments suivants :

  • FUTURE_RESERVATION_NAME : nom de la demande.

  • NUMBER_OF_VMS : nombre de VM avec GPU à réserver.

  • MACHINE_TYPE : type de machine GPU à réserver.

  • NUMBER_OF_CHIPS : nombre de puces TPU à réserver.

  • TPU_VERSION : version de TPU à réserver. Spécifiez l'une des valeurs suivantes :

    • Pour les TPU v6e : V6E

    • Pour les TPU v5p : V5P

    • Pour les TPU v5e : V5E

    Si vous spécifiez un TPU v5e, vous devez inclure l'option --workload-type. Définissez l'indicateur sur le type de charges de travail que vous souhaitez exécuter sur les TPU :

    • Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement du machine learning (ML), spécifiez BATCH.

    • Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez SERVING.

  • RESERVATION_NAME : nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.

  • SHARE_TYPE : indique si d'autres projets de votre organisation peuvent consommer la capacité réservée. Spécifiez une des valeurs suivantes :

    • Pour utiliser la capacité uniquement dans votre projet : local

    • Pour partager de la capacité avec d'autres projets : projects

    Si vous spécifiez projects, vous devez inclure l'indicateur --share-with défini sur une liste d'ID de projet séparés par une virgule (par exemple, project-1,project-2). Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'incluez pas l'ID de votre projet dans cette liste. Vous pouvez utiliser la capacité réservée par défaut.

  • START_TIME : heure de début de la demande, au format de code temporel RFC 3339.

  • END_TIME : heure de fin de votre période de réservation, au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez l'indicateur --end-time par l'indicateur --duration.

  • ZONE : la zone dans laquelle vous souhaitez réserver des ressources.

REST

Pour créer une demande de réservation future en mode agenda et l'envoyer pour examen, envoyez la requête POST suivante à la méthode bêta futureReservations.insert. En fonction des ressources que vous souhaitez réserver, incluez les champs suivants dans le corps de la requête :

  • Pour réserver des VM GPU, incluez les champs totalCount et machineType :

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Pour réserver des TPU, incluez les champs acceleratorCount et vmFamily :

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Remplacez les éléments suivants :

  • PROJECT_ID : ID du projet dans lequel vous souhaitez créer la requête.

  • ZONE : la zone dans laquelle vous souhaitez réserver des ressources.

  • FUTURE_RESERVATION_NAME : nom de la demande.

  • RESERVATION_NAME : nom de la réservation que Compute Engine crée automatiquement pour provisionner la capacité demandée.

  • SHARE_TYPE : indique si d'autres projets de votre organisation peuvent consommer la capacité réservée. Spécifiez une des valeurs suivantes :

    • Pour utiliser la capacité uniquement dans votre projet : LOCAL

    • Pour partager de la capacité avec d'autres projets : SPECIFIC_PROJECTS

    Si vous spécifiez SPECIFIC_PROJECTS, vous devez inclure le champ projectMap dans le champ shareSettings pour spécifier les projets avec lesquels partager la capacité. Vous pouvez spécifier jusqu'à 100 projets dans votre organisation. N'indiquez pas l'ID de votre projet. Vous pouvez utiliser la capacité réservée par défaut.

    Par exemple, pour partager la capacité demandée avec deux autres projets, incluez les éléments suivants :

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Remplacez CONSUMER_PROJECT_ID_1 et CONSUMER_PROJECT_ID_2 par les ID des deux projets que vous souhaitez autoriser à consommer la capacité demandée.

  • NUMBER_OF_VMS : nombre de VM avec GPU à réserver.

  • MACHINE_TYPE : type de machine GPU à réserver.

  • NUMBER_OF_CHIPS : nombre de puces TPU à réserver.

  • TPU_VERSION : version de TPU à réserver. Spécifiez l'une des valeurs suivantes :

    • Pour les TPU v6e : VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Pour les TPU v5p : VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Pour les TPU v5e : VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Si vous spécifiez un TPU v5e, vous devez inclure le champ workloadType dans le champ aggregateResources. Définissez le champ sur le type de charges de travail que vous souhaitez exécuter sur les TPU :

    • Pour les charges de travail qui gèrent de grandes quantités de données en une ou plusieurs opérations, telles que les charges de travail d'entraînement ML, spécifiez BATCH.

    • Pour les charges de travail qui gèrent des requêtes simultanées et nécessitent une latence réseau minimale, comme les charges de travail d'inférence ML, spécifiez SERVING.

  • START_TIME : heure de début de la demande, au format de code temporel RFC 3339.

  • END_TIME : heure de fin de votre période de réservation, au format de code temporel RFC 3339. Si vous souhaitez spécifier une durée, en secondes, pour votre période de réservation au lieu d'une heure de fin, remplacez le champ endTime par le champ duration.

Étapes suivantes