Creare una richiesta di prenotazione futura in modalità calendario


Questo documento spiega come creare una richiesta di prenotazione futura in modalità calendario. Per saperne di più su questo tipo di prenotazione, consulta Panoramica delle richieste di prenotazione futura in modalità calendario.

Crea una richiesta di prenotazione futura in modalità calendario per prenotare le seguenti risorse per un massimo di 90 giorni:

  • Fino a 80 istanze di macchine virtuali (VM) con GPU collegate.

  • Fino a 1024 chip TPU.

Nella data e nell'ora di consegna scelte, puoi creare VM GPU o TPU utilizzando la capacità prenotata. Utilizza le richieste di prenotazione futura in modalità calendario per ottenere risorse ad alta richiesta per i seguenti carichi di lavoro:

  • Job di pre-addestramento dei modelli

  • Job di ottimizzazione del modello

  • Workload di simulazione per il computing ad alte prestazioni (HPC)

  • Aumenti a breve termine dei carichi di lavoro di inferenza

Per prenotare più di 80 VM con GPU o per un periodo superiore a 90 giorni in una singola richiesta, consulta invece Prenotare la capacità nella documentazione di AI Hypercomputer.

Limitazioni

Le sezioni seguenti spiegano le limitazioni per le richieste di prenotazione future in modalità calendario.

Limitazioni per tutte le richieste

Tutte le richieste di prenotazione futura in modalità calendario presentano le seguenti limitazioni:

  • Puoi prenotare risorse per un periodo compreso tra 1 e 90 giorni.

  • Dopo aver creato e inviato una richiesta, non puoi annullarla, eliminarla o modificarla.

Limitazioni per le richieste di VM GPU

Puoi prenotare le VM GPU solo nel seguente modo:

  • Puoi prenotare da 1 a 80 VM con GPU per richiesta.

  • Puoi prenotare le seguenti serie di macchine:

  • Puoi prenotare VM con GPU solo in zone specifiche.

Limitazioni per le richieste di TPU

Puoi prenotare le TPU solo nel seguente modo:

  • Puoi prenotare 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024 chip TPU per richiesta.

  • Puoi prenotare le seguenti versioni di TPU:

  • Puoi prenotare solo 1, 4 o 8 chip TPU v5e per i tipi di workload di servizio (SERVING).

  • Puoi prenotare le TPU solo nelle seguenti zone:

    • Per TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Per TPU v5p:

      • us-east5-a
    • Per TPU v5e:

      • Per i tipi di workload batch (BATCH): us-west4-b

      • Per i tipi di workload di pubblicazione (SERVING): us-central1-a

Prima di iniziare

  • Se non riesci a utilizzare le richieste di prenotazione future in modalità calendario, potresti non avere l'idoneità all'accesso e all'utilizzo di questa funzionalità. In questo caso, contatta il tuo team dell'account o il team di vendita.
  • Per condividere la capacità prenotata con altri progetti all'interno della tua organizzazione, assicurati che il progetto in cui vuoi creare richieste di prenotazione futura in modalità calendario possa creare prenotazioni condivise. In caso contrario, si verificano degli errori.
  • Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione è il processo mediante il quale la tua identità viene verificata per l'accesso ai Google Cloud servizi e alle API. Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        Per saperne di più, consulta la sezione Autenticarsi per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare una richiesta di prenotazione futura in modalità calendario, chiedi all'amministratore di concederti il ruolo IAM Compute Future Reservation Admin (roles/compute.futureReservationAdmin) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene le autorizzazioni necessarie per creare una richiesta di prenotazione futura in modalità calendario. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per creare una richiesta di prenotazione futura in modalità calendario sono necessarie le seguenti autorizzazioni:

  • Per creare una richiesta di prenotazione futura: compute.futureReservations.create sul progetto
  • Per consentire a Compute Engine di creare automaticamente le prenotazioni: compute.reservations.create sul progetto
  • Per specificare un template di istanza: compute.instanceTemplates.useReadOnly sul template di istanza
  • Per visualizzare la disponibilità futura delle risorse: compute.advice.calendarMode sul progetto

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Panoramica

Per creare una richiesta di prenotazione futura in modalità calendario, segui questi passaggi:

  1. Visualizzare la disponibilità futura delle risorse. Visualizza la disponibilità futura delle VM con GPU o delle TPU che vuoi prenotare. Poi, quando crei una richiesta, specifica il numero, il tipo e la durata della prenotazione delle risorse che hai confermato come disponibili. Google Cloud è più probabile che approvi la tua richiesta se fornisci queste informazioni.

  2. Crea una richiesta di prenotazione per VM GPU o TPU. Crea e invia una richiesta di prenotazione futura in modalità calendario per VM GPU o TPU. Se riesci a creare una richiesta, Google Cloud la approva entro un minuto.

Visualizzare la disponibilità futura della risorsa

Puoi visualizzare la disponibilità futura per le VM GPU o le TPU in una regione nel seguente modo:

  • Per le VM GPU, fino a 60 giorni di anticipo

  • Per le TPU, fino a 120 giorni di anticipo

Per visualizzare la disponibilità futura di VM con GPU o TPU in una regione, seleziona una delle seguenti opzioni:

Console

Puoi visualizzare la disponibilità futura di VM con GPU o TPU in una regione quando crei una richiesta di prenotazione futura in modalità calendario. Per saperne di più, consulta Crea una richiesta di prenotazione per VM GPU o TPU in questo documento.

gcloud

Per visualizzare la disponibilità futura di VM con GPU o TPU in una regione, utilizza uno dei seguenti comandi gcloud beta compute advice calendar-mode. In base alle risorse che vuoi visualizzare, includi i seguenti flag:

  • Per visualizzare la disponibilità delle VM GPU, includi i flag --vm-count e --machine-type:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Per visualizzare la disponibilità delle TPU, includi i flag --chip-count e --tpu-version:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Sostituisci quanto segue:

  • NUMBER_OF_VMS: il numero di VM con GPU da prenotare.

  • MACHINE_TYPE: il tipo di macchina GPU da prenotare.

  • NUMBER_OF_CHIPS: il numero di chip TPU da prenotare.

  • TPU_VERSION: la versione TPU da prenotare. Specifica uno dei seguenti valori:

    • Per TPU v6e: V6E

    • Per TPU v5p: V5P

    • Per TPU v5e: V5E

    Se specifichi una TPU v5e, devi includere il flag --workload-type. Imposta questo flag sul tipo di workload che vuoi eseguire sulle TPU:

    • Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML), specifica BATCH.

    • Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.

  • REGION: la regione in cui prenotare VM con GPU o TPU. Per verificare quali regioni e zone sono supportate, consulta la sezione Limitazioni di questo documento.

  • FROM_START_TIME e TO_START_TIME: le date più vicine e più lontane in cui vuoi prenotare la capacità. Formatta queste date come timestamp RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Sostituisci quanto segue:

    • YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno a due cifre, separati da trattini (-).

    • HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).

    • OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario standard della costa del Pacifico (PST), specifica -08:00. Per non utilizzare alcun offset, specifica Z.

  • FROM_END_TIME e TO_END_TIME: le date di inizio e fine della prenotazione di capacità. Formatta queste date come timestamp RFC 3339. Se vuoi specificare un intervallo di durate per il periodo di prenotazione anziché le date e ore di fine, sostituisci il flag --end-time-range con il flag --duration-range.

L'output è simile al seguente:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Se le risorse richieste sono disponibili, l'output contiene i campi startTime, endTime e location. Questi campi specificano l'ora di inizio più presto, l'ora di fine più tardi e le zone in cui le risorse sono disponibili.

REST

Per visualizzare la disponibilità futura di VM GPU o TPU in una regione, effettua una richiesta GET al metodo advice.calendarMode beta. In base alle risorse che vuoi visualizzare, includi i seguenti campi nel corpo della richiesta:

  • Per visualizzare la disponibilità delle VM con GPU, includi i campi instanceCount e machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Per visualizzare la disponibilità delle TPU, includi i campi acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui vuoi prenotare le risorse.

  • REGION: la regione in cui vuoi prenotare VM con GPU o TPU. Per controllare le regioni e le zone supportate, consulta la sezione Limitazioni di questo documento.

  • NUMBER_OF_VMS: il numero di VM con GPU da prenotare.

  • MACHINE_TYPE: il tipo di macchina GPU da prenotare.

  • NUMBER_OF_CHIPS: il numero di chip TPU da prenotare.

  • TPU_VERSION: la versione TPU da prenotare. Specifica uno dei seguenti valori:

    • Per TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Per TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Per TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se specifichi una TPU v5e, nel campo aggregateResources devi includere il campo workloadType. Imposta questo campo sul tipo di workload che vuoi eseguire sulle TPU:

    • Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML), specifica BATCH.

    • Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.

  • FROM_START_TIME e TO_START_TIME: le date più vicine e più lontane in cui vuoi prenotare la capacità. Formatta queste date come timestamp RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Sostituisci quanto segue:

    • YYYY-MM-DD: una data formattata come anno a quattro cifre, mese a due cifre e giorno a due cifre, separati da trattini (-).

    • HH:MM:SS: un orario formattato con l'ora a due cifre utilizzando il sistema a 24 ore, i minuti a due cifre e i secondi a due cifre, separati da due punti (:).

    • OFFSET: il fuso orario formattato come offset rispetto al Tempo Universale Coordinato (UTC). Ad esempio, per utilizzare il fuso orario standard della costa del Pacifico (PST), specifica -08:00. Per non utilizzare alcun offset, specifica Z.

  • FROM_END_TIME e TO_END_TIME: le date di inizio e fine della prenotazione di capacità. Formatta queste date come timestamp RFC 3339. Se vuoi specificare un intervallo di durate per il periodo di prenotazione anziché orari di fine, sostituisci i campi endTimeNotEarlierThan e endTimeNotLaterThan con i campi minDuration e maxDuration.

L'output è simile al seguente:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Se le risorse richieste sono disponibili, l'output contiene i campi startTime, endTime e location. Questi campi specificano l'ora di inizio più presto, l'ora di fine più tardi e le zone in cui le risorse sono disponibili.

Crea una richiesta di prenotazione per VM GPU o TPU

Quando crei una richiesta di prenotazione futura in modalità calendario, puoi specificare un periodo di prenotazione solo nel seguente modo:

  • Ora di inizio: in base alle risorse che vuoi prenotare, devi specificare un'ora di inizio che sia almeno uno dei seguenti valori dal momento in cui crei e invii una richiesta:

    • Per le VM GPU, 87 ore (tre giorni e 15 ore)

    • Per le TPU, 24 ore

  • Ora di fine: puoi prenotare risorse per un massimo di 90 giorni.

Per creare una richiesta utilizzando una VM GPU esistente come riferimento, utilizza la consoleGoogle Cloud . In caso contrario, seleziona una delle seguenti opzioni:

Console

  1. Nella console Google Cloud , vai alla pagina Prenotazioni.

    Vai a Prenotazioni

  2. Fai clic sulla scheda Prenotazioni future.

  3. Fai clic su Crea prenotazione futura. Viene visualizzata la pagina Crea una prenotazione futura e viene selezionato il riquadro Configurazione hardware.

  4. Nella sezione Configurazione, specifica le proprietà delle VM con GPU o delle TPU che vuoi prenotare eseguendo una delle seguenti operazioni:

    • Per specificare direttamente le proprietà della VM GPU o della TPU:

      1. Seleziona Specifica il tipo di macchina.

      2. Fai clic sulla scheda GPU o TPU, quindi seleziona il tipo di macchina GPU o la versione TPU da prenotare.

    • Per specificare le proprietà della VM GPU utilizzando un modello di istanza esistente, seleziona Modello di istanza, quindi seleziona il modello.

    • Per specificare le proprietà della VM con GPU utilizzando una VM esistente come riferimento, seleziona Usa VM esistente e poi seleziona la VM.

  5. Se hai specificato una TPU v5e (CT5LP) nel passaggio precedente, seleziona una delle seguenti opzioni nell'elenco Tipo di workload TPU v5:

    • Per eseguire carichi di lavoro sulle TPU che gestiscono grandi quantità di dati in una o più operazioni, ad esempio carichi di lavoro di addestramento ML, seleziona Batch.

    • Per eseguire carichi di lavoro sulle TPU che gestiscono richieste simultanee e richiedono una latenza di rete minima, ad esempio carichi di lavoro di inferenza ML, seleziona Serving.

  6. Nella sezione Cerca capacità, completa i seguenti passaggi:

    1. Negli elenchi Regione e Zona, specifica la regione e la zona in cui vuoi prenotare le risorse. Per esaminare le regioni e le zone supportate, consulta la sezione Limitazioni di questo documento.

    2. Nel campo Capacità totale necessaria (quando prenoti VM GPU) o nell'elenco Numero di chip (quando prenoti TPU), specifica il numero di VM GPU o chip TPU da prenotare.

    3. Nell'elenco Ora di inizio, seleziona l'ora di inizio della richiesta.

    4. (Facoltativo) Nell'elenco Scegli la flessibilità della data di inizio, seleziona il livello di precisione della data di inizio.

    5. Nel campo Durata prenotazione, specifica per quanto tempo vuoi prenotare le risorse.

    6. Fai clic su Cerca capacità. Quindi, nella tabella Capacità disponibile, seleziona una delle opzioni disponibili che contengono il tipo, il numero e il periodo di prenotazione delle VM con GPU o delle TPU da prenotare.

  7. Fai clic su Avanti.

  8. Nella sezione Tipo di condivisione, seleziona i progetti con cui condividere la capacità richiesta:

    • Per utilizzare la capacità riservata solo all'interno del tuo progetto, seleziona Locale.

    • Per condividere la capacità prenotata con altri progetti, seleziona Condivisa, fai clic su Aggiungi progetti e segui le istruzioni per selezionare i progetti.

  9. Fai clic su Avanti.

  10. Nel campo Nome prenotazione futura, inserisci un nome per la richiesta.

  11. Nel campo Nome prenotazione, inserisci il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.

  12. Fai clic su Crea.

gcloud

Per creare una richiesta di prenotazione futura in modalità calendario e inviarla per la revisione, utilizza uno dei seguenti comandi gcloud beta compute future-reservations create. In base alle risorse che vuoi prenotare, includi i seguenti flag:

  • Per prenotare VM GPU, includi i flag --total-count e --machine-type:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Per prenotare TPU, includi i flag --chip-count e --tpu-version:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Sostituisci quanto segue:

  • FUTURE_RESERVATION_NAME: il nome della richiesta.

  • NUMBER_OF_VMS: il numero di VM con GPU da prenotare.

  • MACHINE_TYPE: il tipo di macchina GPU da prenotare.

  • NUMBER_OF_CHIPS: il numero di chip TPU da prenotare.

  • TPU_VERSION: la versione TPU da prenotare. Specifica uno dei seguenti valori:

    • Per TPU v6e: V6E

    • Per TPU v5p: V5P

    • Per TPU v5e: V5E

    Se specifichi una TPU v5e, devi includere il flag --workload-type. Imposta il flag sul tipo di carichi di lavoro che vuoi eseguire sulle TPU:

    • Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento del machine learning (ML), specifica BATCH.

    • Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.

  • RESERVATION_NAME: il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.

  • SHARE_TYPE: indica se altri progetti della tua organizzazione possono utilizzare la capacità riservata. Specifica uno dei seguenti valori:

    • Per utilizzare la capacità solo all'interno del tuo progetto: local

    • Per condividere la capacità con altri progetti: projects

    Se specifichi projects, devi includere il flag --share-with impostato su un elenco separato da virgole di ID progetto, ad esempio project-1,project-2. Puoi specificare fino a 100 progetti all'interno della tua organizzazione. Non includere l'ID progetto in questo elenco. Puoi utilizzare la capacità riservata per impostazione predefinita.

  • START_TIME: l'ora di inizio della richiesta, formattata come timestamp RFC 3339.

  • END_TIME: l'ora di fine del periodo di prenotazione, formattata come timestamp RFC 3339. Se vuoi specificare una durata, in secondi, per il periodo di prenotazione anziché una data e ora di fine, sostituisci il flag --end-time con il flag --duration.

  • ZONE: la zona in cui vuoi prenotare le risorse.

REST

Per creare una richiesta di prenotazione futura in modalità calendario e inviarla per la revisione, invia la seguente richiesta POST al metodo futureReservations.insert beta. In base alle risorse che vuoi prenotare, includi i seguenti campi nel corpo della richiesta:

  • Per prenotare VM GPU, includi i campi totalCount e machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Per prenotare TPU, includi i campi acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Sostituisci quanto segue:

  • PROJECT_ID: l'ID del progetto in cui vuoi creare la richiesta.

  • ZONE: la zona in cui vuoi prenotare le risorse.

  • FUTURE_RESERVATION_NAME: il nome della richiesta.

  • RESERVATION_NAME: il nome della prenotazione che Compute Engine crea automaticamente per eseguire il provisioning della capacità richiesta.

  • SHARE_TYPE: indica se altri progetti della tua organizzazione possono utilizzare la capacità riservata. Specifica uno dei seguenti valori:

    • Per utilizzare la capacità solo all'interno del tuo progetto: LOCAL

    • Per condividere la capacità con altri progetti: SPECIFIC_PROJECTS

    Se specifichi SPECIFIC_PROJECTS, nel campo shareSettings devi includere il campo projectMap per specificare i progetti con cui condividere la capacità. Puoi specificare fino a 100 progetti all'interno della tua organizzazione. Non specificare l'ID progetto. Per impostazione predefinita, puoi utilizzare la capacità riservata.

    Ad esempio, per condividere la capacità richiesta con altri due progetti, includi quanto segue:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Sostituisci CONSUMER_PROJECT_ID_1 e CONSUMER_PROJECT_ID_2 con gli ID di due progetti a cui vuoi consentire di utilizzare la capacità richiesta.

  • NUMBER_OF_VMS: il numero di VM con GPU da prenotare.

  • MACHINE_TYPE: il tipo di macchina GPU da prenotare.

  • NUMBER_OF_CHIPS: il numero di chip TPU da prenotare.

  • TPU_VERSION: la versione TPU da prenotare. Specifica uno dei seguenti valori:

    • Per TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Per TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Per TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se specifichi una TPU v5e, nel campo aggregateResources devi includere il campo workloadType. Imposta il campo sul tipo di carichi di lavoro che vuoi eseguire sulle TPU:

    • Per i carichi di lavoro che gestiscono grandi quantità di dati in una o più operazioni, come i carichi di lavoro di addestramento ML, specifica BATCH.

    • Per i carichi di lavoro che gestiscono richieste simultanee e richiedono una latenza di rete minima, come i carichi di lavoro di inferenza ML, specifica SERVING.

  • START_TIME: l'ora di inizio della richiesta, formattata come timestamp RFC 3339.

  • END_TIME: l'ora di fine del periodo di prenotazione, formattata come timestamp RFC 3339. Se vuoi specificare una durata, in secondi, per il periodo di prenotazione anziché un'ora di fine, sostituisci il campo endTime con il campo duration.

Passaggi successivi