Anfrage für zukünftige Reservierungen im Kalendermodus erstellen


In diesem Dokument wird erläutert, wie Sie eine zukünftige Reservierungsanfrage im Kalendermodus erstellen. Weitere Informationen zu dieser Art von Reservierung finden Sie unter Vorausschauende Reservierungsanfragen im Kalendermodus – Übersicht.

Erstellen Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus, um die folgenden Ressourcen für bis zu 90 Tage zu reservieren:

  • Bis zu 80 VM-Instanzen mit angehängten GPUs.

  • Bis zu 1.024 TPU-Chips.

Am von Ihnen ausgewählten Lieferdatum und zur ausgewählten Lieferzeit können Sie GPU- oder TPU-VMs erstellen, indem Sie die reservierte Kapazität nutzen. Mit Anfragen für vorausschauende Reservierungen im Kalendermodus können Sie Ressourcen mit hoher Nachfrage für die folgenden Arbeitslasten erhalten:

  • Jobs zum Vortrainieren von Modellen

  • Jobs zur Modellabstimmung

  • Arbeitslasten für HPC-Simulationen (High Performance Computing)

  • Kurzfristige Steigerungen bei Inferenzarbeitslasten

Wenn Sie mehr als 80 GPU-VMs oder für länger als 90 Tage in einer einzelnen Anfrage reservieren möchten, lesen Sie stattdessen die AI Hypercomputer-Dokumentation unter Kapazität reservieren.

Beschränkungen

In den folgenden Abschnitten werden die Einschränkungen für zukünftige Reservierungsanfragen im Kalendermodus erläutert.

Beschränkungen für alle Anfragen

Für alle Anfragen für zukünftige Reservierungen im Kalendermodus gelten die folgenden Einschränkungen:

  • Sie können Ressourcen für einen Zeitraum zwischen 1 und 90 Tagen reservieren.

  • Nachdem Sie eine Anfrage erstellt und eingereicht haben, können Sie sie nicht mehr stornieren, löschen oder ändern.

Einschränkungen für Anfragen für GPU-VMs

Sie können GPU-VMs nur so reservieren:

  • Sie können pro Anfrage zwischen 1 und 80 GPU-VMs reservieren.

  • Sie können die folgenden Maschinenserien reservieren:

  • Sie können GPU-VMs nur in bestimmten Zonen reservieren.

Einschränkungen für Anfragen für TPUs

TPUs können nur so reserviert werden:

  • Sie können pro Anfrage 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1.024 TPU-Chips reservieren.

  • Sie können die folgenden TPU-Versionen reservieren:

  • Sie können nur 1, 4 oder 8 TPU v5e-Chips für Arbeitslasttypen vom Typ „Serving“ (SERVING) reservieren.

  • Sie können TPUs nur in den folgenden Zonen reservieren:

    • Für TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Für TPU v5p:

      • us-east5-a
    • Für TPU v5e:

      • Für Batch-Arbeitslasttypen (BATCH): us-west4-b

      • Für Serving-Arbeitslasttypen (SERVING): us-central1-a

Hinweise

  • Wenn Sie im Kalendermodus keine Anfragen für zukünftige Reservierungen verwenden können, haben Sie möglicherweise keinen Zugriff auf diese Funktion. Wenden Sie sich in diesem Fall an Ihr Kontoteam oder das Vertriebsteam.
  • Wenn Sie Ihre reservierte Kapazität für andere Projekte in Ihrer Organisation freigeben möchten, muss das Projekt, in dem Sie Anfragen für vorausschauende Reservierungen im Kalendermodus erstellen möchten, zum Erstellen freigegebener Reservierungen berechtigt sein. Andernfalls treten Fehler auf.
  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft. Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.
    <x0A>

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Future Reservation Admin (roles/compute.futureReservationAdmin) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um eine Anfrage für eine zukünftige Reservierung im Kalendermodus zu erstellen:

  • So erstellen Sie eine zukünftige Reservierungsanfrage: compute.futureReservations.create für das Projekt
  • So werden von Compute Engine Reservierungen automatisch erstellt: compute.reservations.create für das Projekt
  • So geben Sie eine Instanzvorlage an: compute.instanceTemplates.useReadOnly für die Instanzvorlage
  • So sehen Sie die zukünftige Verfügbarkeit von Ressourcen: compute.advice.calendarMode im Projekt

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Übersicht

So erstellen Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus:

  1. Zukünftige Verfügbarkeit von Ressourcen ansehen Sehen Sie sich die zukünftige Verfügbarkeit der GPU-VMs oder TPUs an, die Sie reservieren möchten. Geben Sie dann beim Erstellen einer Anfrage die Anzahl, den Typ und die Reservierungsdauer der Ressourcen an, die Sie als verfügbar bestätigt haben. Google Cloud genehmigt Ihre Anfrage mit größerer Wahrscheinlichkeit, wenn Sie diese Informationen angeben.

  2. Reservierungsanfrage für GPU-VMs oder TPUs erstellen Erstellen und senden Sie im Kalendermodus eine zukünftige Reservierungsanfrage für GPU-VMs oder TPUs. Wenn Sie eine Anfrage erfolgreich erstellen können, genehmigt Google Cloud sie innerhalb einer Minute.

Zukünftige Verfügbarkeit von Ressourcen ansehen

So rufen Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region auf:

  • Für GPU-VMs bis zu 60 Tage im Voraus

  • Für TPUs bis zu 120 Tage im Voraus

Wählen Sie eine der folgenden Optionen aus, um die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufzurufen:

Console

Wenn Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus erstellen, können Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region ansehen. Weitere Informationen finden Sie in diesem Dokument unter Reservierungsanfrage für GPU-VMs oder TPUs erstellen.

gcloud

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, verwenden Sie einen der folgenden gcloud beta compute advice calendar-mode-Befehle. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Flags ein:

  • Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Flags --vm-count und --machine-type ein:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Wenn Sie die TPU-Verfügbarkeit aufrufen möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Ersetzen Sie Folgendes:

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs.

  • MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips.

  • TPU_VERSION: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:

    • Für TPU v6e: V6E

    • Für TPU v5p: V5P

    • Für TPU v5e: V5E

    Wenn Sie eine TPU v5e angeben, müssen Sie das Flag --workload-type angeben. Legen Sie dieses Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • REGION: die Region, in der GPU-VMs oder TPUs reserviert werden sollen. Informationen dazu, welche Regionen und Zonen unterstützt werden, finden Sie in diesem Dokument unter Beschränkungen.

  • FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ersetzen Sie Folgendes:

    • YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.

    • HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.

    • OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.

  • FROM_END_TIME und TO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Dauern für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag --end-time-range durch das --duration-range-Flag.

Die Ausgabe sieht etwa so aus:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder startTime, endTime und location. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.

REST

Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, senden Sie eine GET-Anfrage an die Betaversion der Methode advice.calendarMode. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Felder in den Anfragetext ein:

  • Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Felder instanceCount und machineType ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Wenn Sie die TPU-Verfügbarkeit sehen möchten, fügen Sie die Felder acceleratorCount und vmFamily ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem Sie Ressourcen reservieren möchten.

  • REGION: die Region, in der Sie GPU-VMs oder TPUs reservieren möchten. Informationen zu den unterstützten Regionen und Zonen finden Sie in diesem Dokument unter Einschränkungen.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs.

  • MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips.

  • TPU_VERSION: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:

    • Für TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Für TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Für TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Wenn Sie eine TPU v5e angeben, müssen Sie im Feld aggregateResources das Feld workloadType angeben. Legen Sie dieses Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • FROM_START_TIME und TO_START_TIME: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Ersetzen Sie Folgendes:

    • YYYY-MM-DD: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-) getrennt.

    • HH:MM:SS: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:) ist.

    • OFFSET: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie -08:00 an. Wenn Sie keinen Versatz verwenden möchten, geben Sie Z an.

  • FROM_END_TIME und TO_END_TIME: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Zeiträumen für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie die Felder endTimeNotEarlierThan und endTimeNotLaterThan durch die Felder minDuration und maxDuration.

Die Ausgabe sieht etwa so aus:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder startTime, endTime und location. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.

Reservierungsanfrage für GPU-VMs oder TPUs erstellen

Wenn Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus erstellen, können Sie den Reservierungszeitraum nur so angeben:

  • Startzeit: Je nach den Ressourcen, die Sie reservieren möchten, müssen Sie eine Startzeit angeben, die mindestens einen der folgenden Werte nach dem Zeitpunkt liegt, zu dem Sie eine Anfrage erstellen und einreichen:

    • Für GPU-VMs: 87 Stunden (3 Tage und 15 Stunden)

    • Für TPUs: 24 Stunden

  • Ende: Sie können Ressourcen für maximal 90 Tage reservieren.

Wenn Sie eine Anfrage erstellen möchten, indem Sie eine vorhandene GPU-VM als Referenz verwenden, nutzen Sie dieGoogle Cloud Console. Wählen Sie andernfalls eine der folgenden Optionen aus:

Console

  1. Rufen Sie in der Google Cloud Console die Seite IAM auf.

    Zu „Reservierungen“

  2. Klicken Sie auf den Tab Zukünftige Reservierungen.

  3. Klicken Sie auf Zukünftige Reservierung erstellen. Die Seite Zukünftige Reservierung erstellen wird angezeigt und der Bereich Hardwarekonfiguration ist ausgewählt.

  4. Geben Sie im Abschnitt Konfiguration die Attribute der GPU-VMs oder TPUs an, die Sie reservieren möchten. Gehen Sie dazu so vor:

    • So geben Sie GPU-VM- oder TPU-Attribute direkt an:

      1. Wählen Sie Maschinentyp angeben aus.

      2. Klicken Sie auf den Tab GPUs oder TPUs und wählen Sie dann den GPU-Maschinentyp oder die TPU-Version aus, die Sie reservieren möchten.

    • Wenn Sie die Attribute von GPU-VMs mit einer vorhandenen Instanzvorlage angeben möchten, wählen Sie Instanzvorlage und dann die Vorlage aus.

    • Wenn Sie die Attribute der GPU-VM mithilfe einer vorhandenen VM als Referenz angeben möchten, wählen Sie Vorhandene VM verwenden und dann die VM aus.

  5. Wenn Sie im vorherigen Schritt eine TPU v5e (CT5LP) angegeben haben, wählen Sie in der Liste Arbeitslasttyp von TPU v5 eine der folgenden Optionen aus:

    • Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die große Datenmengen in einzelnen oder mehreren Vorgängen verarbeiten, z. B. ML-Trainingsarbeitslasten, wählen Sie Batch aus.

    • Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, wählen Sie Serving (Bereitstellung) aus.

  6. Führen Sie im Bereich Nach Kapazität suchen die folgenden Schritte aus:

    1. Geben Sie in den Listen Region und Zone die Region und Zone an, in der Sie Ressourcen reservieren möchten. Eine Liste der unterstützten Regionen und Zonen finden Sie in diesem Dokument unter Einschränkungen.

    2. Geben Sie im Feld Erforderliche Gesamtkapazität (beim Reservieren von GPU-VMs) oder in der Liste Anzahl der Chips (beim Reservieren von TPUs) die Anzahl der zu reservierenden GPU-VMs oder TPU-Chips an.

    3. Wählen Sie in der Liste Startzeit die Startzeit für Ihre Anfrage aus.

    4. Optional: Wählen Sie in der Liste Flexibilität für Startdatum auswählen aus, wie genau Ihr Startdatum sein muss.

    5. Geben Sie im Feld Reservierungsdauer an, wie lange Sie Ressourcen reservieren möchten.

    6. Klicken Sie auf Nach Kapazität suchen. Wählen Sie dann in der Tabelle Verfügbare Kapazität eine der verfügbaren Optionen aus, die den Typ, die Anzahl und den Reservierungszeitraum der zu reservierenden GPU-VMs oder TPUs enthalten.

  7. Klicken Sie auf Weiter.

  8. Wählen Sie im Abschnitt Freigabetyp die Projekte aus, für die Sie die angeforderte Kapazität freigeben möchten:

    • Wenn Sie die reservierte Kapazität nur in Ihrem Projekt verwenden möchten, wählen Sie Lokal aus.

    • Wenn Sie die reservierte Kapazität für andere Projekte freigeben möchten, wählen Sie Freigegeben aus, klicken Sie auf  Projekte hinzufügen und folgen Sie der Anleitung, um die Projekte auszuwählen.

  9. Klicken Sie auf Weiter.

  10. Geben Sie im Feld Name der zukünftigen Reservierung einen Namen für die Anfrage ein.

  11. Geben Sie im Feld Name der Reservierung den Namen der Reservierung ein, die Compute Engine automatisch erstellt, um die angeforderte Kapazität bereitzustellen.

  12. Klicken Sie auf Erstellen.

gcloud

Verwenden Sie einen der folgenden gcloud beta compute future-reservations create-Befehle, um eine zukünftige Reservierungsanfrage im Kalendermodus zu erstellen und zur Überprüfung einzureichen. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Flags ein:

  • Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Flags --total-count und --machine-type ein:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Wenn Sie TPUs reservieren möchten, fügen Sie die Flags --chip-count und --tpu-version ein:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Ersetzen Sie Folgendes:

  • FUTURE_RESERVATION_NAME: der Name der Anfrage.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs.

  • MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips.

  • TPU_VERSION: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:

    • Für TPU v6e: V6E

    • Für TPU v5p: V5P

    • Für TPU v5e: V5E

    Wenn Sie eine TPU v5e angeben, müssen Sie das Flag --workload-type angeben. Legen Sie das Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.

  • SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:

    • So verwenden Sie die Kapazität nur in Ihrem Projekt: local

    • So geben Sie Kapazität für andere Projekte frei: projects

    Wenn Sie projects angeben, müssen Sie das Flag --share-with einfügen, das auf eine durch Kommas getrennte Liste von Projekt-IDs festgelegt ist, z. B. project-1,project-2. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Die Projekt-ID darf nicht in dieser Liste enthalten sein. Sie können die reservierte Kapazität standardmäßig nutzen.

  • START_TIME: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.

  • END_TIME: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie für den Reservierungszeitraum anstelle eines Endzeitpunkts eine Dauer in Sekunden angeben möchten, ersetzen Sie das Flag --end-time durch das Flag --duration.

  • ZONE: die Zone, in der Sie Ressourcen reservieren möchten.

REST

Wenn Sie eine zukünftige Reservierungsanfrage im Kalendermodus erstellen und zur Überprüfung einreichen möchten, senden Sie die folgende POST-Anfrage an die Beta-Methode futureReservations.insert. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Felder in den Anfragetext ein:

  • Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Felder totalCount und machineType ein:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Wenn Sie TPUs reservieren möchten, geben Sie die Felder acceleratorCount und vmFamily an:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: die ID des Projekts, in dem Sie die Anfrage erstellen möchten.

  • ZONE: die Zone, in der Sie Ressourcen reservieren möchten.

  • FUTURE_RESERVATION_NAME: der Name der Anfrage.

  • RESERVATION_NAME: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.

  • SHARE_TYPE: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:

    • So verwenden Sie die Kapazität nur in Ihrem Projekt: LOCAL

    • So geben Sie Kapazität für andere Projekte frei: SPECIFIC_PROJECTS

    Wenn Sie SPECIFIC_PROJECTS angeben, müssen Sie im Feld shareSettings das Feld projectMap angeben, um die Projekte anzugeben, mit denen die Kapazität geteilt werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Geben Sie Ihre Projekt-ID nicht an. Sie können die reservierte Kapazität standardmäßig nutzen.

    Wenn Sie beispielsweise die angeforderte Kapazität für zwei andere Projekte freigeben möchten, fügen Sie Folgendes ein:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Ersetzen Sie CONSUMER_PROJECT_ID_1 und CONSUMER_PROJECT_ID_2 durch die IDs von zwei Projekten, die die angeforderte Kapazität nutzen dürfen.

  • NUMBER_OF_VMS: die Anzahl der zu reservierenden GPU-VMs.

  • MACHINE_TYPE: Der GPU-Maschinentyp, der reserviert werden soll.

  • NUMBER_OF_CHIPS: die Anzahl der zu reservierenden TPU-Chips.

  • TPU_VERSION: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:

    • Für TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Für TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Für TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Wenn Sie eine TPU v5e angeben, müssen Sie im Feld aggregateResources das Feld workloadType angeben. Legen Sie das Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:

    • Geben Sie für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, BATCH an.

    • Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie SERVING an.

  • START_TIME: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.

  • END_TIME: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie anstelle einer Endzeit eine Dauer in Sekunden für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie das Feld endTime durch das duration-Feld.

Nächste Schritte