In diesem Dokument wird erläutert, wie Sie eine zukünftige Reservierungsanfrage im Kalendermodus erstellen. Weitere Informationen zu dieser Art von Reservierung finden Sie unter Vorausschauende Reservierungsanfragen im Kalendermodus – Übersicht.
Erstellen Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus, um die folgenden Ressourcen für bis zu 90 Tage zu reservieren:
Bis zu 80 VM-Instanzen mit angehängten GPUs.
Bis zu 1.024 TPU-Chips.
Am von Ihnen ausgewählten Lieferdatum und zur ausgewählten Lieferzeit können Sie GPU- oder TPU-VMs erstellen, indem Sie die reservierte Kapazität nutzen. Mit Anfragen für vorausschauende Reservierungen im Kalendermodus können Sie Ressourcen mit hoher Nachfrage für die folgenden Arbeitslasten erhalten:
Jobs zum Vortrainieren von Modellen
Jobs zur Modellabstimmung
Arbeitslasten für HPC-Simulationen (High Performance Computing)
Kurzfristige Steigerungen bei Inferenzarbeitslasten
Wenn Sie mehr als 80 GPU-VMs oder für länger als 90 Tage in einer einzelnen Anfrage reservieren möchten, lesen Sie stattdessen die AI Hypercomputer-Dokumentation unter Kapazität reservieren.
Beschränkungen
In den folgenden Abschnitten werden die Einschränkungen für zukünftige Reservierungsanfragen im Kalendermodus erläutert.
Beschränkungen für alle Anfragen
Für alle Anfragen für zukünftige Reservierungen im Kalendermodus gelten die folgenden Einschränkungen:
Sie können Ressourcen für einen Zeitraum zwischen 1 und 90 Tagen reservieren.
Nachdem Sie eine Anfrage erstellt und eingereicht haben, können Sie sie nicht mehr stornieren, löschen oder ändern.
Einschränkungen für Anfragen für GPU-VMs
Sie können GPU-VMs nur so reservieren:
Sie können pro Anfrage zwischen 1 und 80 GPU-VMs reservieren.
Sie können die folgenden Maschinenserien reservieren:
Sie können GPU-VMs nur in bestimmten Zonen reservieren.
Einschränkungen für Anfragen für TPUs
TPUs können nur so reserviert werden:
Sie können pro Anfrage 1, 4, 8, 16, 32, 64, 128, 256, 512 oder 1.024 TPU-Chips reservieren.
Sie können die folgenden TPU-Versionen reservieren:
Sie können nur 1, 4 oder 8 TPU v5e-Chips für Arbeitslasttypen vom Typ „Serving“ (
SERVING
) reservieren.Sie können TPUs nur in den folgenden Zonen reservieren:
Für TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Für TPU v5p:
us-east5-a
Für TPU v5e:
Für Batch-Arbeitslasttypen (
BATCH
):us-west4-b
Für Serving-Arbeitslasttypen (
SERVING
):us-central1-a
Hinweise
- Wenn Sie im Kalendermodus keine Anfragen für zukünftige Reservierungen verwenden können, haben Sie möglicherweise keinen Zugriff auf diese Funktion. Wenden Sie sich in diesem Fall an Ihr Kontoteam oder das Vertriebsteam.
- Wenn Sie Ihre reservierte Kapazität für andere Projekte in Ihrer Organisation freigeben möchten, muss das Projekt, in dem Sie Anfragen für vorausschauende Reservierungen im Kalendermodus erstellen möchten, zum Erstellen freigegebener Reservierungen berechtigt sein. Andernfalls treten Fehler auf.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft.
Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.
<x0A>Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
So erstellen Sie eine zukünftige Reservierungsanfrage:
compute.futureReservations.create
für das Projekt -
So werden von Compute Engine Reservierungen automatisch erstellt:
compute.reservations.create
für das Projekt -
So geben Sie eine Instanzvorlage an:
compute.instanceTemplates.useReadOnly
für die Instanzvorlage -
So sehen Sie die zukünftige Verfügbarkeit von Ressourcen:
compute.advice.calendarMode
im Projekt Zukünftige Verfügbarkeit von Ressourcen ansehen Sehen Sie sich die zukünftige Verfügbarkeit der GPU-VMs oder TPUs an, die Sie reservieren möchten. Geben Sie dann beim Erstellen einer Anfrage die Anzahl, den Typ und die Reservierungsdauer der Ressourcen an, die Sie als verfügbar bestätigt haben. Google Cloud genehmigt Ihre Anfrage mit größerer Wahrscheinlichkeit, wenn Sie diese Informationen angeben.
Reservierungsanfrage für GPU-VMs oder TPUs erstellen Erstellen und senden Sie im Kalendermodus eine zukünftige Reservierungsanfrage für GPU-VMs oder TPUs. Wenn Sie eine Anfrage erfolgreich erstellen können, genehmigt Google Cloud sie innerhalb einer Minute.
Für GPU-VMs bis zu 60 Tage im Voraus
Für TPUs bis zu 120 Tage im Voraus
Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Flags
--vm-count
und--machine-type
ein:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Wenn Sie die TPU-Verfügbarkeit aufrufen möchten, fügen Sie die Flags
--chip-count
und--tpu-version
ein:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
NUMBER_OF_VMS
: die Anzahl der zu reservierenden GPU-VMs.MACHINE_TYPE
: Der GPU-Maschinentyp, der reserviert werden soll.NUMBER_OF_CHIPS
: die Anzahl der zu reservierenden TPU-Chips.TPU_VERSION
: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:Für TPU v6e:
V6E
Für TPU v5p:
V5P
Für TPU v5e:
V5E
Wenn Sie eine TPU v5e angeben, müssen Sie das Flag
--workload-type
angeben. Legen Sie dieses Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie
BATCH
an.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVING
an.
REGION
: die Region, in der GPU-VMs oder TPUs reserviert werden sollen. Informationen dazu, welche Regionen und Zonen unterstützt werden, finden Sie in diesem Dokument unter Beschränkungen.FROM_START_TIME
undTO_START_TIME
: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:YYYY-MM-DDTHH:MM:SSOFFSET
Ersetzen Sie Folgendes:
YYYY-MM-DD
: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-
) getrennt.HH:MM:SS
: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:
) ist.OFFSET
: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie-08:00
an. Wenn Sie keinen Versatz verwenden möchten, geben SieZ
an.
FROM_END_TIME
undTO_END_TIME
: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Dauern für den Reservierungszeitraum angeben möchten, ersetzen Sie das Flag--end-time-range
durch das--duration-range
-Flag.Wenn Sie die Verfügbarkeit von GPU-VMs aufrufen möchten, fügen Sie die Felder
instanceCount
undmachineType
ein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Wenn Sie die TPU-Verfügbarkeit sehen möchten, fügen Sie die Felder
acceleratorCount
undvmFamily
ein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
PROJECT_ID
: die ID des Projekts, in dem Sie Ressourcen reservieren möchten.REGION
: die Region, in der Sie GPU-VMs oder TPUs reservieren möchten. Informationen zu den unterstützten Regionen und Zonen finden Sie in diesem Dokument unter Einschränkungen.NUMBER_OF_VMS
: die Anzahl der zu reservierenden GPU-VMs.MACHINE_TYPE
: Der GPU-Maschinentyp, der reserviert werden soll.NUMBER_OF_CHIPS
: die Anzahl der zu reservierenden TPU-Chips.TPU_VERSION
: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:Für TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Für TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Für TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Wenn Sie eine TPU v5e angeben, müssen Sie im Feld
aggregateResources
das FeldworkloadType
angeben. Legen Sie dieses Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie
BATCH
an.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVING
an.
FROM_START_TIME
undTO_START_TIME
: das früheste und das späteste Datum, für das Sie Kapazität reservieren möchten. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel:YYYY-MM-DDTHH:MM:SSOFFSET
Ersetzen Sie Folgendes:
YYYY-MM-DD
: ein Datum, formatiert als vierstelliges Jahr, zweistelliger Monat und zweistelliger Tag des Monats und durch Bindestriche (-
) getrennt.HH:MM:SS
: eine Uhrzeit, die als zweistellige Stundenzahl im 24-Stunden-Format, zweistellige Minuten und zweistellige Sekunden formatiert und durch Doppelpunkte getrennt (:
) ist.OFFSET
: die Zeitzone formatiert als Versatz der koordinierten Weltzeit (Coordinated Universal Time, UTC). Wenn Sie beispielsweise Pacific Standard Time (PST) verwenden möchten, geben Sie-08:00
an. Wenn Sie keinen Versatz verwenden möchten, geben SieZ
an.
FROM_END_TIME
undTO_END_TIME
: das früheste und das späteste Datum, an dem Ihre Kapazitätsreservierung enden soll. Formatieren Sie diese Datumsangaben als RFC 3339-Zeitstempel. Wenn Sie anstelle von Endzeiten einen Bereich von Zeiträumen für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie die FelderendTimeNotEarlierThan
undendTimeNotLaterThan
durch die FelderminDuration
undmaxDuration
.Startzeit: Je nach den Ressourcen, die Sie reservieren möchten, müssen Sie eine Startzeit angeben, die mindestens einen der folgenden Werte nach dem Zeitpunkt liegt, zu dem Sie eine Anfrage erstellen und einreichen:
Für GPU-VMs: 87 Stunden (3 Tage und 15 Stunden)
Für TPUs: 24 Stunden
Ende: Sie können Ressourcen für maximal 90 Tage reservieren.
Rufen Sie in der Google Cloud Console die Seite IAM auf.
Klicken Sie auf den Tab Zukünftige Reservierungen.
Klicken Sie auf
Zukünftige Reservierung erstellen. Die Seite Zukünftige Reservierung erstellen wird angezeigt und der Bereich Hardwarekonfiguration ist ausgewählt.Geben Sie im Abschnitt Konfiguration die Attribute der GPU-VMs oder TPUs an, die Sie reservieren möchten. Gehen Sie dazu so vor:
So geben Sie GPU-VM- oder TPU-Attribute direkt an:
Wählen Sie Maschinentyp angeben aus.
Klicken Sie auf den Tab GPUs oder TPUs und wählen Sie dann den GPU-Maschinentyp oder die TPU-Version aus, die Sie reservieren möchten.
Wenn Sie die Attribute von GPU-VMs mit einer vorhandenen Instanzvorlage angeben möchten, wählen Sie Instanzvorlage und dann die Vorlage aus.
Wenn Sie die Attribute der GPU-VM mithilfe einer vorhandenen VM als Referenz angeben möchten, wählen Sie Vorhandene VM verwenden und dann die VM aus.
Wenn Sie im vorherigen Schritt eine TPU v5e (CT5LP) angegeben haben, wählen Sie in der Liste Arbeitslasttyp von TPU v5 eine der folgenden Optionen aus:
Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die große Datenmengen in einzelnen oder mehreren Vorgängen verarbeiten, z. B. ML-Trainingsarbeitslasten, wählen Sie Batch aus.
Wenn Sie Arbeitslasten auf den TPUs ausführen möchten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, wählen Sie Serving (Bereitstellung) aus.
Führen Sie im Bereich Nach Kapazität suchen die folgenden Schritte aus:
Geben Sie in den Listen Region und Zone die Region und Zone an, in der Sie Ressourcen reservieren möchten. Eine Liste der unterstützten Regionen und Zonen finden Sie in diesem Dokument unter Einschränkungen.
Geben Sie im Feld Erforderliche Gesamtkapazität (beim Reservieren von GPU-VMs) oder in der Liste Anzahl der Chips (beim Reservieren von TPUs) die Anzahl der zu reservierenden GPU-VMs oder TPU-Chips an.
Wählen Sie in der Liste Startzeit die Startzeit für Ihre Anfrage aus.
Optional: Wählen Sie in der Liste Flexibilität für Startdatum auswählen aus, wie genau Ihr Startdatum sein muss.
Geben Sie im Feld Reservierungsdauer an, wie lange Sie Ressourcen reservieren möchten.
Klicken Sie auf Nach Kapazität suchen. Wählen Sie dann in der Tabelle Verfügbare Kapazität eine der verfügbaren Optionen aus, die den Typ, die Anzahl und den Reservierungszeitraum der zu reservierenden GPU-VMs oder TPUs enthalten.
Klicken Sie auf Weiter.
Wählen Sie im Abschnitt Freigabetyp die Projekte aus, für die Sie die angeforderte Kapazität freigeben möchten:
Wenn Sie die reservierte Kapazität nur in Ihrem Projekt verwenden möchten, wählen Sie Lokal aus.
Wenn Sie die reservierte Kapazität für andere Projekte freigeben möchten, wählen Sie Freigegeben aus, klicken Sie auf
Projekte hinzufügen und folgen Sie der Anleitung, um die Projekte auszuwählen.
Klicken Sie auf Weiter.
Geben Sie im Feld Name der zukünftigen Reservierung einen Namen für die Anfrage ein.
Geben Sie im Feld Name der Reservierung den Namen der Reservierung ein, die Compute Engine automatisch erstellt, um die angeforderte Kapazität bereitzustellen.
Klicken Sie auf Erstellen.
Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Flags
--total-count
und--machine-type
ein:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Wenn Sie TPUs reservieren möchten, fügen Sie die Flags
--chip-count
und--tpu-version
ein:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
FUTURE_RESERVATION_NAME
: der Name der Anfrage.NUMBER_OF_VMS
: die Anzahl der zu reservierenden GPU-VMs.MACHINE_TYPE
: Der GPU-Maschinentyp, der reserviert werden soll.NUMBER_OF_CHIPS
: die Anzahl der zu reservierenden TPU-Chips.TPU_VERSION
: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:Für TPU v6e:
V6E
Für TPU v5p:
V5P
Für TPU v5e:
V5E
Wenn Sie eine TPU v5e angeben, müssen Sie das Flag
--workload-type
angeben. Legen Sie das Flag auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten, geben Sie
BATCH
an.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVING
an.
RESERVATION_NAME
: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.SHARE_TYPE
: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:So verwenden Sie die Kapazität nur in Ihrem Projekt:
local
So geben Sie Kapazität für andere Projekte frei:
projects
Wenn Sie
projects
angeben, müssen Sie das Flag--share-with
einfügen, das auf eine durch Kommas getrennte Liste von Projekt-IDs festgelegt ist, z. B.project-1,project-2
. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Die Projekt-ID darf nicht in dieser Liste enthalten sein. Sie können die reservierte Kapazität standardmäßig nutzen.START_TIME
: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.END_TIME
: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie für den Reservierungszeitraum anstelle eines Endzeitpunkts eine Dauer in Sekunden angeben möchten, ersetzen Sie das Flag--end-time
durch das Flag--duration
.ZONE
: die Zone, in der Sie Ressourcen reservieren möchten.Wenn Sie GPU-VMs reservieren möchten, fügen Sie die Felder
totalCount
undmachineType
ein:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Wenn Sie TPUs reservieren möchten, geben Sie die Felder
acceleratorCount
undvmFamily
an:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
PROJECT_ID
: die ID des Projekts, in dem Sie die Anfrage erstellen möchten.ZONE
: die Zone, in der Sie Ressourcen reservieren möchten.FUTURE_RESERVATION_NAME
: der Name der Anfrage.RESERVATION_NAME
: Der Name der Reservierung, die von Compute Engine automatisch erstellt wird, um die angeforderte Kapazität bereitzustellen.SHARE_TYPE
: Gibt an, ob andere Projekte in Ihrer Organisation die reservierte Kapazität nutzen können. Geben Sie einen der folgenden Werte an:So verwenden Sie die Kapazität nur in Ihrem Projekt:
LOCAL
So geben Sie Kapazität für andere Projekte frei:
SPECIFIC_PROJECTS
Wenn Sie
SPECIFIC_PROJECTS
angeben, müssen Sie im FeldshareSettings
das FeldprojectMap
angeben, um die Projekte anzugeben, mit denen die Kapazität geteilt werden soll. Sie können bis zu 100 Projekte in Ihrer Organisation angeben. Geben Sie Ihre Projekt-ID nicht an. Sie können die reservierte Kapazität standardmäßig nutzen.Wenn Sie beispielsweise die angeforderte Kapazität für zwei andere Projekte freigeben möchten, fügen Sie Folgendes ein:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }
Ersetzen Sie
CONSUMER_PROJECT_ID_1
undCONSUMER_PROJECT_ID_2
durch die IDs von zwei Projekten, die die angeforderte Kapazität nutzen dürfen.NUMBER_OF_VMS
: die Anzahl der zu reservierenden GPU-VMs.MACHINE_TYPE
: Der GPU-Maschinentyp, der reserviert werden soll.NUMBER_OF_CHIPS
: die Anzahl der zu reservierenden TPU-Chips.TPU_VERSION
: Die zu reservierende TPU-Version. Geben Sie einen der folgenden Werte an:Für TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Für TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Für TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Wenn Sie eine TPU v5e angeben, müssen Sie im Feld
aggregateResources
das FeldworkloadType
angeben. Legen Sie das Feld auf den Typ der Arbeitslasten fest, die Sie auf den TPUs ausführen möchten:Geben Sie für Arbeitslasten, bei denen große Datenmengen in einzelnen oder mehreren Vorgängen verarbeitet werden, z. B. ML-Trainingsarbeitslasten,
BATCH
an.Für Arbeitslasten, die gleichzeitige Anfragen verarbeiten und eine minimale Netzwerklatenz erfordern, z. B. ML-Inferenzarbeitslasten, geben Sie
SERVING
an.
START_TIME
: der Beginn des Antrags, formatiert als RFC 3339-Zeitstempel.END_TIME
: das Ende des Reservierungszeitraums, formatiert als RFC 3339-Zeitstempel. Wenn Sie anstelle einer Endzeit eine Dauer in Sekunden für Ihren Reservierungszeitraum angeben möchten, ersetzen Sie das FeldendTime
durch dasduration
-Feld.Automatisch erstellte Reservierung für GPU-VMs in Compute Engine nutzen
Automatisch erstellte Reservierung für TPUs in Cloud TPU nutzen
Automatisch erstellte Reservierung mit Vertex AI-Vorhersagejobs nutzen
Automatisch erstellte Reservierung mit Vertex AI-Trainingsjobs verwenden
Reservierungen oder vorausschauende Reservierungsanfragen ansehen
REST
Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Future Reservation Admin (
roles/compute.futureReservationAdmin
) für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer zukünftigen Reservierungsanfrage im Kalendermodus erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um eine Anfrage für eine zukünftige Reservierung im Kalendermodus zu erstellen:
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Übersicht
So erstellen Sie eine Anfrage für eine vorausschauende Reservierung im Kalendermodus:
Zukünftige Verfügbarkeit von Ressourcen ansehen
So rufen Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region auf:
Wählen Sie eine der folgenden Optionen aus, um die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufzurufen:
Console
Wenn Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus erstellen, können Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region ansehen. Weitere Informationen finden Sie in diesem Dokument unter Reservierungsanfrage für GPU-VMs oder TPUs erstellen.
gcloud
Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, verwenden Sie einen der folgenden
gcloud beta compute advice calendar-mode
-Befehle. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Flags ein:Ersetzen Sie Folgendes:
Die Ausgabe sieht etwa so aus:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'
Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder
startTime
,endTime
undlocation
. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.REST
Wenn Sie die zukünftige Verfügbarkeit von GPU-VMs oder TPUs in einer Region aufrufen möchten, senden Sie eine
GET
-Anfrage an die Betaversion der Methodeadvice.calendarMode
. Fügen Sie je nach den Ressourcen, die Sie aufrufen möchten, die folgenden Felder in den Anfragetext ein:Ersetzen Sie Folgendes:
Die Ausgabe sieht etwa so aus:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }
Wenn die angeforderten Ressourcen verfügbar sind, enthält die Ausgabe die Felder
startTime
,endTime
undlocation
. In diesen Feldern werden die früheste Startzeit, die späteste Endzeit und die Zonen angegeben, in denen Ressourcen verfügbar sind.Reservierungsanfrage für GPU-VMs oder TPUs erstellen
Wenn Sie eine Anfrage für eine zukünftige Reservierung im Kalendermodus erstellen, können Sie den Reservierungszeitraum nur so angeben:
Wenn Sie eine Anfrage erstellen möchten, indem Sie eine vorhandene GPU-VM als Referenz verwenden, nutzen Sie dieGoogle Cloud Console. Wählen Sie andernfalls eine der folgenden Optionen aus:
Console
gcloud
Verwenden Sie einen der folgenden
gcloud beta compute future-reservations create
-Befehle, um eine zukünftige Reservierungsanfrage im Kalendermodus zu erstellen und zur Überprüfung einzureichen. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Flags ein:Ersetzen Sie Folgendes:
REST
Wenn Sie eine zukünftige Reservierungsanfrage im Kalendermodus erstellen und zur Überprüfung einreichen möchten, senden Sie die folgende
POST
-Anfrage an die Beta-MethodefutureReservations.insert
. Fügen Sie je nach den Ressourcen, die Sie reservieren möchten, die folgenden Felder in den Anfragetext ein:Ersetzen Sie Folgendes:
Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-14 (UTC).
-