In diesem Dokument wird beschrieben, wie Sie eine verwaltete Instanzgruppe (Managed Instance Group, MIG) mit VM-Instanzen mit angehängten GPUs erstellen. Dabei wird beschrieben, wie Sie mithilfe von Anfragen zur Größenänderung und dem Bereitstellungsmodell „Flex-Start“ GPU-VMs auf einmal einer zonalen MIG hinzufügen. Wenn Sie eine Anfrage zur Größenanpassung für eine MIG erstellen möchten, um eine Reservierung zu nutzen, lesen Sie stattdessen Folgendes:
Informationen zum Verwenden einer Reservierung mit den in Cluster Director verfügbaren Funktionen und Diensten finden Sie in der AI Hypercomputer-Dokumentation unter MIG und Anfrage zur Größenanpassung erstellen.
Informationen zum Verwenden einer Reservierung für eine zukünftige Reservierung im Kalendermodus finden Sie unter Anfrage zur Größenanpassung in einer MIG erstellen.
Verwenden Sie eine Anfrage zur Größenanpassung der MIG mit dem Bereitstellungsmodell „Flex-Start“, um die Wahrscheinlichkeit zu erhöhen, GPU-VMs zu erhalten. Geben Sie in der Anfrage die Anzahl der GPU-VMs an. Der zugrunde liegende Planungsmechanismus Dynamic Workload Scheduler (DWS) plant Größenänderungsanfragen, die in Compute Engine erstellt werden, basierend auf den angeforderten Zeiträumen und der Ressourcenverfügbarkeit. Wenn die Ressourcen verfügbar sind, erstellt die MIG die VMs.
Wenn Ihr Job früher als die angeforderte Dauer abgeschlossen ist, können Sie die erstellten VMs löschen. Andernfalls löscht die MIG VMs am Ende der Ausführungsdauer.
Weitere Informationen zu anderen grundlegenden Szenarien zum Erstellen einer MIG
Vorbereitung
- Prüfen Sie Ihr GPU-Kontingent, damit Ihr Kontingent für die angeforderten Ressourcen ausreicht.
- Informationen zum Kontingentverbrauch finden Sie unter GPU-VMs und Zuteilungskontingente auf Abruf.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft.
Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.
<x0A>Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
Erstellen Sie eine Instanzvorlage. Dies ist zum Erstellen einer MIG erforderlich. Die MIG erstellt jede VM in der Gruppe anhand der Instanzvorlage. Geben Sie in der Vorlage die Konfiguration für GPU-VMs und zusätzliche Konfigurationen an, die für die Verwendung von Anfragen zur Größenänderung erforderlich sind.
Weitere Informationen zu Instanzvorlagen finden Sie unter Instanzvorlagen.
Erstellen Sie eine MIG und eine Anfrage zur Größenanpassung, um GPU-VMs gleichzeitig hinzuzufügen.
Rufen Sie die Seite Instanzvorlagen auf.
Klicken Sie auf Instanzvorlage erstellen. Die Seite Instanzvorlage erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die Instanzvorlage ein.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Klicken Sie auf den Tab GPUs.
Wählen Sie im Menü GPU-Typ den GPU-Typ.
Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
Wählen Sie im Abschnitt Maschinentyp einen Maschinentyp aus.
Führen Sie im Abschnitt Bereitstellungsmodell folgende Schritte aus:
Wählen Sie in der Liste VM-Bereitstellungsmodell die Option Flex-Start aus.
automatisch die Option Keine Reservierung verwenden ausgewählt.Wenn Sie eine Laufzeit für die über die Instanzvorlage erstellten VMs festlegen möchten, geben Sie im Feld Anzahl der Stunden eingeben die Anzahl der Stunden ein. Der Wert muss zwischen einer Stunde (
1
) und sieben Tagen (168
) liegen.
Optional: Klicken Sie im Abschnitt Bootlaufwerk auf Ändern, um den Standardwert für den Bootlaufwerktyp oder das Image zu ändern. Folgen Sie dann den Aufforderungen, um das Bootlaufwerk zu ändern.
Klicken Sie auf Erstellen.
INSTANCE_TEMPLATE_NAME
ist der Name der Instanzvorlage.IMAGE_PROJECT
: das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE_FAMILY
ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siedebian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.REGION
: Region, in der die Instanzvorlage erstellt werden soll.MACHINE_TYPE
ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das Flag--accelerator
ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.RUN_DURATION
: durch die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatieren. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.PROJECT_ID
: die ID des Projekts, in dem Sie die Instanzvorlage erstellen möchten.REGION
: Region, in der die Instanzvorlage erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der Instanzvorlage.IMAGE_PROJECT
: das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE
: Wählen Sie eine der folgenden Optionen aus:Eine bestimmte Version des Betriebssystem-Images; Beispiel:
debian-12-bookworm-v20240617
.Eine Image-Familie, die als
family/IMAGE_FAMILY
formatiert sein muss. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Wenn Sie beispielsweisefamily/debian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.
MACHINE_TYPE
ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das FeldguestAccelerators
ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.RUN_DURATION
durch die Dauer in Sekunden, in der die angeforderten VMs ausgeführt werden sollen, bevor die MIG sie automatisch löscht. Der Wert muss zwischen600
, d. h. 600 Sekunden (10 Minuten), und604800
, also 604.800 Sekunden (7 Tage) liegen.Rufen Sie die Seite Instanzgruppen auf.
Klicken Sie auf Instanzgruppe erstellen. Die Seite Instanzgruppe erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die MIG ein.
Bevor Sie eine Instanzvorlage auswählen können, müssen Sie die Autoscaling-Konfiguration löschen und Reparaturen deaktivieren. Gehen Sie dazu so vor:
- So löschen Sie die Autoscaling-Konfiguration:
- Klicken Sie im Abschnitt Autoscaling auf die Liste Autoscaling-Modus und dann auf Autoscaling-Konfiguration löschen.
- Klicken Sie im Bestätigungsdialogfeld auf Löschen.
- Wenn Sie Reparaturen deaktivieren möchten, klicken Sie im Abschnitt Lebenszyklus von VM-Instanzen auf die Liste Standardaktion bei Fehler und wählen Sie dann Keine Aktion aus.
- So löschen Sie die Autoscaling-Konfiguration:
Kehren Sie zum Feld Instanzvorlage zurück. Wählen Sie in der Liste Instanzvorlage die Instanzvorlage aus, die Sie im vorherigen Abschnitt erstellt haben.
Führen Sie einen der folgenden Schritte aus:
- So erstellen Sie eine Anfrage zur Größenanpassung mit der MIG:
- Geben Sie im Feld Anzahl der Instanzen die Anzahl der VMs ein, die Sie gleichzeitig erstellen möchten.
- Klicken Sie das Kästchen Anfrage zur Größenanpassung verwenden, um VMs auf einmal zu erstellen an.
- Optional: Wenn Sie für die VMs eine andere Laufzeit als die in der Instanzvorlage festgelegte angeben möchten, geben Sie im Feld Angefragte Laufzeit und in den Listen Einheit eine Dauer an. Die Dauer muss zwischen einer Stunde und sieben Tagen liegen.
- Wenn Sie nach dem Erstellen der MIG eine Anfrage zur Größenanpassung erstellen möchten, geben Sie im Feld Anzahl der Instanzen den Wert
0
ein.
- So erstellen Sie eine Anfrage zur Größenanpassung mit der MIG:
Geben Sie im Abschnitt Standort an, ob Sie eine zonale oder eine regionale MIG erstellen möchten:
- Wenn Sie eine zonale MIG erstellen möchten, wählen Sie Einzelne Zone aus. Wenn Sie eine regionale MIG erstellen möchten, wählen Sie Mehrere Zonen aus.
- Wählen Sie die Region und die Zonen der MIG aus.
- Wenn Sie eine regionale MIG erstellen, gehen Sie so vor:
- Wählen Sie im Feld Zielverteilungsform die Option Beliebige einzelne Zone aus.
- Klicken Sie im angezeigten Dialogfeld auf Instanzverteilung deaktivieren.
Klicken Sie auf Erstellen.
Erstellen Sie mit dem Befehl
instance-groups managed create
eine zonale MIG:gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Erstellen Sie in der MIG eine Anfrage zur Größenanpassung mit dem Befehl
instance-groups managed resize-requests create
. Geben Sie die Anzahl der GPU-VMs an, die Sie benötigen, und die Dauer, für die Sie diese VMs ausführen möchten.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
INSTANCE_GROUP_NAME
: Name der MIG.INSTANCE_TEMPLATE_URL
: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
ZONE
: Eine für Compute Engine verfügbare Zone.RESIZE_REQUEST_NAME
durch den Name der Anfrage zur Größenänderung.COUNT
: durch die Anzahl der VMs, die alle gleichzeitig in der Gruppe hinzugefügt werden sollen.Erstellen Sie eine zonale MIG. Stellen Sie dazu eine
POST
-Anfrage an die MethodeinstanceGroupManagers.insert
:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Erstellen Sie in der MIG eine Anfrage zur Größenänderung, indem Sie eine
POST
-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insert
senden. Geben Sie im Anfragetext die Anzahl der GPU-VMs an, die Sie gleichzeitig erstellen möchten, und die Dauer, für die Sie diese VMs ausführen möchten.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
PROJECT_ID
: durch die ID des Projekts, in dem Sie die MIG erstellen möchten.INSTANCE_GROUP_NAME
: Name der MIG.INSTANCE_TEMPLATE_URL
: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
- Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
ZONE
: Eine für Compute Engine verfügbare Zone.RESIZE_REQUEST_NAME
durch den Name der Anfrage zur Größenänderung.COUNT
: durch die Anzahl der VMs, die alle gleichzeitig in der Gruppe hinzugefügt werden sollen.Regionale MIGs erstellen, die mit Größenanfragen kompatibel sind (Vorabversion)
Anfragen zur Größenanpassung in einer MIG anzeigen, abbrechen oder löschen
REST
Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Beschränkungen
Einschränkungen beim Erstellen einer MIG-Anfrage zur Größenanpassung
MIG erstellen und GPU-VMs hinzufügen gleichzeitig
So erstellen Sie eine MIG und fügen gleichzeitig GPU-VMs in der Gruppe hinzu:
Instanzvorlage erstellen
Erstellen Sie eine Instanzvorlage wie in diesem Abschnitt beschrieben und verwenden Sie sie dann, um eine MIG zu erstellen.
Console
gcloud
Erstellen Sie mit dem Befehl
beta instance-templates create
eine Instanzvorlage:gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
Ersetzen Sie Folgendes:
REST
Erstellen Sie eine Instanzvorlage. Stellen Sie dazu eine
POST
-Anfrage an die Methodebeta.instanceTemplates.insert
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
Ersetzen Sie Folgendes:
Nachdem Sie die Instanzvorlage erstellt haben, können Sie sie aufrufen, um ihre ID und die Instanzeigenschaften zu sehen.
MIG erstellen und GPU-VMs hinzufügen gleichzeitig
Erstellen Sie eine MIG, wie in diesem Abschnitt beschrieben. Wenn Sie eine Anfrage zur Größenänderung in der MIG erstellen möchten, dürfen Sie Autoscaling nicht konfigurieren und müssen Reparaturen deaktivieren.
Console
gcloud
Ersetzen Sie dabei Folgendes:
REST
Ersetzen Sie dabei Folgendes:
Die von Ihnen erstellte Anfrage zur Größenänderung bleibt im Status
ACCEPTED
, bis die MIG alle angeforderten GPU-VMs erstellt hat. Nachdem alle GPU-VMs in der Gruppe erstellt wurden, ändert sich der Status der Anfrage zuSUCCEEDED
.Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-10 (UTC).
-