In diesem Dokument wird beschrieben, wie Sie Anfragen zur Größenänderung in einer verwalteten Instanzgruppe (MIG) von VM-Instanzen mit angehängten GPUs erstellen. Weitere Informationen zu Anfragen zur Größenanpassung in einer MIG
Wenn Sie eine Anfrage zur Größenanpassung für eine MIG erstellen, können Sie stark nachgefragte Ressourcen wie GPUs erhalten und die Kosten optimieren, indem Sie die genaue Anzahl von VMs auf einmal erstellen. Informationen zum Erstellen einer MIG-Anfrage zur Größenanpassung, die die von Cluster Director verfügbaren Funktionen und Dienste nutzen kann, finden Sie in der AI Hypercomputer-Dokumentation unter MIG und Anfrage zur Größenanpassung erstellen.
Hinweise
- Wenn Sie Anfragen zur Größenänderung von MIGs verwenden möchten, um VMs zu erstellen, sobald Ressourcen für Arbeitslasten verfügbar sind, die bis zu sieben Tage lang ausgeführt werden, prüfen Sie, ob Sie ausreichend Standard- oder auf Abruf-Kontingent für die angeforderten Ressourcen haben. Weitere Informationen finden Sie unter GPU-Kontingent prüfen.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud -Dienste und APIs überprüft.
Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.
<x0A>Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
Zum erstellen einer Instanzvorlage:
compute.instanceTemplates.create
für das Projekt -
Zum Erstellen einer zonalen MIG:
compute.instanceGroupManagers.create
für das Projekt -
So erstellen Sie eine Anfrage zur Größenanpassung in einer MIG:
compute.instanceGroupManagers.update
für das Projekt Wenn Sie VMs erstellen möchten, sobald Ressourcen für Arbeitslasten verfügbar sind, die bis zu sieben Tage lang ausgeführt werden, erstellen Sie eine Instanzvorlage mit dem Bereitstellungsmodell „Flex-Start“.
Wenn Sie VMs erstellen möchten, indem Sie eine automatisch erstellte Reservierung für eine zukünftige Reservierung im Kalendermodus nutzen, erstellen Sie eine Instanzvorlage mit dem reservierungsgebundenen Bereitstellungsmodell.
Verwenden Sie einen GPU-Maschinentyp, mit Ausnahme des A4X-Maschinentyps.
Beenden Sie VMs während Hostwartungsereignissen.
Löschen Sie VMs am Ende ihrer Ausführungsdauer mit den Feldern
maxRunDuration
undinstanceTerminationAction
.Verwenden Sie das Bereitstellungsmodell „Flex-Start“.
Rufen Sie in der Google Cloud Console die Seite Instanzvorlagen auf.
Klicken Sie auf Instanzvorlage erstellen. Die Seite Instanzvorlage erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die Instanzvorlage ein.
Wählen Sie im Bereich Standort eine der folgenden Optionen aus:
Um eine regionale Instanzvorlage zu erstellen, wählen Sie Regional (empfohlen) und dann die Region aus, in der Sie die Vorlage erstellen möchten.
Zum Erstellen einer globalen Instanzvorlage wählen Sie Global aus.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Klicken Sie auf den Tab GPUs.
Wählen Sie in der Liste GPU-Typ einen GPU-Typ aus.
Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
Optional: Wenn der ausgewählte GPU-Typ NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten unterstützt und Sie grafikintensive Arbeitslasten ausführen möchten, wählen Sie Virtuelle Workstation (NVIDIA GRID) aktivieren aus.
Wählen Sie im Abschnitt Maschinentyp einen Maschinentyp aus.
Führen Sie im Bereich Bereitstellungsmodell die folgenden Schritte aus:
Wählen Sie im Feld VM-Bereitstellungsmodell die Option Flex-Start aus.
Maximieren Sie Erweiterte Einstellungen für das VM-Bereitstellungsmodell.
Klicken Sie auf das Kästchen Zeitlimit für die VM festlegen.
Wenn Sie eine Laufzeit für die über die Instanzvorlage erstellten VMs festlegen möchten, geben Sie im Feld Anzahl der Stunden eingeben die Anzahl der Stunden ein. Der Wert muss zwischen 36 Sekunden (
0.01
) und sieben Tagen (168
) liegen.
Optional: Klicken Sie im Abschnitt Bootlaufwerk auf Ändern, um den Standardwert für den Bootlaufwerktyp oder das Image zu ändern. Folgen Sie dann den Aufforderungen, um das Bootlaufwerk zu ändern.
Klicken Sie auf Erstellen.
Das Flag
--instance-termination-action
, das aufDELETE
gesetzt ist.Das Flag
--maintenance-policy
, das aufTERMINATE
gesetzt ist.Das Flag
--max-run-duration
.Das Flag
--provisioning-model
, das aufFLEX_START
gesetzt ist.Das Flag
--reservation-affinity
, das aufnone
gesetzt ist.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE_FAMILY
ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siedebian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.REGION
: Region, in der die Instanzvorlage erstellt werden soll.MACHINE_TYPE
: der GPU-Maschinentyp, der für die VMs verwendet werden soll. Wenn Sie einen N1-Maschinentyp angeben, müssen Sie das Flag--accelerator
einfügen, um die Anzahl und den Typ der GPUs zu definieren, die an Ihre VMs angehängt werden sollen.RUN_DURATION
ist die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatieren. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.So erstellen Sie eine regionale Instanzvorlage: Beta-Methode
regionInstanceTemplates.insert
So erstellen Sie eine globale Instanzvorlage: Beta-Methode
instanceTemplates.insert
Das Feld
reservationAffinity.consumeReservationType
ist aufNO_RESERVATION
gesetzt.Das Feld
scheduling.instanceTerminationAction
ist aufDELETE
gesetzt.Das Feld
scheduling.maxRunDuration
.Das Feld
scheduling.onHostMaintenance
ist aufTERMINATE
gesetzt.Das Feld
scheduling.provisioningModel
ist aufFLEX_START
gesetzt.PROJECT_ID
: die ID des Projekts, in dem die Instanzvorlage erstellt werden soll.REGION
: Region, in der die Instanzvorlage erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE
: Wählen Sie eine der folgenden Optionen aus:Eine bestimmte Version des Betriebssystem-Images; Beispiel:
debian-12-bookworm-v20240617
.Eine Image-Familie, die als
family/IMAGE_FAMILY
formatiert sein muss. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siefamily/debian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.
MACHINE_TYPE
: der GPU-Maschinentyp, der für die VMs verwendet werden soll. Wenn Sie einen N1-Maschinentyp angeben, müssen Sie das FeldguestAccelerators
einfügen, um die Anzahl und den Typ der GPUs zu definieren, die an Ihre VMs angehängt werden sollen.RUN_DURATION
ist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen600
, d. h. 600 Sekunden (10 Minuten) und604800
, also 604.800 Sekunden (7 Tage) liegen.Verwenden Sie einen A4- oder A3-Ultra-Maschinentyp, wie in der Reservierung angegeben.
Beenden Sie VMs während Hostwartungsereignissen.
Löschen Sie VMs am Ende des Reservierungszeitraums mit dem Feld
instanceTerminationAction
.Verwenden Sie das reservierungsgebundene Bereitstellungsmodell.
Rufen Sie in der Google Cloud Console die Seite Instanzvorlagen auf.
Klicken Sie auf Instanzvorlage erstellen. Die Seite Instanzvorlage erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die Instanzvorlage ein.
Wählen Sie im Bereich Standort eine der folgenden Optionen aus:
Um eine regionale Instanzvorlage zu erstellen, wählen Sie Regional (empfohlen) und dann die Region aus, in der Sie die Vorlage erstellen möchten.
Zum Erstellen einer globalen Instanzvorlage wählen Sie Global aus.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Klicken Sie auf den Tab GPUs.
Wählen Sie in der Liste GPU-Typ eine der folgenden Optionen aus, wie in der Reservierung angegeben, die Sie verwenden möchten:
So verwenden Sie A4-VMs: NVIDIA B200 180GB
So verwenden Sie A3 Ultra-VMs: NVIDIA H200 141 GB
Durch diese Aktion wird das Bereitstellungsmodell der Instanzvorlage automatisch auf Reservierungsgebunden festgelegt.
Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
Optional: Wenn der ausgewählte GPU-Typ NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten unterstützt und Sie grafikintensive Arbeitslasten ausführen möchten, wählen Sie Virtuelle Workstation (NVIDIA GRID) aktivieren aus.
Wählen Sie im Abschnitt Maschinentyp einen Maschinentyp aus.
Führen Sie im Bereich Bereitstellungsmodell die folgenden Schritte aus:
Maximieren Sie Erweiterte Einstellungen für das VM-Bereitstellungsmodell.
Wählen Sie in der Liste Bei VM-Beendigung den Wert Löschen aus.
Optional: Klicken Sie im Abschnitt Bootlaufwerk auf Ändern, um den Standardwert für den Bootlaufwerktyp oder das Image zu ändern. Folgen Sie dann den Aufforderungen, um das Bootlaufwerk zu ändern.
Maximieren Sie den Abschnitt Erweiterte Optionen und gehen Sie dann so vor:
Maximieren Sie den Bereich Verwaltung.
Wählen Sie im Bereich Reservierungen die Option Reservierung auswählen und dann Reservierung auswählen aus. Folgen Sie im angezeigten Bereich der Anleitung, um die Reservierung auszuwählen, die Sie nutzen möchten.
Klicken Sie auf Erstellen.
Das Flag
--instance-termination-action
, das aufDELETE
gesetzt ist.Das Flag
--maintenance-policy
, das aufTERMINATE
gesetzt ist.Das Flag
--provisioning-model
, das aufRESERVATION_BOUND
gesetzt ist.Das Flag
--reservation-affinity
, das aufspecific
gesetzt ist.Das Flag
--reservation
.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE_FAMILY
ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siedebian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.REGION
: Region, in der die Instanzvorlage erstellt werden soll.MACHINE_TYPE
: der A4- oder A3 Ultra-Maschinentyp, der in der Reservierung angegeben ist, die Sie nutzen möchten.RESERVATION_URL
: die URL der automatisch erstellten Reservierung für eine zukünftige Reservierung im Kalendermodus, die Sie nutzen möchten. Geben Sie einen der folgenden Werte an:Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist:
RESERVATION_NAME
.Wenn die automatisch erstellte Reservierung in einem anderen Projekt vorhanden ist:
projects/PROJECT_ID/reservations/RESERVATION_NAME
.
So erstellen Sie eine regionale Instanzvorlage:
regionInstanceTemplates.insert
-MethodeSo erstellen Sie eine globale Instanzvorlage:
instanceTemplates.insert
-MethodeDas Feld
reservationAffinity.consumeReservationType
ist aufSPECIFIC_RESERVATION
gesetzt.Das Feld
reservationAffinity.key
ist aufcompute.googleapis.com/reservation-name
gesetzt.Das Feld
reservationAffinity.values
ist auf die URL der automatisch erstellten Reservierung gesetzt.Das Feld
scheduling.instanceTerminationAction
ist aufDELETE
gesetzt.Das Feld
scheduling.onHostMaintenance
ist aufTERMINATE
gesetzt.Das Feld
scheduling.provisioningModel
ist aufRESERVATION_BOUND
gesetzt.PROJECT_ID
: die ID des Projekts, in dem die Instanzvorlage erstellt werden soll.REGION
: Region, in der die Instanzvorlage erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.IMAGE
: Wählen Sie eine der folgenden Optionen aus:Eine bestimmte Version des Betriebssystem-Images; Beispiel:
debian-12-bookworm-v20240617
.Eine Image-Familie, die als
family/IMAGE_FAMILY
formatiert sein muss. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siefamily/debian-12
angeben, wird die aktuelle Version in der Debian 12-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.
MACHINE_TYPE
: der A4- oder A3 Ultra-Maschinentyp, der in der Reservierung angegeben ist, die Sie nutzen möchten.RESERVATION_URL
: die URL der automatisch erstellten Reservierung für eine zukünftige Reservierung im Kalendermodus, die Sie nutzen möchten. Geben Sie einen der folgenden Werte an:Wenn die automatisch erstellte Reservierung in Ihrem Projekt vorhanden ist:
RESERVATION_NAME
Wenn die automatisch erstellte Reservierung in einem anderen Projekt vorhanden ist:
projects/PROJECT_ID/reservations/RESERVATION_NAME
Legen Sie den Aktualisierungstyp der MIG auf „opportunistisch” fest (Standardeinstellung).
Wenn Sie Autoscaling in der MIG konfiguriert haben, löschen Sie die Autoscaling-Konfiguration.
Wenn Sie eine regionale MIG verwenden, legen Sie die Zielverteilungsform auf
ANY_SINGLE_ZONE
fest.Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.
Klicken Sie auf Instanzgruppe erstellen. Die Seite Instanzgruppe erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die MIG ein.
Bevor Sie eine Instanzvorlage auswählen können, müssen Sie die Autoscaling-Konfiguration löschen und Reparaturen deaktivieren. Gehen Sie dazu so vor:
So löschen Sie die Autoscaling-Konfiguration:
Klicken Sie im Abschnitt Autoscaling auf die Liste Autoscaling-Modus und dann auf Autoscaling-Konfiguration löschen.
Klicken Sie im Bestätigungsdialogfeld auf Löschen.
Wenn Sie Reparaturen deaktivieren möchten, klicken Sie im Abschnitt Lebenszyklus von VM-Instanzen auf die Liste Standardaktion bei Fehler und wählen Sie dann Keine Aktion aus.
Kehren Sie zum Feld Instanzvorlage zurück. Wählen Sie in der Liste Instanzvorlage die Instanzvorlage aus, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage auswählen, wird die Liste Region auf die Region der Vorlage festgelegt.
Führen Sie einen der folgenden Schritte aus:
So erstellen Sie eine Anfrage zur Größenanpassung, wenn Sie die MIG erstellen:
Geben Sie im Feld Anzahl der Instanzen die Anzahl der VMs ein, die Sie gleichzeitig erstellen möchten.
Klicken Sie das Kästchen Anfrage zur Größenanpassung verwenden, um VMs auf einmal zu erstellen an.
Optional: Wenn in der Instanzvorlage der MIG eine Ausführungsdauer angegeben ist, können Sie eine andere Ausführungsdauer angeben. Geben Sie dazu im Feld Angefragte Laufzeit und in den Listen Einheit eine Laufzeit an. Sie müssen eine Dauer zwischen einer Stunde und sieben Tagen angeben.
Wenn Sie nach dem Erstellen der MIG eine Anfrage zur Größenanpassung erstellen möchten, geben Sie im Feld Anzahl der Instanzen den Wert
0
ein.
Geben Sie im Abschnitt Standort an, ob Sie eine zonale oder eine regionale MIG erstellen möchten:
Wenn Sie eine zonale MIG erstellen möchten, wählen Sie Einzelne Zone aus. Wenn Sie eine regionale MIG erstellen möchten, wählen Sie Mehrere Zonen aus.
Wählen Sie die Region und die Zonen der MIG aus.
Wenn Sie eine regionale MIG erstellen, gehen Sie so vor:
Wählen Sie im Feld Zielverteilungsform die Option Beliebige einzelne Zone aus.
Klicken Sie im angezeigten Dialogfeld auf Instanzverteilung deaktivieren.
Klicken Sie auf Erstellen.
Führen Sie den folgenden Befehl aus, um eine zonale MIG zu erstellen:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Führen Sie den folgenden Befehl aus, um eine regionale MIG zu erstellen:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --region=REGION \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none \ --default-action-on-vm-failure=do_nothing
INSTANCE_GROUP_NAME
: Name der MIG, die erstellt werden soll.INSTANCE_TEMPLATE_URL
: die teilweise URL der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage zum Erstellen der MIG verwenden möchten, können Sie die MIG nur in der Region der Vorlage erstellen. Geben Sie einen der folgenden Werte an:Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_NAME
ZONE
: die Zone, in der die MIG erstellt werden soll.REGION
: die Region, in der die MIG erstellt werden soll.So erstellen Sie eine zonale MIG und senden eine
POST
-Anfrage mit der MethodeinstanceGroupManagers.insert
:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
So erstellen Sie eine regionale MIG und senden eine
POST
-Anfrage mit derregionInstanceGroupManagers.insert
-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE" }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
PROJECT_ID
: die ID des Projekts, in dem sich die im vorherigen Abschnitt erstellte Instanzvorlage befindet.INSTANCE_TEMPLATE_URL
: die teilweise URL der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage zum Erstellen der MIG verwenden möchten, können Sie die MIG nur in der Region der Vorlage erstellen. Geben Sie einen der folgenden Werte an:Für eine regionale Instanzvorlage:
regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
Für eine globale Instanzvorlage:
global/instanceTemplates/INSTANCE_TEMPLATE_NAME
ZONE
: die Zone, in der die MIG erstellt werden soll.REGION
: die Region, in der die MIG erstellt werden soll.INSTANCE_GROUP_NAME
: Name der MIG, die erstellt werden soll.Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.
Klicken Sie in der Spalte Name auf den Namen der MIG, in der Sie die Anfrage zur Größenanpassung erstellen möchten.
Die Übersichtsseite der MIG wird geöffnet.
Klicken Sie in der Zeile Anfrage zur Größenanpassung auf
Anfragen zur Größenanpassung bearbeiten.Klicken Sie auf
Neue Anfrage zur Größenanpassung.Der Bereich Neue Anfragen zur Größenanpassung wird angezeigt.
Geben Sie im Feld Name den Namen der Anfrage ein.
Geben Sie im Feld Anzahl erforderlicher zusätzlicher Instanzen die Anzahl der VMs ein, die der MIG gleichzeitig hinzugefügt werden sollen.
Optional: Wenn in der Instanzvorlage der MIG eine Ausführungsdauer angegeben ist, können Sie eine andere Ausführungsdauer angeben. Geben Sie dazu im Feld Angefragte Laufzeit und in den Listen Einheit eine Laufzeit an. Sie müssen eine Dauer zwischen einer Stunde und sieben Tagen angeben.
Klicken Sie auf Erstellen.
Verwenden Sie zum Erstellen einer Anfrage zur Größenanpassung in einer zonalen MIG den Befehl
instance-groups managed resize-requests create
.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
Verwenden Sie zum Erstellen einer Anfrage zur Größenanpassung in einer regionalen MIG den Befehl
beta instance-groups managed resize-requests create
.gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
INSTANCE_GROUP_NAME
: der Name der MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.RESIZE_REQUEST_NAME
ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT
ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.ZONE
: die Zone, in der die MIG vorhanden ist.REGION
: Die Region, in der die MIG vorhanden ist.Wenn in der Instanzvorlage der MIG eine Ausführungsdauer angegeben ist, können Sie eine andere Ausführungsdauer angeben. Fügen Sie dazu dem Befehl das Flag
--requested-run-duration
hinzu. Sie müssen eine Dauer zwischen 10 Minuten und 7 Tagen angeben.Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie mit dem Befehl
beta instance-groups managed resize-requests create
eine Liste der Namen der zu erstellenden VMs angeben. Ersetzen Sie im Befehl das Flag--resize-request
durch das Flag--instances
.Wenn Sie eine Anfrage zur Größenänderung in einer zonalen MIG erstellen möchten, senden Sie eine
POST
-Anfrage mit der MethodeinstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
Wenn Sie eine Anfrage zur Größenänderung in einer regionalen MIG erstellen möchten, senden Sie eine
POST
-Anfrage mit der Methodebeta.regionInstanceGroupManagerResizeRequests.insert
.PROJECT_ID
ist die ID des Projekts, in dem die angegebene MIG vorhanden ist.ZONE
: die Zone, in der die MIG vorhanden ist.REGION
: Die Region, in der die MIG vorhanden ist.INSTANCE_GROUP_NAME
ist der Name der MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.RESIZE_REQUEST_NAME
ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT
ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.Wenn in der Instanzvorlage der MIG eine Ausführungsdauer angegeben ist, können Sie eine andere Ausführungsdauer angeben. Fügen Sie dazu das Feld
requestedRunDuration
in den Anfragetext ein. Sie müssen eine Dauer zwischen 10 Minuten und 7 Tagen in Sekunden angeben.Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie eine Liste der Namen der zu erstellenden VMs angeben. Senden Sie dazu eine
POST
-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insert
für eine regionale MIG oder an die Methodebeta.instanceGroupManagerResizeRequests.insert
für eine zonale MIG. Ersetzen Sie im Anfragetext das FeldresizeBy
durch dasinstanceNames
-Feld.
REST
Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von Anfragen zur Größenanpassung von MIGs benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Anfragen zur Größenanpassung von MIGs erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Anfragen zur Größenänderung von MIGs zu erstellen:
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
MIG für Anfragen zur Größenänderung vorbereiten
Zum Erstellen von Anfragen zur Größenänderung in einer MIG müssen Sie eine Instanzvorlage und die MIG konfigurieren, wie in den folgenden Abschnitten beschrieben.
Instanzvorlage erstellen
Erstellen Sie je nach Anwendungsfall für MIG-Anfragen zur Größenänderung eine Instanzvorlage mit einer der folgenden Methoden:
Bereitstellungsmodell „Flex-Start“ verwenden
Wenn Sie eine Instanzvorlage erstellen möchten, die für MIG-Anfragen zur Größenänderung und zum Erstellen von VMs konfiguriert ist, sobald Ressourcen verfügbar sind, müssen Sie Folgendes in der Vorlage angeben:
Wählen Sie eine der folgenden Optionen aus, um eine Instanzvorlage zu erstellen:
Console
gcloud
Verwenden Sie zum Erstellen einer Instanzvorlage den Befehl
beta instance-templates create
mit den folgenden Flags:Führen Sie beispielsweise den folgenden Befehl aus, um eine regionale Instanzvorlage zu erstellen. Wenn Sie eine globale Instanzvorlage erstellen möchten, verwenden Sie denselben Befehl ohne das
--instance-template-region
-Flag.gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-template-region=REGION \ --instance-termination-action=DELETE \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
Ersetzen Sie Folgendes:
REST
Wenn Sie eine Instanzvorlage erstellen möchten, senden Sie eine
POST
-Anfrage an eine der folgenden Methoden:Geben Sie im Anfragetext die folgenden Felder an:
So erstellen Sie beispielsweise eine regionale Instanzvorlage:
POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
Ersetzen Sie Folgendes:
Weitere Informationen zum Erstellen einer Instanzvorlage finden Sie unter Instanzvorlagen erstellen.
Reservierungsgebundenes Bereitstellungsmodell verwenden
Wenn Sie eine Instanzvorlage erstellen möchten, die für MIG-Anfragen zur Größenänderung und für die Nutzung einer Reservierung konfiguriert ist, müssen Sie Folgendes in der Vorlage angeben:
Wählen Sie eine der folgenden Optionen aus, um eine Instanzvorlage zu erstellen:
Console
gcloud
Verwenden Sie zum Erstellen einer Instanzvorlage den Befehl
instance-templates create
mit den folgenden Flags:Führen Sie beispielsweise den folgenden Befehl aus, um eine regionale Instanzvorlage zu erstellen. Wenn Sie eine globale Instanzvorlage erstellen möchten, verwenden Sie denselben Befehl ohne das
--instance-template-region
-Flag.gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --provisioning-model=RESERVATION_BOUND \ --reservation-affinity=specific \ --reservation=RESERVATION_URL
Ersetzen Sie Folgendes:
REST
Wenn Sie eine Instanzvorlage erstellen möchten, senden Sie eine
POST
-Anfrage an eine der folgenden Methoden:Geben Sie im Anfragetext die folgenden Felder an:
So erstellen Sie beispielsweise eine regionale Instanzvorlage:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "SPECIFIC_RESERVATION", "key": "compute.googleapis.com/reservation-name", "values": [ "RESERVATION_URL" ] }, "scheduling": { "instanceTerminationAction": "DELETE", "onHostMaintenance": "TERMINATE", "provisioningModel": "RESERVATION_BOUND" } } }
Ersetzen Sie Folgendes:
Weitere Informationen zum Erstellen einer Instanzvorlage finden Sie unter Instanzvorlagen erstellen.
MIG erstellen oder aktualisieren
Nachdem Sie die Instanzvorlage wie im vorherigen Abschnitt beschrieben erstellt haben, verwenden Sie sie, um gemäß der folgenden Anleitung eine MIG zu erstellen oder zu aktualisieren. Außerdem müssen Sie Folgendes tun, um die MIG auf Anfragen zur Größenänderung vorzubereiten:
Wählen Sie eine der folgenden Optionen aus, um eine MIG zu erstellen, die mit Anfragen zur Größenanpassung kompatibel ist:
Console
gcloud
Verwenden Sie den Befehl
instance-groups managed create
, wobei das Flag--default-action-on-vm-failure
aufdo_nothing
gesetzt ist. Wenn Sie eine regionale MIG erstellen, müssen Sie auch das Flag--target-distribution-shape
aufany-single-zone
und das Flag--instance-redistribution-type
aufnone
setzen.Ersetzen Sie Folgendes:
REST
Ersetzen Sie Folgendes:
Anfrage zur Größenanpassung in einer MIG erstellen
Bevor Sie Anfragen zur Größenanpassung für MIGs erstellen, müssen Sie die MIG wie im vorherigen Abschnitt beschrieben vorbereitet haben.
Nachdem Sie eine Anfrage zur Größenanpassung erstellt haben und alle angeforderten Ressourcen verfügbar sind, erstellt die MIG die angeforderte Anzahl von VMs auf einmal. Die VMs werden ausgeführt, bis die MIG sie nach Ablauf der angegebenen Ausführungsdauer löscht oder bis Sie sie löschen.
Wählen Sie eine der folgenden Optionen aus, um eine Anfrage zur Größenanpassung in einer MIG zu erstellen. Wenn Sie VMs mit bestimmten Namen über eine Größenänderungsanfrage zur MIG hinzufügen möchten, verwenden Sie die gcloud CLI oder die REST API.
Console
gcloud
Ersetzen Sie Folgendes:
Optional können Sie Folgendes tun:
REST
Geben Sie im Anfragetext Folgendes an:
{ "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
Ersetzen Sie Folgendes:
Optional können Sie Folgendes tun:
Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-11 (UTC).
-