In diesem Dokument wird beschrieben, wie Sie Anfragen zur Größenanpassung in einer verwalteten Instanzgruppe (Managed Instance Group, MIG) von VM-Instanzen mit angehängten GPUs erstellen.
Hinweise
- Lesen Sie Funktionsweise von Anfragen zur Größenänderung.
- Prüfen Sie Ihr GPU-Kontingent, damit Ihr Kontingent für die angeforderten Ressourcen ausreicht.
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud-Dienste und APIs überprüft.
Zur Ausführung von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei Compute Engine authentifizieren.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- Set a default region and zone.
-
Zum erstellen einer Instanzvorlage:
compute.instanceTemplates.create
für das Projekt -
Zum Erstellen einer zonalen MIG:
compute.instanceGroupManagers.create
für das Projekt -
Zum Erstellen von Anfragen zur Größenanpassung in einer MIG:
compute.instanceGroupManagers.update
für das Projekt Beenden Sie VMs während Hostwartungsereignissen.
Verwenden Sie keine Reservierungen.
Rufen Sie in der Google Cloud Console die Seite Instanzvorlagen auf.
Klicken Sie auf Instanzvorlage erstellen.
Geben Sie im Feld Name einen Namen für die Instanzvorlage ein.
Wählen Sie im Bereich Standort eine der folgenden Optionen aus:
Zum Erstellen einer globalen Instanzvorlage wählen Sie Global (Standardeinstellung) aus.
Um eine regionale Instanzvorlage zu erstellen, wählen Sie Regional und dann die Region aus, in der Sie die Instanzvorlage erstellen möchten.
Führen Sie im Abschnitt Maschinenkonfiguration die folgenden Schritte aus:
Klicken Sie auf den Tab GPUs.
Wählen Sie im Menü GPU-Typ den GPU-Typ.
Wählen Sie in der Liste Anzahl der GPUs die Anzahl der GPUs aus.
Optional: Wenn Ihr GPU-Modell NVIDIA RTX Virtual Workstations (vWS) für Grafikarbeitslasten unterstützt und Sie grafikintensive Arbeitslasten ausführen möchten, wählen Sie Virtuelle aktivieren Workstation (NVIDIA GRID).
Wählen Sie im Abschnitt Maschinentyp einen Maschinentyp aus.
Optional: Klicken Sie im Abschnitt Bootlaufwerk auf Ändern, um den Standardwert für den Bootlaufwerktyp oder das Image zu ändern. Folgen Sie dann den Aufforderungen, um das Bootlaufwerk zu ändern.
Maximieren Sie den Abschnitt Erweiterte Optionen und gehen Sie dann so vor:
Maximieren Sie den Bereich Verwaltung.
Wählen Sie im Menü Reservierungen die Option Nicht verwenden aus.
Klicken Sie auf Erstellen.
Das Flag
--maintenance-policy
, das aufTERMINATE
gesetzt ist.Das Flag
--reservation-affinity
, das aufnone
gesetzt ist.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.Für
IMAGE_FAMILY
oderIMAGE
muss eine der folgenden Optionen angegeben werden:IMAGE_FAMILY
ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siedebian-10
angeben, wird die aktuelle Version in der Debian 10-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.IMAGE
ist eine bestimmte Version des Betriebssystem-Images; Beispiel:debian-10-buster-v20200309
. Wenn Sie eine bestimmte Version des Betriebssystem-Images angeben möchten, müssen Sie das Flag--image-family
durch das Flag--image
ersetzen.
MACHINE_TYPE
ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das Flag--accelerator
ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.Setzen Sie das Feld
scheduling.onHostMaintenance
aufTERMINATE
.Setzen Sie das Feld
reservationAffinity.consumeReservationType
aufNO_RESERVATION
.PROJECT_ID
ist die ID des Projekts, in dem die Instanzvorlage erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der zu erstellenden Instanzvorlage.IMAGE_PROJECT
ist das Image-Projekt, das das Image enthält, z. B.debian-cloud
. Weitere Informationen zu den unterstützten Image-Projekten finden Sie unter Öffentliche Images.Für
IMAGE
oderIMAGE_FAMILY
muss eine der folgenden Optionen angegeben werden:IMAGE
ist eine bestimmte Version des Betriebssystem-Images; Beispiel:debian-10-buster-v20200309
.IMAGE_FAMILY
ist eine Image-Familie. Diese gibt das neueste nicht verworfene Betriebssystem-Image an. Beispiel: Wenn Siefamily/debian-10
angeben, wird die aktuelle Version in der Debian 10-Image-Familie verwendet. Weitere Informationen zur Verwendung von Image-Familien finden Sie unter Best Practices für Image-Familien.
MACHINE_TYPE
ist ein Maschinentyp, der GPUs unterstützt. Wenn Sie einen N1-Maschinentyp angeben, fügen Sie das FeldguestAccelerators
in den Anfragetext ein, um die Anzahl und den Typ der GPUs anzugeben, die an Ihre VMs angehängt werden sollen.Legen Sie den Aktualisierungstyp der MIG auf „opportunistisch” fest (Standardeinstellung).
Wenn Sie Autoscaling in der MIG konfiguriert haben, löschen Sie die Autoscaling-Konfiguration.
Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.
Klicken Sie auf Instanzgruppe erstellen.
Die Seite Instanzgruppe erstellen wird geöffnet.
Geben Sie im Feld Name einen Namen für die MIG ein.
Wählen Sie im Menü Instanzvorlage die Instanzvorlage aus, die Sie im vorherigen Abschnitt erstellt haben. Wenn Sie eine regionale Instanzvorlage auswählen, wird die Liste Region auf die Region der Instanzvorlage festgelegt.
Führen Sie im Abschnitt Standort folgende Schritte aus:
Wählen Sie Einzelne Zone (Standardeinstellung) aus.
Wählen Sie die Region und Zone der MIG aus.
So löschen Sie die Autoscaling-Konfiguration:
Klicken Sie im Abschnitt Autoscaling auf die Liste Autoscaling-Modus und dann auf Autoscaling-Konfiguration löschen.
Klicken Sie im Bestätigungsdialogfeld auf Löschen.
Wenn Sie Reparaturen deaktivieren möchten, klicken Sie im Abschnitt Lebenszyklus von VM-Instanzen auf die Liste Standardaktion bei Fehler und wählen Sie dann Keine Aktion aus.
Führen Sie einen der folgenden Schritte aus:
So erstellen Sie jetzt eine Anfrage zur Größenanpassung:
Geben Sie im Feld Anzahl der Instanzen die Anzahl der VMs ein, die Sie auf einmal erstellen möchten.
Klicken Sie das Kästchen Anfrage zur Größenanpassung verwenden, um VMs auf einmal zu erstellen an.
Geben Sie im Feld Angeforderte Ausführungsdauer und in der Liste Einheit die Ausführungsdauer der VMs an. Die Dauer muss zwischen 1 Stunde und 7 Tagen liegen.
Geben Sie andernfalls im Feld Anzahl der Instanzen den Wert
0
ein. Sie können der Gruppe später VMs hinzufügen, indem Sie Anfragen zur Größenanpassung erstellen.
Klicken Sie auf Erstellen.
INSTANCE_GROUP_NAME
: Name der MIG, die erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben.ZONE
ist die Zone, in der die verwaltete Instanzgruppe erstellt werden soll.PROJECT_ID
ist die ID des Projekts, in dem sich die im vorherigen Abschnitt erstellte Instanzvorlage befindet.ZONE
ist die Zone, in der die verwaltete Instanzgruppe erstellt werden soll.INSTANCE_TEMPLATE_NAME
ist der Name der Instanzvorlage, die Sie im vorherigen Abschnitt erstellt haben.INSTANCE_GROUP_NAME
: Name der MIG, die erstellt werden soll.Rufen Sie in der Google Cloud Console die Seite Instanzgruppen auf.
Klicken Sie in der Spalte Name auf den Namen der MIG, in der die Anfrage zur Größenanpassung erstellt werden soll.
Die Übersichtsseite der MIG wird geöffnet.
Klicken Sie in der Zeile Anfrage zur Größenanpassung auf
Anfragen zur Größenanpassung bearbeiten.Klicken Sie auf
Neue Anfrage zur Größenanpassung.Der Bereich Neue Anfragen zur Größenanpassung wird angezeigt.
Geben Sie im Feld Name den Namen der Anfrage ein.
Geben Sie im Feld Anzahl erforderlicher zusätzlicher Instanzen die Anzahl der VMs ein, die der MIG gleichzeitig hinzugefügt werden sollen.
Geben Sie in den Feldern Angeforderte Ausführungsdauer und Einheit die Dauer an, für die die angeforderten VMs ausgeführt werden sollen. Die Dauer muss zwischen 1 Stunde und 7 Tagen liegen.
Klicken Sie auf Erstellen.
INSTANCE_GROUP_NAME
ist der Name einer vorhandenen zonalen MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.RESIZE_REQUEST_NAME
ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT
ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.RUN_DURATION
ist die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond
,h
,m
bzw.s
formatiert werden. Geben Sie beispielsweise30m
für 30 Minuten oder1d2h3m4s
für 1 Tag, 2 Stunden, 3 Minuten und 4 Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.ZONE
: die Zone, in der sich die verwaltete Instanzgruppe befindet.PROJECT_ID
ist die ID des Projekts, in dem sich die angegebene MIG befindet.ZONE
: die Zone, in der sich die verwaltete Instanzgruppe befindet.INSTANCE_GROUP_NAME
ist der Name einer vorhandenen zonalen MIG, die zum Erstellen von Anfragen zur Größenanpassung darin konfiguriert ist.RESIZE_REQUEST_NAME
ist der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT
ist die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.RUN_DURATION
ist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen600
, d. h. 600 Sekunden (10 Minuten) und604800
, also 604.800 Sekunden (7 Tage) liegen.Anfragen zur Größenanpassung in einer MIG anzeigen, abbrechen oder löschen
Informationen zum Aufrufen der tatsächlichen und prognostizierten Nutzung Ihrer VMs und GPUs
REST
Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
Weitere Informationen finden Sie unter Für die Verwendung von REST authentifizieren in der Dokumentation zur Google Cloud-Authentifizierung.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen von Anfragen zur Größenanpassung in einer MIG benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Anfragen zur Größenanpassung in einer MIG erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Anfragen zur Größenänderung in einer MIG zu erstellen:
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
MIG für Anfragen zur Größenanpassung vorbereiten
Zum Erstellen von Anfragen zur Größenänderung in einer MIG müssen Sie eine Instanzvorlage und die MIG konfigurieren, wie in den folgenden Abschnitten beschrieben.
Instanzvorlage erstellen
Wenn Sie Anfragen zur Größenanpassung in einer MIG erstellen möchten, muss die MIG eine Instanzvorlage mit den folgenden Konfigurationen verwenden:
Console
So erstellen Sie eine Instanzvorlage, die zum Erstellen von Größenanfragen in einer MIG konfiguriert ist:
gcloud
Verwenden Sie zum Erstellen einer Instanzvorlage, die zum Erstellen von Größenanfragen in einer MIG konfiguriert ist, den Befehl
instance-templates create
mit den folgenden Flags:Verwenden Sie zum Beispiel den folgenden Befehl:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --reservation-affinity=none
Ersetzen Sie Folgendes:
REST
Zum Erstellen einer Instanzvorlage, die zum Erstellen von Größenanfragen in einer MIG konfiguriert ist, senden Sie eine
POST
-Anfrage an die MethodeinstanceTemplates.insert
. Gehen Sie im Anfragetext so vor:Stellen Sie beispielsweise eine
POST
-Anfrage:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "mode": "READ_WRITE", "type": "PERSISTENT", "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "accessConfigs": [ { "name": "external-IP", "type": "ONE_TO_ONE_NAT" } ], "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "onHostMaintenance": "TERMINATE" } } }
Ersetzen Sie Folgendes:
Weitere Informationen zum Erstellen einer Instanzvorlage finden Sie unter Instanzvorlagen erstellen.
MIG erstellen oder aktualisieren
Nachdem Sie die Instanzvorlage erstellt haben, wie im vorherigen Abschnitt beschrieben, verwenden Sie sie, um gemäß der folgenden Anleitung eine MIG zu erstellen oder zu aktualisieren. Außerdem müssen Sie Folgendes tun, um die MIG auf Anfragen zur Größenanpassung vorzubereiten:
Console
So erstellen Sie eine zonale MIG, die zum Erstellen von Größenanfragen konfiguriert ist:
gcloud
Verwenden Sie zum Erstellen einer zonalen MIG, die für das Erstellen von Größenanfragen konfiguriert ist, den Befehl
instance-groups managed create
, wobei das Flag--default-action-on-vm-failure
aufdo_nothing
gesetzt ist.gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Ersetzen Sie Folgendes:
REST
Zum Erstellen einer zonalen MIG, die zum Erstellen von Größenanfragen konfiguriert ist, senden Sie eine
POST
-Anfrage an die MethodeinstanceGroupManagers.insert
. Geben Sie im Anfragetext das FelddefaultActionOnFailure
an, das aufDO_NOTHING
gesetzt ist.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Ersetzen Sie Folgendes:
Anfrage zur Größenanpassung in einer MIG erstellen
Bevor Sie Anfragen zur Größenanpassung erstellen, müssen Sie die MIG wie im vorherigen Abschnitt beschrieben vorbereitet haben.
Nachdem Sie eine Anfrage zur Größenanpassung erstellt haben und alle angeforderten Ressourcen verfügbar sind, erstellt die MIG die angeforderte Anzahl von VMs auf einmal. Die VMs werden ausgeführt, bis die MIG sie nach Ablauf der angegebenen Ausführungsdauer löscht oder bis Sie sie löschen.
Console
So erstellen Sie eine Anfrage zur Größenanpassung in einer MIG:
gcloud
Verwenden Sie zum Erstellen einer Anfrage zur Größenanpassung in einer MIG den Befehl
instance-groups managed resize-requests create
.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION \ --zone=ZONE
Ersetzen Sie Folgendes:
REST
Um eine Anfrage zur Größenänderung in einer MIG zu erstellen, senden Sie eine
POST
-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT, "requestedRunDuration": { "seconds": "RUN_DURATION" } }
Ersetzen Sie Folgendes:
Nächste Schritte
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2024-12-20 (UTC).
-