Übersicht zum Erstellen einer Instanz mit angehängten GPUs


Compute Engine stellt Grafikprozessoren (Graphics Processing Units, GPUs) bereit, die Sie Ihren virtuellen Maschinen (VMs) hinzufügen können. Sie können diese GPUs nutzen, um bestimmte Arbeitslasten wie maschinelles Lernen und Datenverarbeitung auf Ihren VMs zu beschleunigen.

In diesem Dokument finden Sie eine Übersicht über die Schritte zum Erstellen einer VM mit angehängten GPUs.

Weitere Informationen zu GPUs in Compute Engine finden Sie unter GPUs.

GPU-Modell auswählen

Eine Liste der verfügbaren GPU-Modelle finden Sie unter GPU-Plattformen. Notieren Sie sich den Maschinentyp, der für das ausgewählte GPU-Modell unterstützt wird.

Für jedes Modell kann es auch hilfreich sein, Folgendes zu prüfen:

Beschränkungen

Zusätzlich zu den Einschränkungen für alle VMs mit GPUs gelten für jede Maschinenreihe mit angehängten GPUs die folgenden Einschränkungen:

A4-VMs

A3 Ultra-VMs

  • Sie können Kapazität nur mit den unterstützten Bereitstellungsoptionen für einen A3 Ultra-Maschinentyp anfordern.
  • Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für die zugesicherte Nutzung für VMs, die einen A3-Ultra-Maschinentyp verwenden.
  • Sie können den A3-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
  • Sie können nichtflüchtige Speicher (regional oder zonal) nicht auf einer VM verwenden, die den A3-Ultra-Maschinentyp verwendet.
  • Der A3-Ultra-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
  • Sie können den Maschinentyp einer VM vom Typ „A3 Ultra“ nicht ändern. Wenn Sie den Maschinentyp ändern müssen, müssen Sie eine neue VM erstellen.
  • Sie können den Maschinentyp einer VM nicht in einen A3-Ultra-Maschinentyp ändern. Wenn Sie eine VM benötigen, die einen A3-Ultra-Maschinentyp verwendet, müssen Sie eine neue VM erstellen.
  • A3 Ultra-Maschinentypen unterstützen keine einzelnen Mandanten.
  • Sie können Windows-Betriebssysteme nicht auf einem A3-Ultra-Maschinentyp ausführen.

A3 Mega-VMs

A3 High-VMs

  • Sie können Kapazität nur mit den unterstützten Bereitstellungsoptionen für einen A3-High-Maschinentyp anfordern.
  • Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für die zugesicherte Nutzung für VMs, die A3 High-Maschinentypen verwenden.
  • Sie können den A3 High-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
  • Sie können regionale nichtflüchtige Speicher nicht auf einer VM verwenden, die den A3-High-Maschinentyp verwendet.
  • Der A3 High-Maschinentyp ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
  • Sie können den Maschinentyp einer VM vom Typ „A3 High“ nicht ändern. Wenn Sie den Maschinentyp ändern müssen, müssen Sie eine neue VM erstellen.
  • Sie können den Maschinentyp einer VM nicht in einen A3 High-Maschinentyp ändern. Wenn Sie eine VM benötigen, die einen A3 High-Maschinentyp verwendet, müssen Sie eine neue VM erstellen.
  • A3 High-Maschinentypen unterstützen keine einzelnen Mandanten.
  • Sie können Windows-Betriebssysteme nicht auf einem A3 High-Maschinentyp ausführen.
  • Für die Maschinentypen a3-highgpu-1g, a3-highgpu-2g und a3-highgpu-4g gelten die folgenden Einschränkungen:
    • Für diese Maschinentypen müssen Sie entweder Spot-VMs oder eine Funktion verwenden, die den Dynamic Workload Scheduler (DWS) nutzt, z. B. Anfragen zur Größenänderung in einer MIG. Eine ausführliche Anleitung zu beiden Optionen findest du hier:
    • Sie können Hyperdisk Balanced mit diesen Maschinentypen nicht verwenden.
    • Sie können keine Reservierungen erstellen.
    Wenn Sie versuchen, eine VM mithilfe der Standardbereitstellung zu erstellen oder eine Reservierung für diese Maschinentypen zu erstellen, erhalten Sie eine Fehlermeldung.

A3 Edge-VMs

A2-Standard-VMs

  • Sie können Kapazität nur mit den unterstützten Bereitstellungsoptionen für einen A2-Standardmaschinentyp anfordern.
  • Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für die zugesicherte Nutzung für VMs, die A2-Standardmaschinentypen verwenden.
  • Sie können den A2-Standard-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
  • Die A2-Standardmaschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
  • Wenn Ihre VM einen A2-Standardmaschinentyp verwendet, können Sie nur von einem A2-Standardmaschinentyp zu einem anderen A2-Standardmaschinentyp wechseln. Sie können keinen anderen Maschinentyp ändern. Weitere Informationen finden Sie unter Beschleunigeroptimierte VMs ändern.
  • Sie können das Windows-Betriebssystem nicht mit den Maschinentypen <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 Standard verwenden. Wählen Sie einen anderen A2-Standard-Maschinentyp aus, wenn Sie Windows-Betriebssysteme verwenden.</codea2-megagpu-16g<>
  • Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-VMs verwenden, die A2-Standard-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.
  • A2-Standardmaschinentypen unterstützen keine einzelnen Mandanten.

A2-Ultra-VMs

  • Sie können Kapazität nur über die unterstützten Bereitstellungsoptionen für einen A2-Ultra-Maschinentyp anfordern.
  • Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für die zugesicherte Nutzung für VMs, die A2-Ultra-Maschinentypen verwenden.
  • Sie können den A2-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
  • Die A2-Ultra-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
  • Wenn Ihre VM einen A2-Ultra-Maschinentyp verwendet, können Sie den Maschinentyp nicht ändern. Wenn Sie einen anderen A2-Ultra-Maschinentyp oder einen anderen Maschinentyp verwenden müssen, müssen Sie eine neue VM erstellen.
  • Sie können keinen anderen Maschinentyp in einen A2-Ultra-Maschinentyp ändern. Wenn Sie eine VM benötigen, die eine A2-Ultra-Maschinenfamilie verwendet, müssen Sie eine neue VM erstellen.
  • Sie können die schnelle Formatierung der angehängten lokalen SSDs nicht auf Windows-VMs verwenden, die A2-Ultra-Maschinentypen verwenden. Um diese lokalen SSDs zu formatieren, müssen Sie eine vollständige Formatierung mit dem diskpart-Dienstprogramm durchführen und format fs=ntfs label=tmpfs angeben.

G2-VMs

  • Sie können Kapazität nur mit den unterstützten Bereitstellungsoptionen für einen G2-Maschinentyp anfordern.
  • Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für die zugesicherte Nutzung für VMs, die G2-Maschinentypen verwenden.
  • Sie können G2-Maschinentypen nur in bestimmten Regionen und Zonen verwenden.
  • Die G2-Maschinentypen sind nur auf der Cascade Lake-Plattform verfügbar.
  • Nichtflüchtige Standardspeicher (pd-standard) werden auf VMs, die G2-Standardmaschinentypen verwenden, nicht unterstützt. Informationen zu unterstützten Laufwerkstypen finden Sie unter Unterstützte Laufwerkstypen für G2.
  • Sie können keine GPUs mit mehreren Instanzen auf G2-Maschinentypen erstellen.
  • Wenn Sie den Maschinentyp einer G2-VM ändern müssen, lesen Sie die Informationen unter Beschleunigeroptimierte VMs ändern.
  • Sie können keine Deep Learning VM Images als Bootlaufwerke für VMs verwenden, die G2-Maschinentypen verwenden.
  • Der aktuelle Standardtreiber für Container-Optimized OS unterstützt keine L4-GPUs, die auf G2-Maschinentypen ausgeführt werden. Container-Optimized OS unterstützt auch nur bestimmte Treiber. Wenn Sie Container-Optimized OS auf G2-Maschinentypen verwenden möchten, lesen Sie die folgenden Hinweise:
    • Verwenden Sie eine Container-Optimized OS-Version, die die mindestens empfohlene NVIDIA-Treiberversion 525.60.13 oder höher unterstützt. Weitere Informationen finden Sie in den Versionshinweisen zu Container-Optimized OS.
    • Geben Sie bei der Installation des Treibers die neueste verfügbare Version an, die für die L4-GPUs funktioniert. Beispiel: sudo cos-extensions install gpu -- -version=525.60.13.
  • In den folgenden Szenarien müssen Sie über die Google Cloud CLI oder REST G2-VMs erstellen:
    • Sie möchten benutzerdefinierte Speicherwerte angeben.
    • Sie möchten die Anzahl der sichtbaren CPU-Kerne anpassen.

N1+GPU-VMs

Informationen zu den Einschränkungen für N1-Instanzen mit GPUs finden Sie unter Funktionen der N1-Maschinenserie und GPUs der N1-Maschinenserie.

Betriebssystem auswählen

Wenn Sie GPUs für maschinelles Lernen nutzen, können Sie ein Deep-Learning-VM-Image für Ihre VM verwenden. Auf jedem Deep-Learning-VM-Image ist ein GPU-Treiber vorinstalliert und es enthält Pakete wie TensorFlow und PyTorch. Sie können die Deep-Learning-VM-Images auch für allgemeine GPU-Arbeitslasten verwenden. Informationen zu den verfügbaren Images und den in den Images installierten Paketen finden Sie unter Image auswählen. Sie können auch ein beliebiges öffentliches Image oder ein benutzerdefiniertes Image verwenden. Manche Images erfordern aber unter Umständen einen speziellen Treiber oder einen Installationsvorgang, der in diesem Dokument nicht behandelt wird.

Sie müssen erkennen, welche Treiber für Ihr Betriebssystem-Image geeignet sind. Hinweise zur Installation von Treibern finden Sie unter GPU-Treiber installieren.

GPU-Kontingent prüfen

Zum Schutz der Systeme und Nutzer von Compute Engine haben neue Projekte ein globales GPU-Kontingent, das die Gesamtzahl der GPUs begrenzt, die Sie in einer unterstützten Zone erstellen können. Informationen zum GPU-Kontingent finden Sie unter GPU-Kontingent.

Fordern Sie eine Kontingentaufstockung an, falls Sie Ihr GPU-Kontingent erhöhen müssen. Wenn Sie ein GPU-Kontingent anfordern, müssen Sie ein Kontingent für die GPU-Typen, die Sie in den einzelnen Regionen erstellen möchten, sowie ein zusätzliches globales Kontingent für die Gesamtzahl der GPUs aller Typen in allen Zonen anfordern.

Wenn Ihr Projekt einen bestehenden Abrechnungsverlauf hat, wird es nach Ihrer Anfrage automatisch Kontingente erhalten.

GPU-VMs und Zuteilungskontingente auf Abruf

Für Ressourcen von VMs, die das Standardbereitstellungsmodell verwenden (Standard-VMs), können in der Regel keine Kontingente für die Zuweisung auf Abruf verwendet werden. Diese sind für temporäre Arbeitslasten vorgesehen und in der Regel verfügbarer. Wenn Ihr Projekt kein Kontingent auf Abruf hat und Sie kein Kontingent auf Abruf angefordert haben, verbrauchen alle VMs in diesem Projekt Standardzuweisungskontingente.

Sobald Sie jedoch ein Kontingent auf Abruf anfordern, können Standard-VMs, die alle folgenden Kriterien erfüllen, nur das Kontingent auf Abruf in Anspruch nehmen.

Wenn Sie ein Zuteilungskontingent auf Abruf für solche Arbeitslasten verwenden, profitieren Sie sowohl von der unterbrechungsfreien Laufzeit von Standard-VMs als auch von der verbesserten Verfügbarkeit durch ein Zuteilungskontingent auf Abruf.

Unabhängig vom verwendeten Kontingent kommen Standard-VMs nicht für Spot-VMs infrage, die nicht vorzeitig beendet werden.

Weitere Informationen finden Sie unter Kontingente auf Abruf.

VM mit angehängten GPUs erstellen

Führen Sie die folgenden Schritte aus, um eine VM mit angehängten GPUs zu erstellen:

  1. Erstellen Sie die VM. Die zum Erstellen einer VM verwendete Methode hängt vom ausgewählten GPU-Modell ab.

  2. Damit die VM die GPU verwenden kann, müssen Sie den GPU-Treiber auf Ihrer VM installieren. Wenn Sie eine virtuelle NVIDIA RTX-Workstation (früher NVIDIA GRID) aktiviert haben, installieren Sie einen Treiber für eine virtuelle Workstation.

Nächste Schritte