Bereitstellungsmodelle für Compute Engine-Instanzen


In diesem Dokument werden die Bereitstellungsmodelle für Compute Engine-Instanzen beschrieben. Weitere Informationen zu Bereitstellungsoptionen finden Sie unter Compute Engine-Bereitstellungsstrategie für Ihre Arbeitslast auswählen.

Bereitstellungsmodelle bestimmen die Verfügbarkeit, Lebensdauer und Preise Ihrer Instanzen. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

  • Standard

  • Spot

  • Flex-Start (Vorschau)

  • Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start (Vorschau) Reservierungsgebunden
Zusammenfassung
  • Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
  • Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen.
  • Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen.
  • Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Instanzen jederzeit zu beenden oder zu löschen, um Kapazität zurückzugewinnen.
  • Nachdem Sie eine zonale verwaltete Instanzgruppe (MIG) erstellt haben, fordern Sie Compute Engine auf, der MIG Instanzen mit angehängten GPUs hinzuzufügen. Compute Engine plant die Bereitstellung der Instanzen basierend auf der Ressourcenverfügbarkeit.
  • Sie können festlegen, wann Instanzen gelöscht werden sollen. Sie können sie jedoch nicht stoppen, pausieren oder neu erstellen. Die Instanzen werden bis zu sieben Tage lang ausgeführt. Anschließend werden sie von Compute Engine gelöscht.
  • Sie können eine Kapazitätsreservierung für ein zukünftiges Datum anfordern, um Instanzen mit angehängten GPUs zu erstellen. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU-Instanzen erstellen, die der Reservierung entsprechen.
  • Während des genehmigten Reservierungszeitraums können Sie Instanzen nach Bedarf beenden, neu starten, löschen und neu erstellen, um die Reservierung zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen.
Anwendungsfälle Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten:
  • Webserver
  • Datenbanken
  • Unternehmensanwendungen
  • Entwicklung und Tests
Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden Arbeitslasten:
  • Batchverarbeitung
  • Hochleistungs-Computing (HPC)
  • Continuous Integration und Continuous Deployment (CI/CD)
  • Datenanalyse
  • Medien-Codierung
  • Onlineinferenz
Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten:
  • Vortraining kleiner Modelle
  • Modellabstimmung
  • HPC-Simulation
  • Batch-Inferenz
Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.:
  • Für Arbeitslasten mit einer Dauer von bis zu 90 Tagen:
    • Jobs zum Vortrainieren von Modellen
    • Jobs zur Modellabstimmung
    • HPC-Simulationsarbeitslasten
    • Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast
  • Für Arbeitslasten, die länger als 90 Tage dauern:
    • Trainingsarbeitslasten
    • Inferenzarbeitslasten
Preise Für Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen. Die meisten vCPUs, GPUs und lokalen SSDs sind mit einem Rabatt von 60–91% verfügbar. Weitere Informationen finden Sie unter Preise für Spot-VMs. Je nach Maschinenfamilie, die von Ihren Instanzen verwendet wird, erhalten Sie bis zu 53% Rabatt auf vCPUs und GPUs. Weitere Informationen finden Sie unter Preise für Dynamic Workload Scheduler (DWS). Je nach Maschinenfamilie, die von Ihren Instanzen verwendet wird, erhalten Sie bis zu 53% Rabatt auf vCPUs und GPUs. Außerdem fallen Kosten an, je nachdem, wie Sie Kapazität zum Erstellen von Instanzen reservieren:
Kontingent Wenn Sie eine Instanz erstellen, wird das Standardkontingent verbraucht. Wenn Sie eine Instanz erstellen, wird Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Google Cloud Guthaben für die kostenlose Stufe gilt nicht für Spot-VMs. Wenn die MIG der Gruppe Instanzen hinzufügt, wird das Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Das Kontingent gilt nicht für das reservierungsgebundene Bereitstellungsmodell.

Verfügbarkeit und Lebensdauer von Instanzen

In der folgenden Tabelle sehen Sie die Verfügbarkeit und Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle:

Standard Spot Flex-Start (Vorschau) Reservierungsgebunden
Voraussetzungen für die Erstellung Es gibt keine Voraussetzungen für die Erstellung. Es gibt keine Voraussetzungen für die Erstellung. Es gibt keine Voraussetzungen für die Erstellung.

Wenn Sie Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren:

Zum von Ihnen ausgewählten Lieferdatum und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Instanzen erstellen.
Unterstützte Maschinenserien Sie können jede Maschinenreihe außer A4X, A4 und A3 Ultra verwenden. Sie können alle Maschinenserien verwenden, mit Ausnahme der folgenden:
  • M2 und M3
  • Bare-Metal-Instanzen
Sie können nur die folgenden Maschinenserien verwenden:
Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden:
Instanzverfügbarkeit Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind. Sie können Instanzen nur erstellen, indem Sie Anfragen zur Größenanpassung in einer MIG erstellen. Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten. Sie können Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am angeforderten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Instanzen erstellen können. Wenn Sie Ressourcen mit zukünftigen Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.
Lebensdauer von Instanzen Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:
  • Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet.
  • In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.
Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:
  • Compute Engine kann die Instanz jederzeit beenden oder löschen, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet.
  • Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet.
  • In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.
Die bereitgestellten Instanzen werden für die von Ihnen ausgewählte Laufzeit ausgeführt, die bis zu sieben Tage betragen kann. Sie können Instanzen nicht beenden, anhalten oder neu erstellen.

Compute Engine löscht Instanzen, wenn einer der folgenden Fälle eintritt:
  • Sie fordern das Löschen von Instanzen an.
  • Die Instanzen erreichen das Ende ihrer Laufzeit.
Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen:
  • Compute Engine beendet Ihre Instanz während Hostwartungsereignissen.
  • Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen.
  • In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.

Nächste Schritte