Diese Seite wurde von der Cloud Translation API übersetzt.

Bereitstellungsmodelle für Compute Engine-Instanzen

Linux Windows

In diesem Dokument werden die Bereitstellungsmodelle für Compute Engine-Instanzen beschrieben. Weitere Informationen zu Bereitstellungsoptionen finden Sie unter Compute Engine-Bereitstellungsstrategie für Ihre Arbeitslast auswählen.

Bereitstellungsmodelle bestimmen die Verfügbarkeit, Lebensdauer und Preise Ihrer Instanzen. Wenn Sie diese Modelle kennen, können Sie die beste Option für Ihre Arbeitslast auswählen.

Verfügbare Bereitstellungsmodelle

Wenn Sie eine Compute-Instanz erstellen, können Sie eines der folgenden Bereitstellungsmodelle angeben. Wenn Sie kein Bereitstellungsmodell angeben, verwendet Compute Engine standardmäßig das Standardbereitstellungsmodell.

Standard
Spot
Flex-Start
Reservierungsgebunden

In der folgenden Tabelle finden Sie einen Vergleich der Anwendungsfälle und Preise für die einzelnen Bereitstellungsmodelle:

	Standard	Spot	Flex-Start	Reservierungsgebunden
Zusammenfassung	Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen. Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen.	Je nach Ressourcenverfügbarkeit können Sie sofort Instanzen erstellen. Sie können festlegen, wann Instanzen beendet oder gelöscht werden sollen. Sie erlauben Compute Engine jedoch auch, Instanzen jederzeit zu beenden oder zu löschen, um Kapazität zurückzugewinnen.	Nachdem Sie eine zonale verwaltete Instanzgruppe (MIG) erstellt haben, fordern Sie Compute Engine auf, der MIG Instanzen mit angehängten GPUs hinzuzufügen. Compute Engine plant die Bereitstellung der Instanzen basierend auf der Ressourcenverfügbarkeit. Sie können festlegen, wann Instanzen gelöscht werden sollen. Sie können sie jedoch nicht stoppen, pausieren oder neu erstellen. Die Instanzen werden bis zu sieben Tage lang ausgeführt. Anschließend werden sie von Compute Engine gelöscht.	Sie können eine Kapazitätsreservierung für ein zukünftiges Datum anfordern, um Instanzen mit angehängten GPUs zu erstellen. Wenn Google Cloud Ihre Anfrage genehmigt, erstellt Compute Engine eine Reservierung. Zu Beginn des Reservierungszeitraums können Sie die Reservierung nutzen, indem Sie GPU-Instanzen erstellen, die der Reservierung entsprechen. Während des genehmigten Reservierungszeitraums können Sie Instanzen nach Bedarf beenden, neu starten, löschen und neu erstellen, um die Reservierung zu nutzen. Wenn der Reservierungszeitraum endet, löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen.
Anwendungsfälle	Ideal für Arbeitslasten, die Stabilität und kontinuierlichen Betrieb erfordern, z. B. die folgenden Arbeitslasten: Webserver Datenbanken Unternehmensanwendungen Entwicklung und Tests	Ideal für Arbeitslasten, die Unterbrechungen tolerieren können, z. B. die folgenden: Batchverarbeitung Hochleistungs-Computing (HPC) Continuous Integration und Continuous Deployment (CI/CD) Datenanalyse Medien-Codierung Onlineinferenz	Arbeitslasten, die Stabilität erfordern und nicht länger als sieben Tage ausgeführt werden müssen, z. B. die folgenden Arbeitslasten: Vortraining kleiner Modelle Modellabstimmung HPC-Simulation Batchinferenz	Ideal für Arbeitslasten, die Stabilität und eine bestimmte Laufzeit erfordern, z. B.: Für Arbeitslasten, die bis zu 90 Tage dauern: Jobs zum Vortrainieren von Modellen Jobs zur Modellabstimmung HPC-Simulationsarbeitslasten Kurzfristig erwartete Steigerungen der Inferenz-Arbeitslast Für Arbeitslasten, die länger als 90 Tage dauern: Trainingsarbeitslasten Inferenzarbeitslasten
Preise	Für Instanzen fallen Standardpreise an. Weitere Informationen finden Sie unter Preise für VM-Instanzen. Die Kosten richten sich nach der Methode, mit der Sie Instanzen erstellen: Wenn Sie sofort Instanzen erstellen, zahlen Sie nutzungsbasiert (Pay as you go, PAYG). Wenn Sie Instanzen mit einer On-Demand-Reservierung oder einer automatisch erstellten Reservierung für eine vorausschauende Reservierung erstellen, werden Ihnen Gebühren berechnet, solange die Reservierung besteht. Weitere Informationen finden Sie unter Reservierungsabrechnung.	Sie erhalten Rabatte zwischen 60% und 91% für die meisten vCPUs, Arbeitsspeicher und GPUs. Außerdem erhalten Sie kleinere Rabatte für alle A4- oder A3-Maschinentypen und GPUs, lokale SSD-Laufwerke, externe IP-Adressen und Tier_1-Netzwerkkosten. Weitere Informationen finden Sie unter Preise für Spot-VMs. Sie PAYG.	Je nach der Maschinenserie, die Ihre Instanzen verwenden, erhalten Sie einen Rabatt: Für die A4-, A3- und A2-Maschinenserien erhalten Sie einen Rabatt von 53% auf vCPUs, Arbeitsspeicher und GPUs. Für die H4D-Maschinenserie erhalten Sie einen Rabatt von 25% auf vCPUs und Arbeitsspeicher. Andere unterstützte Maschinenserien sind nicht für Rabatte berechtigt. Weitere Informationen finden Sie unter Preise für den Dynamic Workload Scheduler (DWS). Sie PAYG.	Die Kosten hängen davon ab, wie Sie Kapazität für das Erstellen von Instanzen reservieren: Wenn Sie Kapazität in AI Hypercomputer reservieren, fallen Gebühren gemäß den Preisen für beschleunigungsoptimierte VMs an. Wenn Sie Ressourcen für ein Jahr oder länger reservieren, müssen Sie eine ressourcenbasierte Zusicherung erwerben und an Ihre reservierten Ressourcen anhängen. Wenn Sie Kapazität mit zukünftigen Reservierungen im Kalendermodus reservieren, fallen Gebühren basierend auf den Preisen für Dynamic Workload Scheduler (DWS) an. Die Abrechnung erfolgt für den Reservierungszeitraum. Weitere Informationen finden Sie unter Reservierungsabrechnung.
Kontingent	Wenn Sie eine Instanz erstellen, wird das Standardkontingent verbraucht.	Wenn Sie eine Instanz erstellen, wird Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet. Google Cloud Guthaben für die kostenlose Stufe gilt nicht für Spot-VMs.	Wenn die MIG der Gruppe Instanzen hinzufügt, wird das Kontingent für Instanzen auf Abruf verbraucht. Wenn für Ihr Projekt kein Kontingent auf Abruf vorhanden ist, wird das Standardkontingent verwendet.	Das Kontingent gilt nicht für das reservierungsgebundene Bereitstellungsmodell.

Verfügbarkeit und Lebensdauer von Instanzen

In der folgenden Tabelle sehen Sie die Verfügbarkeit und Lebensdauer von Compute-Instanzen für die einzelnen Bereitstellungsmodelle:

	Standard	Spot	Flex-Start	Reservierungsgebunden
Voraussetzungen für die Erstellung	Es gibt keine Voraussetzungen für die Erstellung.	Es gibt keine Voraussetzungen für die Erstellung.	Es gibt keine Voraussetzungen für die Erstellung.	Wenn Sie Instanzen erstellen möchten, müssen Sie zuerst Kapazität mit einer der folgenden Methoden reservieren: Wenn Sie Kapazität für zeitaufwendige Arbeitslasten reservieren möchten, verwenden Sie zukünftige Reservierungen in AI Hypercomputer. Wenn Sie Kapazität für Arbeitslasten reservieren möchten, die bis zu 90 Tage lang ausgeführt werden, verwenden Sie vorausschauende Reservierungen im Kalendermodus. Zum ausgewählten Lieferdatum und zur ausgewählten Lieferzeit stellt Compute Engine die angeforderte Kapazität bereit. Anschließend können Sie die Kapazität nutzen, indem Sie Instanzen erstellen.
Unterstützte Maschinenserien	Sie können jede Maschinenreihe außer A4X, A4 und A3 Ultra verwenden.	Sie können jede Maschinenserie verwenden, mit Ausnahme von A4X-, G4-, X4- und Bare-Metal-Instanzen.	Sie können nur die folgenden Maschinenserien verwenden: Maschinenserien A4, A3, A2 und G2 N1-VM-Instanzen mit angehängten GPUs	Je nachdem, wie Sie Kapazität zum Erstellen von VMs reservieren, können Sie nur die folgenden Maschinenserien verwenden: Wenn Sie Kapazität in AI Hypercomputer reservieren, können Sie nur die Maschinenserien A4X, A4 und A3 Ultra verwenden. Wenn Sie eine vorausschauende Reservierung im Kalendermodus erstellen, können Sie nur die Maschinenserien A4 und A3 Ultra verwenden.
Instanzverfügbarkeit	Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.	Sie können jederzeit Instanzen erstellen, sofern die angeforderten Ressourcen verfügbar sind.	So erstellen Sie Instanzen: Eigenständige Instanz erstellen Anfrage zur Größenanpassung für eine MIG erstellen Compute Engine verwendet DWS, um die Bereitstellung der angeforderten Kapazität basierend auf der Ressourcenverfügbarkeit zu planen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.	Sie können Instanzen erst erstellen, nachdem Sie Kapazität für ein zukünftiges Datum reserviert haben. Am angeforderten Datum stellt Compute Engine die angeforderte Kapazität bereit, mit der Sie dann Instanzen erstellen können. Wenn Sie Ressourcen mit zukünftigen Reservierungen im Kalendermodus reservieren, verwendet Compute Engine DWS, um die angeforderte Kapazität bereitzustellen. Mit DWS können Sie stark nachgefragte Ressourcen wie GPUs erhalten.
Kapazitätsgarantie	Basierend auf der Erstellungsmethode: Die Kapazitätsgarantie variiert je nach Methode, mit der Sie Instanzen erstellen, wie folgt: Wenn Sie sofort Instanzen erstellen, versucht Compute Engine nach besten Kräften, die angeforderte Kapazität bereitzustellen. Wenn Sie Instanzen erstellen, indem Sie eine On-Demand-Reservierung oder eine automatisch erstellte Reservierung für eine zukünftige Reservierung nutzen, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die angeforderte Kapazität bereitstellt, wenn in der Reservierung reservierte Kapazität verfügbar ist.	Best-Effort Wenn Sie Spot-VMs erstellen, versucht Compute Engine, die angeforderte Kapazität bereitzustellen.	Best-Effort Wenn Sie eine Anfrage zur Größenänderung einer MIG erstellen, versucht Compute Engine nach besten Kräften, die Bereitstellung der angeforderten Kapazität zu planen.	Sehr hoch: Wenn Google Cloud Ihre Reservierungsanfrage genehmigt, haben Sie ein sehr hohes Maß an Sicherheit, dass Compute Engine die reservierte Kapazität zum von Ihnen gewählten Lieferdatum und zur von Ihnen gewählten Lieferzeit bereitstellt. Sie haben während des Reservierungszeitraums exklusiven Zugriff auf die reservierte Kapazität.
Lebensdauer von Instanzen	Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen: Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet. In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.	Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen: Compute Engine kann die Instanz jederzeit beenden oder löschen, um Kapazität zurückzugewinnen. Dieser Vorgang wird als Unterbrechung bezeichnet. Wenn der Maschinentyp, den die Instanz verwendet, keine Live-Migration unterstützt, werden Ihre Instanzen von Compute Engine während Hostwartungsereignissen beendet. In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.	Die bereitgestellten Instanzen werden für die von Ihnen ausgewählte Laufzeit ausgeführt, die bis zu sieben Tage betragen kann. Sie können Instanzen nicht beenden, anhalten oder neu erstellen. Compute Engine löscht Instanzen, wenn einer der folgenden Fälle eintritt: Sie fordern das Löschen von Instanzen an. Die Instanzen erreichen das Ende ihrer Laufzeit.	Sie können festlegen, wann eine Instanz beendet oder gelöscht werden soll, außer in den folgenden Fällen: Compute Engine beendet Ihre Instanz während Hostwartungsereignissen. Die automatisch erstellte Reservierung zur Bereitstellung der angeforderten Kapazität erreicht das Ende des zugesicherten Reservierungszeitraums. Zu diesem Zeitpunkt löscht Compute Engine die Reservierung und beendet oder löscht alle Instanzen, die die Reservierung nutzen. In seltenen Fällen kann die Instanz aufgrund eines Hostfehlers beendet werden.

Nächste Schritte

Übersicht zum Erstellen von Compute Engine-Instanzen
Informationen zum Erstellen von Instanzen mit dem Spot-Bereitstellungsmodell finden Sie unter Spot-VMs.
Informationen zum Erstellen einer eigenständigen Instanz, die das Bereitstellungsmodell verwendet, finden Sie unter Flex-Start-VMs.
Informationen zum Erstellen mehrerer Instanzen mit dem Bereitstellungsmodell „Flex-Start“ finden Sie unter Anfragen zur Größenanpassung in einer MIG.
Wenn Sie Kapazität reservieren möchten, um Instanzen mit dem reservierungsgebundenen Modell zu erstellen, sehen Sie sich eine der folgenden Optionen an:
- Anfragen für vorausschauende Reservierungen im Kalendermodus
- Kapazität im AI Hypercomputer reservieren

Bereitstellungsmodelle für Compute Engine-Instanzen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Verfügbare Bereitstellungsmodelle

Verfügbarkeit und Lebensdauer von Instanzen

Nächste Schritte

Bereitstellungsmodelle für Compute Engine-Instanzen