CPU-Plattformen


Wenn Sie eine VM- oder Bare-Metal-Instanz mit Compute Engine erstellen, geben Sie eine Maschinenreihe und einen Maschinentyp für die Instanz an. Jede Maschinenserie ist einer oder mehreren CPU-Plattformen zugeordnet. Wenn für eine Maschinenserie mehrere CPU-Plattformen verfügbar sind, können Sie eine Mindest-CPU-Plattform für die Compute-Instanz auswählen.

Eine CPU-Plattform bietet mehrere physische Prozessoren, die jeweils als Kern bezeichnet werden. Für die in Compute Engine verfügbaren Prozessoren kann ein einzelner CPU-Kern über simultanes Multithreading (SMT), das bei Intel-Prozessoren Intel-Hyper-Threading-Technologie bezeichnet wird, als mehrere Hardware-Threads ausgeführt werden. In Compute Engine wird jeder Hardware-Thread als virtuelle CPU (vCPU) bezeichnet. Einige Maschinenserien wie C4A, T2D und H3 verwenden kein SMT. Stattdessen stellt jede vCPU einen Kern dar. Wenn vCPUs der VM als unterschiedliche virtuelle Kerne gemeldet werden, prüft Compute Engine, ob sich diese vCPUs jemals denselben physischen Kern teilen.

Der Maschinentyp Ihrer Compute-Instanz gibt die Anzahl der vCPUs an. Sie können die Anzahl der physischen CPU-Kerne mithilfe des Standardverhältnisses pro vCPU für den jeweiligen Kern ableiten:

  • Bei den Maschinenserien C4A, Tau T2D, Tau T2A, H3 und A4X haben VMs immer eine vCPU pro Kern.
  • Bei allen anderen Maschinenreihen haben die Compute-Instanzen standardmäßig zwei vCPUs pro Kern.

Optional können Sie die Anzahl der Threads pro Kern auf einen nicht standardmäßigen Wert festlegen, was von einigen Arbeitslasten profitieren könnte. Beachten Sie dabei, dass der Maschinentyp Ihrer Compute-Instanz nicht mehr die richtige Anzahl von vCPUs widerspiegelt. Stattdessen bleiben die Preise und die Anzahl der physischen CPU-Kerne erhalten, wie sie es auch bei den Verhältnissen von zwei vCPUs pro Kern tun würden, und die Anzahl der vCPUs beträgt die Hälfte des vom Maschinentyp angegebenen Werts.

Arm-Prozessoren

Bei Arm-Prozessoren verwendet Compute Engine einen Thread pro Kern. Jede vCPU ist einem physischen Kern ohne SMT zugeordnet.

In der folgenden Tabelle sind die ARM-Prozessoren beschrieben, die für Compute Engine-Instanzen verfügbar sind.

CPU-Prozessor Prozessor-SKU Unterstützte Maschinenserien und ‑typen
NVIDIA Grace-Prozessoren mit Arm Neoverse V2-Kernen Superchip A4X
Google Axion-Prozessoren C4A
Ampere Altra Q64-30 Tau T2A

x86-Prozessoren

Bei den meisten x86-Prozessoren wird jede vCPU als einzelner Hardware-Thread implementiert. Die H3-Maschinenserie ist die Ausnahme, wobei eine vCPU einen physischen Kern darstellt.

Intel-Prozessoren

Bei Intel Xeon-Prozessoren unterstützt die Intel-Hyper-Threading-Technologie die Ausführung mehrerer Threads gleichzeitig auf jedem Kern. Der Maschinentyp Ihrer Compute-Instanz bestimmt die Anzahl der vCPUs und den Arbeitsspeicher.

CPU-Prozessor Prozessor-SKU Unterstützte Maschinenserien und ‑typen Basisfrequenz (GHz) Turbofrequenz für alle Kerne (GHz) Maximale Turbofrequenz für einzelnen Kern (GHz)
Skalierbarer Intel Xeon-Prozessor
(Granite Rapids)
6. Generation
Intel® Xeon® Platinum 6985P-C-Prozessor
2.81 3,9 4.2
Skalierbarer Intel Xeon-Prozessor
(Emerald Rapids)
5. Generation
Intel Xeon Platinum 8581C-Prozessor
2.1 2,9 4,0
2.3 3.1 4,0
2.1 2,9 3.3
Skalierbarer Intel Xeon-Prozessor
(Sapphire Rapids)
4. Generation
Intel Xeon Platinum 8490H-Prozessor 1.9 2,9 3,5
Intel Xeon Platinum 8481C-Prozessor 2.2 3,0 3
2,2 3 3,8
2.0 3,8 2,9
Skalierbarer Xeon-Prozessor (Ice Lake)
3. Generation*
Intel Xeon Platinum
8373C-Prozessor
2,6 3.4 3,5
Skalierbarer Xeon-Prozessor (Cascade Lake)
2. Generation
Intel Xeon Gold 6268CL-Prozessor 2,8 3.4 3,9
Intel Xeon Gold 6253CL-Prozessor 3.1 3,8 3,9
Intel Xeon Platinum 8280L-Prozessor 2,5 3.4 4,0
Intel Xeon Platinum 8273CL-Prozessor 2.2 2,9 3,7
Skalierbarer Xeon-Prozessor (Skylake)
1. Generation
Skalierbarer Intel Xeon Platinum 8173M-Prozessor 2,0 2.7 3,5
Intel Xeon E7 (Broadwell E7) Intel Xeon E7-8880V4-Prozessor 2.2 2,6 3.3
Intel Xeon E5 v4 (Broadwell E5) Intel Xeon E5-2696V4-Prozessor 2.2 2,8 3,7
Intel Xeon E5 v3 (Haswell) Intel Xeon E5-2696V3-Prozessor 2.3 2,8 3,8
Intel Xeon E5 v2 (Ivy Bridge) Intel Xeon E5-2696V2-Prozessor 2,5 3.1 3,5
Intel Xeon E5 (Sandy Bridge) Intel Xeon E5-2689-Prozessor 2,6 3.2 3,6

1C4-Maschinentypen, die die Intel Granite Rapids-CPU verwenden, haben eine Basisfrequenz von 2,8. Aus Kompatibilitätsgründen wird für vPMU jedoch 2,3 angezeigt.

2 Für N2-Maschinentypen mit 96 oder mehr vCPUs ist die Intel Ice Lake-CPU erforderlich.

AMD-Prozessoren

AMD-Prozessoren bieten eine optimierte Leistung und Skalierbarkeit mit SMT. In fast allen Fällen verwendet Compute Engine zwei Threads pro Kern, wobei jede vCPU ein Thread ist. Tau T2D ist die Ausnahme, bei der Compute Engine einen Thread pro Kern verwendet und jede vCPU einem physischen Kern zugeordnet ist. Der Maschinentyp Ihrer Compute-Instanz bestimmt die Anzahl der vCPUs und den Arbeitsspeicher.

CPU-Prozessor Prozessor-SKU Unterstützte Maschinenserien Basisfrequenz (GHz) Effektive Frequenz (GHz) Maximale Verstärkungsfrequenz (GHz)
AMD EPYC Turin
5. Generation
AMD EPYC™ 9B45 2.7 3,5 4.1
AMD EPYC Genoa
4. Generation
AMD EPYC™ 9B14 2,6 3.3 3,7
AMD EPYC Milan
3. Generation
AMD EPYC™ 7B13 2,45 2,8 3,5
AMD EPYC Rome
2. Generation
AMD EPYC™ 7B12 2,25 2.7 3.3

Frequenzverhalten

In den vorherigen Tabellen werden die Hardwarespezifikationen der CPUs beschrieben, die in Compute Engine verfügbar sind. Beachten Sie jedoch die folgenden Punkte:

  • Frequenz: Die Frequenz oder Taktrate eines PC misst die Anzahl der Zyklen, die die CPU pro Sekunde ausführt, gemessen in GHz (Gigahertz). Im Allgemeinen weisen höhere Frequenzen auf eine bessere Leistung hin. Unterschiedliche CPU-Designs verarbeiten Anweisungen jedoch unterschiedlich. Daher kann eine ältere CPU mit einer höheren Taktgeschwindigkeit von einer neueren CPU mit einer niedrigeren Taktgeschwindigkeit übertroffen werden, da die neuere Architektur die Befehle effizienter verarbeitet.

  • Basisfrequenz: Die Frequenz, mit der die CPU ausgeführt wird, wenn das System inaktiv oder bei geringer Last ist. Bei Ausführung mit ihrer Basisfrequenz verbraucht die CPU weniger Strom und erzeugt weniger Wärme.

    Die Gastumgebung einer Compute-Instanz spiegelt die Basistaktfrequenz wider, unabhängig davon, mit welcher Frequenz die CPU tatsächlich ausgeführt wird.

  • Turbofrequenz für alle Kerne: Die Frequenz, mit der jede CPU in der Regel ausgeführt wird, wenn alle Kerne im Socket gleichzeitig aktiv sind. Unterschiedliche Arbeitslasten stellen auf der CPU eines Systems unterschiedliche Anforderungen. Boost-Technologien beheben diesen Unterschied und helfen, Prozesse an die Arbeitslastanforderungen anzupassen, indem Sie die CPU-Häufigkeit erhöhen.

    • Die meisten Compute-Instanzen erhalten Turbofrequenz für alle Kerne, auch wenn nur die Basisfrequenz für die Gastumgebung angegeben wird.
    • Ampere Altra Arm-Prozessoren können eine vorhersagbarere Leistung liefern, da die Frequenz für ARM-Prozessoren immer die Turbofrequenz für alle Kerne ist.
    • C4-Instanzen können mit der maximalen Turbofrequenz aller Kerne ausgeführt werden, indem das Feld AdvancedMachineFeature auf ALL_CORE_MAX gesetzt wird. Wenn dieses Feld nicht festgelegt ist, wird die VM mit der Standardeinstellung ausgeführt, d. h. mit uneingeschränkter Frequenz.

      Die Einstellung ALL_CORE_MAX ist für C4D- oder C4A-Maschineninstanzen nicht verfügbar.

  • Maximale Turbofrequenz: Die Häufigkeit, mit der eine CPU bedient wird, wenn sie von einer anspruchsvollen Anwendung wie einer Videospiel- oder Designmodellanwendung überlastet wird. Sie gibt die maximale Frequenz eines einzelnen Kerns an, die eine CPU ohne Übertakten erreicht.

  • Prozessormanagement-Technologien: Intel-Prozessoren unterstützen mehrere Technologien, um den Stromverbrauch zu optimieren. Diese Technologien sind in zwei Kategorien oder Status unterteilt:

    • C-Status sind Status, bei denen die CPU ausgewählte Funktionen reduziert oder deaktiviert hat.
    • P-Status bieten eine Möglichkeit, die Frequenz und Spannung in der Ausführung des Prozessors zu skalieren, um den Stromverbrauch der CPU zu reduzieren.

    Alle C4-Maschinentypen und bestimmte C2- (30, 60 vCPUs), C2D- (56, 112 vCPUs) und M2-Maschinentypen (208, 416 vCPUs) unterstützen C-State-Hinweise, die von der Instanz über den MWAIT-Befehl bereitgestellt werden.

    Compute Engine-Instanzen bieten keine Möglichkeit für Kunden, P-Zustände zu steuern.

CPU-Features

Chiphersteller fügen den CPUs, die sie herstellen, erweiterte Technologien für Berechnungen, Grafik, Virtualisierung und Arbeitsspeicherverwaltung hinzu. Google Cloudunterstützt die Verwendung einiger dieser erweiterten Funktionen in Compute Engine.

Erweiterte Vektorerweiterungen

Advanced Vector Extensions (AVX) sind SIMD-Erweiterungen (Single Instruction, Multiple Data) für die x86-Befehlssatzarchitektur für Mikroprozessoren von Intel und Advanced Micro Devices (AMD). AVX bietet neue Anweisungen und ein neues Codierungsschema.

Weitere Informationen finden Sie unter Advanced Vector Extensions.

AVX ist mit allen von Compute Engine verwendeten x86-Prozessoren verfügbar.

Advanced Vector Extensions (AVX2)

AVX2 (auch als Haswell New Instructions bezeichnet) bietet die folgenden Ergänzungen zu AVX:

  • Erweitert die meisten SSE- und AVX-Vektor-Ganzzahlanweisungen auf 256 Bit
  • Unterstützung für „Gather“ hinzugefügt, sodass Vektorelemente aus nicht zusammenhängenden Speicherorten geladen werden können
  • Any-to-any-Permutationen mit DWORD- und QWORD-Granularität
  • Vektorverschiebungen

AVX2 ist für die folgenden CPU-Plattformen verfügbar:

  • Intel Xeon E5 v3 (Haswell) und neuere Prozessoren
  • Alle AMD-Prozessoren

Advanced Vector Extensions (AVX512)

AVX-512 erweitert AVX auf 512 Bit mit der EVEX-Präfixcodierung. AVX-512 bietet eine integrierte Beschleunigung für anspruchsvolle Arbeitslasten, die eine intensive vektorbasierte Verarbeitung erfordern. Das große Register für den AVX-512-Beschleuniger unterstützt 32 Gleitkommazahlen mit doppelter Genauigkeit und 64 Gleitkommazahlen mit einfacher Genauigkeit sowie acht 64-Bit- und 16 32-Bit-Ganzzahlen.

Weitere Informationen zu AVX-512 finden Sie unter Was ist Intel AVX-512?.

AVX-512 ist für die folgenden CPU-Plattformen verfügbar:

  • Skalierbarer Intel Xeon-Prozessor (Skylake) der 1. Generation und neuere Prozessoren
  • AMD EPYC Genoa-Prozessoren der 4. Generation und neuer

Advanced Matrix Extensions

Intel Advanced Matrix Extensions (AMX) ist eine neue ISA-Erweiterung (Instructions Set Architecture, Befehlssatzarchitektur), die Arbeitslasten aus den Bereichen künstliche Intelligenz (KI) und maschinelles Lernen (ML) beschleunigen soll. AMX führt neue Anweisungen ein, mit denen Matrixmultiplikations- und Faltungsvorgänge ausgeführt werden können. Dies sind zwei der gängigsten Vorgänge bei KI und ML.

AMX führt zweidimensionale Register ein, die als Tiles bezeichnet werden und auf denen Beschleuniger Vorgänge ausführen können. AMX ist als erweiterbare Architektur gedacht. Der erste implementierte Beschleuniger wird als TMUL (Tile Matrix Multiply Unit) bezeichnet. Jeder CPU-Kern des Sapphire Rapids-Prozessors hat eine unabhängige AMX-TMUL.

Technische Details zu Intel AMX finden Sie unter Intel AMX-Unterstützung in 5.16. Intel bietet eine Anleitung zu AMX unter Code Sample: Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions.

AMX ist mit Intel Xeon-Prozessoren der 4. Generation (Sapphire Rapids) und höher verfügbar. AMX ist nicht für AMD- oder Arm-Prozessoren verfügbar.

Anforderungen für die Verwendung von AMX

Für Intel AMX-Anweisungen gelten bestimmte Mindestanforderungen an die Software wie die folgenden:

  • Für benutzerdefinierte Images wird AMX mit Linux-Kernel-Version 5.16 oder höher unterstützt.
  • Compute Engine bietet Unterstützung für AMX in den folgenden öffentlichen Images:
    • CentOS Stream 8 oder höher
    • Container-Optimized OS 109 LTS (oder höher)
    • RHEL 8 (neuester Build) oder höher
    • Rocky Linux 8 (neuester Build) oder höher
    • Ubuntu 22.04 oder höher
    • Windows Server 2022 oder höher
  • Tensorflow 2.9.1 oder höher
  • Intel-Erweiterung für die Intel-Optimierung für PyTorch

CPU-Funktionen, die für Bare-Metal-Instanzen verfügbar sind

Bare-Metal-Instanzen bieten nicht nur alle Roh-Computing-Ressourcen des Servers, sondern können auch mehrere integrierte, funktionsspezifische Beschleuniger und Offloads nutzen, wenn sie auf skalierbaren Intel Xeon-Prozessoren der 4. Generation und höher ausgeführt werden:

  • Intel-QAT: Intel QuickAssist Technology (Intel QAT) beschleunigt die Komprimierung, Verschlüsselung und Entschlüsselung.
  • Intel-DLB: Der Intel Dynamic Load Balancer (Intel DLB) trägt dazu bei, Datenwarteschlangen zu beschleunigen.
  • Intel IAA: Der Intel In-Memory Analytics Accelerator (Intel IAA) verbessert die Leistung bei der Verarbeitung von Anfragen.
  • Intel DSA: Der Intel Data Streaming Accelerator (Intel DSA) hilft, Daten schneller zu kopieren und zu verschieben.

Confidential Computing

Zum Schutz Ihrer Daten während der Verwendung können CPU-Plattformen, die Confidential Computing-Technologien unterstützen, zum Erstellen von Confidential VM-Instanzen verwendet werden.

Weitere Informationen zu den Anforderungen zum Erstellen einer Confidential VM-Instanz finden Sie unter Unterstützte Konfigurationen.

Nächste Schritte

Überzeugen Sie sich selbst

Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Compute Engine in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Compute Engine kostenlos testen