Piattaforme CPU


Quando crei una macchina virtuale (VM) o un'istanza bare metal utilizzando Compute Engine, specifichi una serie di macchine e un tipo di macchina per l'istanza. Ogni serie di macchine è associata a una o più piattaforme CPU. Se per una serie di macchine sono disponibili più piattaforme CPU, puoi selezionare una piattaforma CPU minima per l'istanza di calcolo.

Una piattaforma CPU offre più processori fisici e ciascuno di questi processori viene definito un core. Per i processori disponibili su Compute Engine, un singolo core della CPU può funzionare come più thread hardware tramite il multi-threading simultaneo (SMT), noto sui processori Intel come tecnologia Intel Hyper-Threading. In Compute Engine, ogni thread hardware è chiamato CPU virtuale (vCPU). Alcune serie di macchine, come C4A, T2D e H3, non utilizzano la tecnologia SMT e ogni vCPU rappresenta un core. Quando le vCPU vengono segnalate alla VM come occupanti diversi core virtuali, Compute Engine garantisce che queste vCPU non condividano mai lo stesso core fisico.

Il tipo di macchina dell'istanza di calcolo specifica il numero di vCPU e puoi dedurre il numero di core della CPU fisica utilizzando il rapporto vCPU per core predefinito per la serie di macchine:

  • Per le serie di macchine C4A, Tau T2D, Tau T2A e H3, le VM hanno sempre una vCPU per core.
  • Per tutte le altre serie di macchine, le istanze di calcolo hanno due vCPU per core per impostazione predefinita.

Se vuoi, puoi impostare il numero di thread per core su un valore diverso da quello predefinito, il che potrebbe essere vantaggioso per alcuni carichi di lavoro. È importante sottolineare che, quando lo fai, il tipo di macchina dell'istanza di calcolo non riflette più il numero corretto di vCPU. I prezzi e il numero di core della CPU fisica rimangono invariati come per il rapporto predefinito di due vCPU per core e il numero di vCPU è la metà del valore indicato dal tipo di macchina.

Processori Arm

Per i processori Arm, Compute Engine utilizza un thread per core. Ogni vCPU viene mappata a un core fisico senza SMT.

La tabella seguente descrive i processori Arm disponibili per le istanze Compute Engine.

Processore e SKU della CPU Serie e tipi di macchine supportati
Processori Google Axion™ C4A
Ampere Altra Q64-30 Tau T2A

Processori x86

Per la maggior parte dei processori x86, ogni vCPU è implementata come un singolo thread hardware. La serie di macchine H3 è l'eccezione, con una vCPU che rappresenta un core fisico.

Processori Intel

Sui processori Intel Xeon, la tecnologia Intel Hyper-Threading supporta l'esecuzione di più thread contemporaneamente su ciascun core. Il tipo di macchina della istanza di calcolo determina il numero di vCPU e la memoria.

Processore CPU SKU del processore Serie e tipi di macchine supportati Frequenza di base (GHz) Frequenza turbo all-core (GHz) Frequenza turbo massima single-core (GHz)
Processore Intel Xeon scalabile
(Emerald Rapids)
5a generazione
Processore Intel® Xeon® Platinum 8581C
2.3 3.1 4.0
Processore Intel® Xeon® Platinum 8581C
2.1 2,9 3.3
Processore Intel Xeon scalabile
(Sapphire Rapids)
di 4ª generazione
Processore Intel® Xeon® Platinum 8490H 1.9 2,9 3,5
Processore Intel® Xeon® Platinum 8481C 2.2 3,0 3,0
Processore Intel® Xeon® Platinum 8481C 2.0 3,8 2,9
Processore Intel Xeon scalabile (Ice Lake)
3a generazione
Processore Intel® Xeon® Platinum
8373C
2,6 3.4 3,5
Processore Intel Xeon scalabile (Cascade Lake)
2ª generazione
Processore Intel® Xeon® Gold 6268CL 2,8 3.4 3,9
Processore Intel® Xeon® Gold 6253CL 3.1 3,8 3,9
Processore Intel® Xeon® Platinum 8280L 2,5 3.4 4.0
Processore Intel® Xeon® Platinum 8273CL 2.2 2,9 3.7
Processore Intel Xeon scalabile (Skylake)
1ª generazione
Processore Intel® Xeon® Scalable Platinum 8173M 2.0 2.7 3,5
Intel Xeon E7 (Broadwell E7) Processore Intel® Xeon® E7-8880V4 2.2 2,6 3.3
Intel Xeon E5 v4 (Broadwell E5) Processore Intel® Xeon® E5-2696V4 2.2 2,8 3.7
Intel Xeon E5 v3 (Haswell) Processore Intel® Xeon® E5-2696V3 2.3 2,8 3,8
Intel Xeon E5 v2 (Ivy Bridge) Processore Intel® Xeon® E5-2696V2 2,5 3.1 3,5
Intel Xeon E5 (Sandy Bridge) Processore Intel® Xeon® E5-2689 2,6 3.2 3,6

*I tipi di macchine N2 con almeno 96 vCPU richiedono la CPU Intel Ice Lake.

Processori AMD

I processori AMD offrono prestazioni e scalabilità ottimizzate utilizzando la tecnologia SMT. In quasi tutti i casi, Compute Engine utilizza due thread per core e ogni vCPU è un thread. Tau T2D è l'eccezione in cui Compute Engine utilizza un thread per core e ogni vCPU viene mappata a un core fisico. Il tipo di macchina della istanza di calcolo determina il numero di vCPU e la memoria.

Processore CPU SKU del processore Serie di macchine supportate Frequenza di base (GHz) Frequenza effettiva (GHz) Frequenza di boost massima (GHz)
AMD EPYC Genoa
4ª generazione
AMD EPYC™ 9B14 2,6 3.3 3.7
AMD EPYC Milan
3ª gen.
AMD EPYC™ 7B13 2,45 2,8 3,5
AMD EPYC Rome
2ª generazione
AMD EPYC™ 7B12 2,25 2.7 3.3

Comportamento della frequenza

Le tabelle precedenti descrivono le specifiche hardware delle CPU disponibili con Compute Engine, ma tieni presente quanto segue:

  • Frequenza: la frequenza o la velocità di clock di un PC misura il numero di cicli eseguiti dalla CPU al secondo, misurata in GHz (gigahertz). In genere, le frequenze più elevate indicano un rendimento migliore. Tuttavia, i diversi design delle CPU gestiscano le istruzioni in modo diverso, quindi una CPU meno recente con una maggiore velocità indicata in MHz può essere superata da una CPU più recente con una velocità indicata in MHz inferiore perché l'architettura più recente gestisce le istruzioni in modo più efficiente.

  • Frequenza di base: la frequenza alla quale la CPU funziona quando il sistema è inattivo o sotto carico leggero. Quando funziona alla frequenza di base, la CPU assorbe meno energia e produce meno calore.

    L'ambiente guest di un'istanza di calcolo riflette la frequenza di base, indipendentemente dalla frequenza a cui la CPU è effettivamente in esecuzione.

  • Frequenza turbo per tutti i core: la frequenza con cui in genere viene eseguita ogni CPU quando tutti i core del socket non sono inattivi contemporaneamente. Carichi di lavoro diversi richiedono requisiti diversi alla CPU di un sistema. Le tecnologie Boost risolvono questo problema e aiutano i processi ad adattarsi alle richieste del carico di lavoro aumentando la frequenza della CPU.

    • La maggior parte delle istanze di calcolo ottiene la frequenza turbo all-core, anche se solo la frequenza di base viene pubblicizzata nell'ambiente guest.
    • I processori Arm Ampere Altra possono fornire prestazioni più prevedibili perché la frequenza per i processori Arm è sempre la frequenza turbo all-core.
    • Le VM C4 possono funzionare a frequenza turbo all-core massima impostando il campo AdvancedMachineFeature su ALL_CORE_MAX. Se questo campo non è impostato, la VM viene eseguita con l'impostazione predefinita, ovvero la frequenza senza restrizioni.
  • Frequenza turbo massima: la frequenza che una CPU ha come target quando è sottoposta a stress da un'applicazione esigente come un videogioco o un'applicazione di modellazione del design. È la frequenza massima a singolo core raggiunta da una CPU senza overclocking.

  • Tecnologie di gestione dell'alimentazione del processore: i processori Intel supportano più tecnologie per ottimizzare il consumo di energia. Queste tecnologie sono suddivise in due categorie o stati:

    • Gli stati C sono stati in cui la CPU ha ridotto o disattivato alcune funzioni.
    • Gli stati P consentono di scalare la frequenza e la tensione a cui viene eseguito il processore in modo da ridurre il consumo energetico della CPU.

    Tutti i tipi di macchine C4 e alcuni tipi di macchine C2 (30, 60 vCPU), C2D (56, 112 vCPU) e M2 (208, 416 vCPU) supportano gli indizi dello stato C forniti dall'istanza tramite l'istruzione MWAIT.

    Le istanze Compute Engine non forniscono alcun servizio per il controllo da parte del cliente degli stati P.

Funzionalità della CPU

I produttori di chip aggiungono alle CPU che producono tecnologie avanzate per calcoli, grafica, virtualizzazione e gestione della memoria. Google Cloud supporta l'utilizzo di alcune di queste funzionalità avanzate con Compute Engine.

Estensioni di Matrix avanzate (AMX)

Intel AMX è una nuova estensione dell'architettura di set di istruzioni (ISA) progettata per accelerare i carichi di lavoro di intelligenza artificiale (AI) e machine learning (ML). AMX introduce nuove istruzioni che possono essere utilizzate per eseguire la moltiplicazione matriciale e le operazioni di convoluzione, due delle operazioni più comuni nell'AI e nell'ML.

AMX è supportato sui processori Intel Xeon di 5ª generazione (nome in codice Emerald Rapids), che alimentano la serie di VM per uso generico C4, nonché sui processori Intel Xeon di 4ª generazione (nome in codice Sapphire Rapids), che alimentano le VM A3 ottimizzate per l'acceleratore e le VM per uso generico C3. Tutti i tipi di macchine VM C4 e C3 supportano gli insiemi di istruzioni AMX.

AMX introduce registri 2D chiamati tiles su cui gli acceleratori possono eseguire operazioni. AMX è pensata come un'architettura estensibile. Il primo acceleratore implementato è chiamato unità di moltiplicazione della matrice a riquadri (TMUL). Ogni core della CPU del processore Sapphire Rapids ha un'unità TMUL AMX indipendente.

Ulteriori dettagli tecnici su Intel AMX sono disponibili in Intel AMX support in 5.16. Intel offre un tutorial su AMX all'indirizzo Esempio di codice: Intel® Advanced Matrix Extensions (Intel® AMX) - Funzioni intrinseche.

Requisiti per l'utilizzo di AMX

Le istruzioni Intel AMX hanno determinati requisiti minimi di software, ad esempio:

  • Per le immagini personalizzate, AMX è supportato con il kernel Linux 5.16 o versioni successive.
  • Compute Engine offre il supporto per AMX nelle seguenti immagini pubbliche:
    • CentOS Stream 8 o versioni successive
    • Container-Optimized OS 109 LTS o versioni successive
    • RHEL 8 (build più recente) o versioni successive
    • Rocky Linux 8 (build più recente) o versioni successive
    • Ubuntu 22.04 o versioni successive
    • Windows Server 2022 o versioni successive
  • Tensorflow 2.9.1 o versioni successive
  • Estensione Intel per l'ottimizzazione Intel® per PyTorch

Per la disponibilità regionale delle VM C4 e C3, consulta Regioni e zone disponibili e filtra la tabella in modo da mostrare solo i tipi di macchine C4 o C3.

Funzionalità della CPU disponibili per le istanze bare metal

Oltre a offrire tutte le risorse di calcolo non elaborate del server, le istanze bare metal che funzionano su processori scalabili Intel Xeon di 4ª generazione possono utilizzare diversi acceleratori e offload specifici per funzione integrati:

  • Intel-QAT: la tecnologia Intel QuickAssist (Intel QAT) accelera la compressione, la crittografia e la decrittografia
  • Intel-DLB: Intel Dynamic Load Balancer (Intel DLB) consente di velocizzare le code di dati
  • Intel IAA: Intel In-Memory Analytics Accelerator (Intel IAA) migliora le prestazioni di elaborazione delle query.
  • Intel DSA: Intel Data Streaming Accelerator (Intel DSA) consente di copiare e spostare i dati più velocemente.

Confidential Computing

Per proteggere i dati durante l'uso, le piattaforme CPU che supportano le tecnologie Confidential Computing possono essere utilizzate per creare istanze Confidential VM.

Per scoprire di più sui requisiti per la creazione di un'istanza Confidential VM, consulta Configurazioni supportate.

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.

Prova Compute Engine gratuitamente