Quando crei una macchina virtuale (VM) o un'istanza bare metal utilizzando Compute Engine, specifichi una serie e un tipo di macchina per l'istanza. Ogni serie di macchine è associata a una o più piattaforme CPU. Se sono disponibili più piattaforme CPU per una serie di macchine, puoi selezionare una piattaforma CPU minima per l'istanza di Compute.
Una piattaforma CPU offre più processori fisici e ognuno di questi processori è chiamato core. Per i processori disponibili su Compute Engine, un singolo core della CPU può essere eseguito come più thread hardware tramite multi-threading simultaneo (SMT), noto sui processori Intel come tecnologia Intel Hyper-Threading. In Compute Engine, ogni thread hardware è chiamato CPU virtuale (vCPU). Alcune serie di macchine, come C4A, T2D e H3, non utilizzano SMT e ogni vCPU rappresenta un core. Quando le vCPU vengono segnalate alla VM come occupanti core virtuali diversi, Compute Engine verifica che queste vCPU non condividano mai lo stesso core fisico.
Il tipo di macchina dell'istanza di Compute specifica il numero di vCPU e puoi dedurre il numero di core CPU fisici utilizzando il rapporto vCPU per core predefinito per quella serie di macchine:
- Per le serie di macchine C4A, Tau T2D, Tau T2A, H3 e A4X, le VM hanno sempre una vCPU per core.
- Per tutte le altre serie di macchine, le istanze di computing hanno due vCPU per core per impostazione predefinita.
Se vuoi, puoi impostare il numero di thread per core su un valore non predefinito, il che potrebbe essere utile per alcuni carichi di lavoro. È importante sottolineare che, quando esegui questa operazione, il tipo di macchina dell'istanza di calcolo non riflette più il numero corretto di vCPU. Il prezzo e il numero di core CPU fisici rimangono invariati rispetto al rapporto predefinito di due vCPU per core e il numero di vCPU è la metà del valore indicato dal tipo di macchina.
Processori Arm
Per i processori Arm, Compute Engine utilizza un thread per core. Ogni vCPU corrisponde a un core fisico senza SMT.
La tabella seguente descrive i processori Arm disponibili per le istanze Compute Engine.
Processore CPU | SKU processore | Tipi e serie di macchine supportati |
---|---|---|
Processori NVIDIA Grace con core Arm Neoverse V2 | Superchip | A4X |
Processori Google Axion | C4A | |
Ampere Altra | Q64-30 | Tau T2A |
Processori x86
Per la maggior parte dei processori x86, ogni vCPU viene implementata come un singolo thread hardware. La serie di macchine H3 fa eccezione, con una vCPU che rappresenta un core fisico.
Processori Intel
Sui processori Intel Xeon, la tecnologia Intel Hyper-Threading supporta l'esecuzione simultanea di più thread su ogni core. Il tipo di macchina della tua istanza di calcolo determina il numero di vCPU e la memoria.
Processore CPU | SKU processore | Tipi e serie di macchine supportati | Frequenza di base (GHz) | Frequenza turbo all-core (GHz) | Frequenza turbo massima single-core (GHz) |
---|---|---|---|---|---|
Processore Intel Xeon scalabile (Granite Rapids) 6ª generazione |
|||||
Processore Intel® Xeon® Platinum 6985P-C |
2.81 | 3,9 | 4.2 | ||
Processore Intel Xeon scalabile (Emerald Rapids) 5ª generazione |
|||||
Processore Intel Xeon Platinum 8581C |
2.1 | 2,9 | 4.0 | ||
2.3 | 3.1 | 4.0 | |||
2.1 | 2,9 | 3.3 | |||
Processore Intel Xeon scalabile (Sapphire Rapids) di 4ª generazione |
Processore Intel Xeon Platinum 8490H | 1.9 | 2,9 | 3,5 | |
Processore Intel Xeon Platinum 8481C | 2.2 | 3,0 | 3,0 | ||
2.2 | 3,0 | 3,8 | |||
2.0 | 3,8 | 2,9 | |||
Processore Intel Xeon scalabile (Ice Lake) 3ª generazione |
Processore Intel Xeon Platinum 8373C |
2,6 | 3.4 | 3,5 | |
Processore scalabile Intel Xeon (Cascade Lake) 2ª generazione |
|||||
Processore Intel Xeon Gold 6268CL | 2,8 | 3.4 | 3,9 | ||
Processore Intel Xeon Gold 6253CL | 3.1 | 3,8 | 3,9 | ||
Processore Intel Xeon Platinum 8280L | 2,5 | 3.4 | 4.0 | ||
Processore Intel Xeon Platinum 8273CL | 2.2 | 2,9 | 3.7 | ||
Processore Intel Xeon scalabile (Skylake) 1ª generazione |
Processore Intel Xeon Scalable Platinum 8173M | 2.0 | 2.7 | 3,5 | |
Intel Xeon E7 (Broadwell E7) | Processore Intel Xeon E7-8880V4 | 2.2 | 2,6 | 3.3 | |
Intel Xeon E5 v4 (Broadwell E5) | Processore Intel Xeon E5-2696V4 | 2.2 | 2,8 | 3.7 | |
Intel Xeon E5 v3 (Haswell) | Processore Intel Xeon E5-2696V3 | 2.3 | 2,8 | 3,8 | |
Intel Xeon E5 v2 (Ivy Bridge) | Processore Intel Xeon E5-2696V2 | 2,5 | 3.1 | 3,5 | |
Intel Xeon E5 (Sandy Bridge) | Processore Intel Xeon E5-2689 | 2,6 | 3.2 | 3,6 |
1I tipi di macchine C4 che utilizzano la CPU Intel Granite Rapids hanno una frequenza di base di 2,8, ma vPMU presenterà 2,3 per motivi di compatibilità.
2I tipi di macchine N2 con 96 o più vCPU richiedono la CPU Intel Ice Lake.
Processori AMD
I processori AMD offrono prestazioni e scalabilità ottimizzate utilizzando SMT. In quasi tutti i casi, Compute Engine utilizza due thread per core e ogni vCPU è un thread. Tau T2D è l'eccezione in cui Compute Engine utilizza un thread per core e ogni vCPU viene mappata a un core fisico. Il tipo di macchina della tua istanza di calcolo determina il numero di vCPU e la memoria.
Processore CPU | SKU processore | Serie di macchine supportate | Frequenza di base (GHz) | Frequenza effettiva (GHz) | Frequenza massima di boost (GHz) |
---|---|---|---|---|---|
AMD EPYC Turin 5ª generazione |
AMD EPYC™ 9B45 | 2.7 | 3,5 | 4.1 | |
AMD EPYC Genoa 4ª generazione |
AMD EPYC™ 9B14 | 2,6 | 3.3 | 3.7 | |
AMD EPYC Milan 3ª generazione |
AMD EPYC™ 7B13 | 2,45 | 2,8 | 3,5 | |
AMD EPYC Rome 2ª generazione |
AMD EPYC™ 7B12 | 2,25 | 2.7 | 3.3 |
Comportamento della frequenza
Le tabelle precedenti descrivono le specifiche hardware delle CPU disponibili con Compute Engine, ma tieni presente quanto segue:
Frequenza: la frequenza, o velocità di clock, di un PC misura il numero di cicli eseguiti dalla CPU al secondo, misurati in GHz (gigahertz). In generale, frequenze più elevate indicano prestazioni migliori. Tuttavia, CPU con design diversi gestiscono le istruzioni in modo diverso, quindi una CPU più vecchia con una velocità di clock più elevata può essere superata da una CPU più recente con una velocità di clock inferiore perché l'architettura più recente gestisce le istruzioni in modo più efficiente.
Frequenza di base: la frequenza con cui la CPU funziona quando il sistema è inattivo o sotto carico leggero. Quando funziona alla sua frequenza di base, la CPU consuma meno energia e produce meno calore.
L'ambiente guest di un'istanza di calcolo riflette la frequenza di base, indipendentemente dalla frequenza effettiva di esecuzione della CPU.
Frequenza turbo all-core: la frequenza a cui ogni CPU in genere funziona quando tutti i core del socket non sono inattivi contemporaneamente. Carichi di lavoro diversi pongono esigenze diverse alla CPU di un sistema. Le tecnologie di boost risolvono questa differenza e aiutano i processi ad adattarsi alle esigenze del carico di lavoro aumentando la frequenza della CPU.
- La maggior parte delle istanze di calcolo ottiene la frequenza turbo all-core, anche se nell'ambiente guest viene pubblicizzata solo la frequenza di base.
- I processori Ampere Altra Arm possono fornire prestazioni più prevedibili perché la frequenza dei processori Arm è sempre la frequenza turbo all-core.
Le istanze C4 sono in grado di essere eseguite alla frequenza turbo all-core-max impostando il campo AdvancedMachineFeature su
ALL_CORE_MAX
. Se questo campo non è impostato, la VM viene eseguita con l'impostazione predefinita, ovvero una frequenza senza limitazioni.L'impostazione
ALL_CORE_MAX
non è disponibile con le istanze di macchine C4D o C4A.
Frequenza turbo massima: la frequenza a cui punta una CPU quando è sotto stress a causa di un'applicazione impegnativa come un videogioco o un'applicazione di modellazione di design. È la frequenza massima di un singolo core che una CPU raggiunge senza overclocking.
Tecnologie di gestione dell'alimentazione del processore: i processori Intel supportano più tecnologie per ottimizzare il consumo energetico. Queste tecnologie sono suddivise in due categorie o stati:
- Gli stati C sono stati in cui la CPU ha ridotto o disattivato determinate funzioni.
- Gli stati P forniscono un modo per scalare la frequenza e la tensione a cui viene eseguito il processore in modo da ridurre il consumo energetico della CPU.
Tutti i tipi di macchine C4 e alcuni tipi di macchine C2 (30, 60 vCPU), C2D (56, 112 vCPU) e M2 (208, 416 vCPU) supportano i suggerimenti sugli stati C forniti dall'istanza tramite l'istruzione
MWAIT
.Le istanze Compute Engine non forniscono alcuna funzionalità per il controllo dei P-state da parte del cliente.
Funzionalità della CPU
I produttori di chip aggiungono tecnologie avanzate per calcoli, grafica, virtualizzazione e gestione della memoria alle CPU che producono. Google Cloud supporta l'utilizzo di alcune di queste funzionalità avanzate con Compute Engine.
Advanced Vector Extensions
Le Advanced Vector Extensions (AVX) sono estensioni SIMD (Single Instruction, Multiple Data) dell'architettura del set di istruzioni x86 per i microprocessori di Intel e Advanced Micro Devices (AMD). AVX fornisce nuove istruzioni e un nuovo schema di codifica.
Per saperne di più, consulta Advanced Vector Extensions.
AVX è disponibile con tutti i processori x86 utilizzati da Compute Engine.
Advanced Vector Extensions (AVX2)
AVX2 (noto anche come Haswell New Instructions) introduce le seguenti aggiunte ad AVX:
- Espande la maggior parte delle istruzioni SSE e AVX per numeri interi vettoriali a 256 bit
- Aggiunge il supporto per Gather, consentendo il caricamento di elementi vettoriali da posizioni di memoria non contigue
- Permutazioni any-to-any con granularità DWORD e QWORD
- Spostamenti dei vettori
AVX2 è disponibile con le seguenti piattaforme CPU:
- Processori Intel Xeon E5 v3 (Haswell) e successivi
- Tutti i processori AMD
Advanced Vector Extensions (AVX512)
AVX-512 espande AVX al supporto a 512 bit utilizzando la codifica del prefisso EVEX. AVX-512 offre un'accelerazione integrata per i carichi di lavoro impegnativi che comportano un'elaborazione pesante basata su vettori. Il registro di grandi dimensioni per l'acceleratore AVX-512 supporta 32 numeri in virgola mobile a doppia precisione e 64 a singola precisione, oltre a otto numeri interi a 64 bit e 16 a 32 bit.
Per ulteriori informazioni su AVX-512, vedi Che cos'è Intel AVX-512?.
AVX-512 è disponibile con le seguenti piattaforme CPU:
- Processore scalabile Intel Xeon (Skylake) di 1ª generazione e processori più recenti
- Processori AMD EPYC Genoa di 4ª gen. e successivi
Estensioni avanzate della matrice
Intel Advanced Matrix Extensions (AMX) è una nuova estensione dell'architettura del set di istruzioni (ISA) progettata per accelerare i carichi di lavoro di intelligenza artificiale (AI) e machine learning (ML). AMX introduce nuove istruzioni che possono essere utilizzate per eseguire operazioni di moltiplicazione matriciale e convoluzione, che sono due delle operazioni più comuni nell'AI e nel ML.
AMX introduce registri bidimensionali chiamati tile su cui gli acceleratori possono eseguire operazioni. AMX è pensata come un'architettura estensibile. Il primo acceleratore implementato è chiamato unità di moltiplicazione della matrice di riquadri (TMUL). Ogni core della CPU del processore Sapphire Rapids ha un'unità AMX TMUL indipendente.
Per i dettagli tecnici su Intel AMX, vedi Supporto di Intel AMX in 5.16. Intel offre un tutorial su AMX all'indirizzo Code Sample: Intel Advanced Matrix Extensions (Intel AMX) - Intrinsics Functions.
AMX è disponibile con i processori Intel Xeon di 4ª generazione (Sapphire Rapids) e versioni successive. AMX non è disponibile con i processori AMD o Arm.
Requisiti per l'utilizzo di AMX
Le istruzioni Intel AMX hanno determinati requisiti software minimi, ad esempio:
- Per le immagini personalizzate, AMX è supportato con la versione 5.16 o successiva del kernel Linux.
- Compute Engine offre il supporto per AMX nelle seguenti
immagini pubbliche:
- CentOS Stream 8 o versioni successive
- Container-Optimized OS 109 LTS o versioni successive
- RHEL 8 (ultima build) o versioni successive
- Rocky Linux 8 (ultima build) o versioni successive
- Ubuntu 22.04 o versioni successive
- Windows Server 2022 o versioni successive
- Tensorflow 2.9.1 o versioni successive
- Estensione Intel per Intel Optimization for PyTorch
Funzionalità della CPU disponibili per le istanze bare metal
Oltre a offrire tutte le risorse di calcolo non elaborate del server, le istanze bare metal che vengono eseguite su processori scalabili Intel Xeon di 4ª generazione e successivi possono utilizzare diversi acceleratori e offload specifici per le funzioni integrati:
- Intel-QAT: Intel QuickAssist Technology (Intel QAT) accelera la compressione, la crittografia e la decrittografia
- Intel-DLB: Intel Dynamic Load Balancer (Intel DLB) contribuisce ad accelerare le code di dati
- Intel IAA: Intel In-Memory Analytics Accelerator (Intel IAA) migliora le prestazioni di elaborazione delle query.
- Intel DSA: Intel Data Streaming Accelerator (Intel DSA) consente di copiare e spostare i dati più velocemente.
Confidential Computing
Per proteggere i tuoi dati mentre sono in uso, è possibile utilizzare piattaforme CPU che supportano le tecnologie di Confidential Computing per creare istanze di Confidential VM.
Per scoprire di più sui requisiti per la creazione di un'istanza Confidential VM, consulta Configurazioni supportate.
Passaggi successivi
- Scopri di più sulle famiglie di macchine.
- Scopri di più sulle istanze di macchine virtuali.
- Scopri di più sulle immagini.
- Scopri come specificare una piattaforma CPU minima.
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Compute Engine in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti senza addebiti per l'esecuzione, il test e il deployment dei workload.
Fai una prova senza costi di Compute Engine