CPU 平台


使用 Compute Engine 建立虛擬機器 (VM) 或無作業系統執行個體時,您必須為執行個體指定機器系列和機器類型。每個機器系列都與一或多個 CPU 平台相關聯。如果機器系列可使用多個 CPU 平台,您可以為運算執行個體選取最低 CPU 平台。

CPU 平台提供多個實體處理器,每個處理器都稱為核心。在 Compute Engine 上可用的處理器中,單一 CPU 核心可透過多執行緒並行 (SMT) 技術執行多個硬體執行緒,這在 Intel 處理器上稱為 Intel 超執行緒技術。在 Compute Engine 中,每個硬體執行緒都稱為虛擬 CPU (vCPU)。某些機器系列 (例如 C4A、T2D 和 H3) 不使用 SMT,每個 vCPU 則代表一個核心。當 vCPU 向 VM 回報佔用不同的虛擬核心時,Compute Engine 會確保這些 vCPU 絕不會共用相同的實體核心。

計算執行個體的機器類型會指定其 vCPU 數量,您可以使用該機器系列的每個核心的預設 vCPU 比率,推斷其物理 CPU 核心數量:

  • 針對 C4A、Tau T2D、Tau T2A 和 H3 機器系列,VM 一律會在每個核心上提供一個 vCPU。
  • 對於所有其他機器系列,計算執行個體預設為每個核心有兩個 vCPU。

您可以選擇將每個核心的執行緒數量 設為非預設值,這可能對某些工作負載有所助益。重要的是,執行此操作後,運算執行個體的機器類型將不再反映正確的 vCPU 數量。相反地,定價和實體 CPU 核心數量,會維持與每個核心的預設 2 個 vCPU 比率相同,而 vCPU 數量則為機器類型所指示值的一半。

Arm 處理器

針對 Arm 處理器,Compute Engine 會為每個核心使用一個執行緒。每個 vCPU 都會對應至沒有 SMT 的實體核心。

下表說明可用於 Compute Engine 執行個體的 Arm 處理器。

CPU 處理器和 SKU 支援的機器系列和類型
Google Axion™ 處理器 C4A
Ampere Altra Q64-30 Tau T2A

x86 處理器

對於大多數 x86 處理器,每個 vCPU 都會以單一硬體執行緒的形式實作。但 H3 機器系列除外,其中一個 vCPU 代表一個實體核心。

Intel 處理器

在 Intel Xeon 處理器上,Intel 超執行緒技術支援在每個核心上同時執行多個執行緒。計算執行個體的機器類型會決定其 vCPU 和記憶體的數量。

CPU 處理器 處理器 SKU 支援的機器系列和類型 基本頻率 (GHz) 所有核心 Turbo 頻率 (GHz) 單一核心最高 Turbo 頻率 (GHz)
Intel Xeon 可擴充處理器
(Emerald Rapids)
第五代
Intel® Xeon® Platinum 8581C 處理器
2.1 2.9 4.0
Intel® Xeon® Platinum 8581C 處理器
2.3 3.1 4.0
Intel® Xeon® Platinum 8581C 處理器
2.1 2.9 3.3
Intel Xeon 可擴充處理器
(Sapphire Rapids)
第 4 代
Intel® Xeon® Platinum 8490H 處理器 1.9 2.9 3.5
Intel® Xeon® Platinum 8481C 處理器 2.2 3.0 3.0
Intel® Xeon® Platinum 8481C 處理器 2.0 3.8 2.9
Intel Xeon 可擴充處理器 (Ice Lake)
第 3 代
Intel® Xeon® Platinum
8373C 處理器
2.6 3.4 3.5
Intel Xeon 可擴充處理器 (Cascade Lake)
第 2 代
Intel® Xeon® Gold 6268CL 處理器 2.8 3.4 3.9
Intel® Xeon® Gold 6253CL 處理器 3.1 3.8 3.9
Intel® Xeon® Platinum 8280L 處理器 2.5 3.4 4.0
Intel® Xeon® Platinum 8273CL 處理器 2.2 2.9 3.7
Intel Xeon 可擴充處理器 (Skylake)
第 1 代
Intel® Xeon® 可擴充 Platinum 8173M 處理器 2.0 2.7 3.5
Intel Xeon E7 (Broadwell E7) Intel® Xeon® E7-8880V4 處理器 2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) Intel® Xeon® E5-2696V4 處理器 2.2 2.8 3.7
Intel Xeon E5 v3 (Haswell) Intel® Xeon® E5-2696V3 處理器 2.3 2.8 3.8
Intel Xeon E5 v2 (Ivy Bridge) Intel® Xeon® E5-2696V2 處理器 2.5 3.1 3.5
Intel Xeon E5 (Sandy Bridge) Intel® Xeon® E5-2689 處理器 2.6 3.2 3.6

*具有 96 個以上 vCPU 的 N2 機器類型需要 Intel Ice Lake CPU。

AMD 處理器

AMD 處理器採用 SMT 技術,可提供最佳效能和擴充性。在幾乎所有情況下,Compute Engine 會為每個核心使用兩個執行緒,而每個 vCPU 則為一個執行緒。但 Tau T2D 是例外狀況,因為 Compute Engine 會為每個核心使用一個執行緒,且每個 vCPU 會對應至實體核心。計算執行個體的機器類型會決定其 vCPU 和記憶體的數量。

CPU 處理器 處理器 SKU 支援的機器系列 基本頻率 (GHz) 有效頻率 (GHz) 最高提升頻率 (GHz)
AMD EPYC Genoa
第 4 代
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milan
第 3 代
AMD EPYC™ 7B13 2.45 2.8 3.5
AMD EPYC Rome
第 2 代
AMD EPYC™ 7B12 2.25 2.7 3.3

頻率行為

前述表格說明瞭 Compute Engine 提供的 CPU 硬體規格,但請注意下列事項:

  • 頻率:電腦的頻率或時脈速度,是用來測量 CPU 每秒執行的週期數量,以 GHz (千兆赫茲) 為單位。一般來說,頻率越高,成效越好。不過,不同 CPU 設計的處理方式不同,因此較舊的 CPU 雖然有較高的時脈速度,但新款 CPU 的時脈速度較低,卻能提供更佳的效能,因為新款架構處理指令的效率較高。

  • 基本頻率:系統閒置或負載量低時,CPU 執行的頻率。以基本頻率運作時,CPU 會消耗較少電力並產生較少熱能。

    無論 CPU 實際執行的頻率為何,運算執行個體的訪客環境都會顯示基本頻率。

  • 所有核心 Turbo 頻率:在通訊端中所有核心同時皆非處於閒置狀態的情況下,各 CPU 執行作業的正常頻率。不同的工作負載會對系統的 CPU 提出不同的需求。Boost 技術可解決這項差異,並透過提高 CPU 的頻率,協助程序適應工作負載需求。

    • 即使訪客環境只顯示基本頻率的公告資訊,大部分的運算執行個體也會獲得所有核心 Turbo 頻率。
    • Ampere Altra Arm 處理器的頻率一律是全核心渦輪加速頻率,因此可提供更穩定的效能。
    • C4 VM 可將所有核心的最高渦輪頻率設為 ALL_CORE_MAX,以便以全核心最高渦輪頻率執行。AdvancedMachineFeature 欄位如果未設定這個欄位,VM 會以預設設定 (即不受限制的頻率) 執行。
  • 最大渦輪頻率:CPU 在受到影片遊戲或設計模擬應用程式等高負載應用程式的壓力時,所指定的頻率。這是 CPU 在未超頻的情況下,可達到的單一核心最高頻率。

  • 處理器電源管理技術:Intel 處理器支援多種技術,可最佳化電力消耗。這些技術分為兩類,或稱為兩種狀態:

    • C 狀態是指 CPU 減少或關閉所選功能時的狀態。
    • P 狀態可用於調整處理器執行的頻率和電壓,進而降低 CPU 的耗電量。

    所有 C4 機器類型,以及特定的 C2 (30、60 個 vCPU)、C2D (56、112 個 vCPU) 和 M2 (208、416 個 vCPU) 機器類型,皆可透過 MWAIT 指令支援執行個體提供的 C-State 提示。

    Compute Engine 執行個體不會提供任何可讓客戶控制 P 狀態的設施。

CPU 功能

晶片製造商會在他們生產的 CPU 中加入運算、圖形、虛擬化和記憶體管理的進階技術。 Google Cloud支援在 Compute Engine 中使用部分這些進階功能。

進階向量擴充功能

進階向量擴充功能 (AVX) 是 x86 指令集架構的單指令多資料 (SIMD) 擴充功能,適用於 Intel 和 Advanced Micro Devices (AMD) 的微處理器。AVX 提供新的指令和新的編碼方案。

詳情請參閱「進階向量延伸功能」。

AVX 可與 Compute Engine 使用的所有 x86 處理器搭配使用。

進階向量延伸功能 (AVX2)

AVX2 (也稱為 Haswell 新指令) 為 AVX 新增了以下項目:

  • 將大多數向量整數 SSE 和 AVX 指令擴充至 256 位元
  • 新增對 Gather 的支援,可從非連續記憶體位置載入向量元素
  • 以 DWORD 和 QWORD 精細度進行任意至任意排列
  • 向量位移

AVX2 適用於下列 CPU 平台:

  • Intel Xeon E5 v3 (Haswell) 及更新版處理器
  • 所有 AMD 處理器

進階向量延伸 (AVX512)

AVX-512 會使用 EVEX 前置字元編碼,將 AVX 擴充至 512 位元支援。AVX-512 可為需要大量向量處理的工作負載提供內建加速功能。AVX-512 加速器的大型登錄器除了支援八個 64 位元和 16 個 32 位元整數,還支援 32 個雙精度和 64 個單精度浮點數。

如要進一步瞭解 AVX-512,請參閱「什麼是 Intel AVX-512?」。

AVX-512 適用於下列 CPU 平台:

  • Intel Xeon 可擴充處理器 (Skylake) 第 1 代及更新版處理器
  • AMD EPYC Genoa 第 4 代處理器

進階矩陣擴充功能

Intel Advanced Matrix Extensions (AMX) 是一種新的指令集架構 (ISA) 擴充功能,旨在加速人工智慧 (AI) 和機器學習 (ML) 工作負載。AMX 推出了可用於執行矩陣相乘和卷積運算的新指令,這兩項運算是 AI 和 ML 中最常見的運算。

AMX 引進了 2D 註冊,稱為「tiles」,可讓加速器執行作業。AMX 是可擴充的架構。實作的首個加速器稱為平鋪矩陣乘法單元 (TMUL)。Sapphire Rapids 處理器的每個 CPU 核心都有一個獨立的 AMX TMUL 單元。

如需 Intel AMX 的技術詳細資料,請參閱「5.16 版的 Intel AMX 支援」。Intel 在 程式碼範例:Intel® 進階矩陣擴充功能 (Intel® AMX) - 內建函式中提供 AMX 教學課程。

AMX 適用於 Intel Xeon 第 4 代 (Sapphire Rapids) 及後續處理器。AMX 不適用於 AMD 或 Arm 處理器。

使用 AMX 的必要條件

Intel AMX 指令有特定的最低軟體需求,例如:

  • 對於自訂映像檔,Linux 核心版本 5.16 以上版本支援 AMX。
  • Compute Engine 在下列公開映像檔中提供 AMX 支援:
    • CentOS Stream 8 以上版本
    • Container-Optimized OS 109 LTS 以上版本
    • RHEL 8 (最新版本) 以上
    • Rocky Linux 8 (最新版本) 以上版本
    • Ubuntu 22.04 以上版本
    • Windows Server 2022 以上版本
  • Tensorflow 2.9.1 以上版本
  • Intel® Optimization for PyTorch 的 Intel 擴充功能

如要瞭解 C4 和 C3 VM 的區域供應情形,請參閱「可用地區與區域」,並篩選表格,只顯示 C4 或 C3 機器類型。

可供 Bare Metal 執行個體使用的 CPU 功能

除了提供伺服器的所有原始運算資源,在第 4 代 Intel Xeon Scalable 處理器上執行的裸機執行個體還可使用多種板載、特定功能的加速器和卸載功能:

  • Intel-QAT:Intel QuickAssist Technology (Intel QAT) 可加速壓縮、加密和解密
  • Intel-DLB:Intel 動態負載平衡器 (Intel DLB) 可加快資料佇列速度
  • Intel IAA:Intel 記憶體內分析加速器 (Intel IAA) 可改善查詢處理效能。
  • Intel DSA:Intel Data Streaming Accelerator (Intel DSA) 可協助加快資料的複製和移動速度。

機密運算

如要保護使用中的資料,您可以使用支援機密運算技術的 CPU 平台,建立機密 VM 執行個體。

如要進一步瞭解建立機密 VM 執行個體的要求,請參閱「支援的設定」。

後續步驟

歡迎試用

如果您未曾使用過 Google Cloud,歡迎建立帳戶,親自體驗實際使用 Compute Engine 的成效。新客戶可以獲得價值 $300 美元的免費抵免額,可用於執行、測試及部署工作負載。

免費試用 Compute Engine