Google Cloud 透過 C4A 和 A4X 機器系列,在 Compute Engine 中提供一系列 Arm 技術的伺服器。ARM 架構經過最佳化處理,運作效率相當卓越,因此成本效益更高。
相較於 x86 伺服器,Arm 處理器在標準伺服器中相當常見,因為它們更節能。行動電話和筆記型電腦就是在 Arm 處理器上執行的裝置範例。使用 Arm CPU 的縮減指令集,指令越少,效能速度越快,電池和電力消耗越低。
舉例來說,C4A 會使用 Google 自訂的 Arm 處理器 Axion,該處理器以 Arm Neoverse V2 處理器為基礎。Neoverse V2 是首款搭載 Armv9 效能、電源和安全性強化功能的 V 系列 CPU。此 VM 專為高效能運算、機器學習和通用雲端運算而設計。建議您將 C4A 一般用途 Arm 虛擬機器 (VM) 用於下列任何用途:
- 執行需要視需要快速擴充用量的耗用大量運算資源的工作負載。
- 針對與 Arm 相容的工作負載,提供最佳成本效益。
- 以現代化開放原始碼軟體堆疊進行建構。
- 開發及測試使用 Arm CPU 的行動或嵌入式系統。
- 評估工作負載是否適合 Arm CPU。
如要使用搭載 Arm 架構 CPU 的 GPU,請選擇在 NVIDIA GB200 NVL72 平台上執行的 A4X 機器系列。使用此機器系列建立的 VM 已連結 NVIDIA GB200 Grace Blackwell 超級晶片。這個機器系列經過最佳化處理,適用於大規模平行的 Compute Unified Device Architecture (CUDA) 運算工作負載,例如機器學習 (ML) 和高效能運算 (HPC)。
A4X 機器系列
A4X 是第一個同時具備 Arm 架構 CPU 和附加 GPU 的 Compute Engine VM。A4X 提供最多 140 個 vCPU 和 884 GB 記憶體的機器類型。A4X 使用 NVIDIA GB200 GPU,每個 GPU 提供 180 GB 記憶體。A4X 有兩個插槽,其中 NVIDIA Grace Arm CPU 連接到四個 B200 GPU,並透過快速的晶片對晶片 (NVLink C2C) 通訊。a4x-highgpu-4g
機器類型支援 A4X。
A4X 執行個體的儲存空間選項
A4X 可搭配 Google Cloud Hyperdisk 連接儲存空間使用,並提供 12,000 GiB 的本機 SSD。在建立執行個體時,Compute Engine 會自動將本機 SSD 磁碟連接至 A4X 執行個體。
作業系統映像檔
A4X 執行個體支援公開的 Arm 架構OS 映像檔。您也可以使用公開的 Arm 架構 OS 映像檔建立自訂映像檔。
C4A 機器系列
C4A 是第一個以 Google Axion 的 Arm64 架構 CPU 為基礎所建構的 Arm 架構 VM。C4A 提供最多 72 個 vCPU 和 576 GB DDR5-5600 記憶體的機器類型。C4A 可用於 standard
、highmem
和 highcpu
機型。
C4A 建構於 Titanium,可使用網路卸載功能,並透過 gVNIC 網路介面,啟用每個 VM Tier_1 網路效能,最高可達 100 Gbps。C4A 也支援 Hyperdisk Balanced 和 Hyperdisk Extreme 磁碟的 NVMe 磁碟介面。
多執行緒並行
對於 C4A 機器系列,每個 vCPU 都由單一核心支援,且不支援多執行緒並行 (SMT)。因此,與啟用 SMT 的 VM 相比,C4A VM 可提供更高的 vCPU 效能。雖然 SMT 可為特定工作負載帶來好處,但單執行緒核心最適合運算密集型工作負載,因為程序可以存取整個核心,而非與其他程序共用。
作業系統映像檔
C4A VM 支援公開的 Arm 架構OS 映像檔。您也可以使用公開提供的 Arm 映像檔建立自訂映像檔。
Tau T2A 機器系列
Tau T2A Arm 機器系列採用 64 核心 Ampere Altra Arm 處理器,全核心頻率為 3.0 GHz。透過 Tau T2A,您可以執行在 ARM 上執行最佳效能的工作負載,甚至是專屬工作負載。
Tau T2A 機器系列已預先定義機器類型,最多可搭載 48 個實體核心,每個 vCPU 有 4 GB 記憶體。Tau T2A 機型會在單一 NUMA 節點中執行。
Tau T2A 機型僅支援 NVMe 儲存裝置介面,以及 Google 虛擬 NIC (gVNIC) 網路。不支援 Virtio-Net 和 SCSI 介面。所有公開提供的 Arm OS 映像檔都已設定為使用 NVMe 和 gVNIC 介面。gVNIC 是專為 Compute Engine 設計的網路介面。這項功能可提供更佳效能,並支援更高的網路頻寬和處理量。
對於這個機器系列,每個 vCPU 都由單一核心支援,且不支援多執行緒並行 (SMT)。
工作負載建議
C4A 機器系列非常適合各種擴展和運算密集型工作負載,尤其是在成本效益是主要考量因素時。部署下列工作負載時,請考慮使用 C4A:
- 機器學習資料處理
- 機器學習推論和模型服務
- 應用程式、網頁和遊戲放送
- 嵌入式系統開發
- 在 Arm 上使用 CI/CD 進行開發
- 影片和圖片編碼、轉碼和處理
- 數位廣告交易平台和放送
- 快取伺服器
- 藥物研發運算
- Android 應用程式開發
- 自駕車或傳統汽車軟體開發
後續步驟
- 查看 A4X 機器系列的規格和功能。
- 請參閱 C4A 機器系列的規格。
- 瞭解 Google Cloud適用的CPU 平台。
- 使用 Arm OS 映像檔建立並啟動 Compute Engine 執行個體。