Google Cloud 通过 C4A 和 A4X 机器系列在 Compute Engine 中提供一系列 Arm 提供支持的服务器。ARM 架构经过优化,更加节能,因此性价比更高。
由于电源效率高于 x86 服务器,Arm 处理器在标准服务器中比较常见。在 Arm 处理器上运行的设备包括手机和笔记本电脑等。Arm CPU 具有更小的指令集,指令越少意味着运行速度更快,电池用量和功耗更低。
例如,C4A 使用 Google 的自定义 Arm 处理器 Axion,该处理器基于 Arm Neoverse V2 处理器。Neoverse V2 是首款改进了 Armv9 性能、功耗和安全性的 V 系列 CPU。它专为高性能计算、机器学习和通用云计算而设计。请考虑使用 C4A 通用 Arm 虚拟机 (VM) 来实现以下任何目的:
- 运行计算密集型工作负载,需要能够按需快速调节用量。
- 针对与 Arm 兼容的工作负载进行优化以提升性价比。
- 基于现代开源软件栈进行构建。
- 开发和测试使用 Arm CPU 的移动或嵌入式系统。
- 评估工作负载是否适合 Arm CPU。
如需将 GPU 与基于 Arm 的 CPU 搭配使用,请选择在 NVIDIA GB200 NVL72 平台上运行的 A4X 机器系列。使用此机器系列创建的虚拟机已挂接 NVIDIA GB200 Grace Blackwell Superchip。此机器系列经过优化,非常适合大规模并行化计算统一设备架构 (CUDA) 计算工作负载,例如机器学习 (ML) 和高性能计算 (HPC)。
A4X 机器系列
A4X 是首个同时配备基于 Arm 的 CPU 和挂接 GPU 的 Compute Engine 虚拟机。A4X 可提供 vCPU 多达 140 个和内存高达 884 GB 的机器类型。A4X 使用 NVIDIA GB200 GPU,每个 GPU 可提供 180 GB 内存。A4X 有两个插槽,其中 NVIDIA Grace Arm CPU 通过快速芯片间 (NVLink C2C) 通信连接到 4 个 B200 GPU。A4X 在 a4x-highgpu-4g
机器类型中提供。
A4X 实例的存储空间选项
A4X 可与 Google Cloud Hyperdisk 挂接存储空间搭配使用,并配有 12,000 GiB 的本地 SSD。Compute Engine 会在创建实例期间自动将本地 SSD 磁盘挂接到您的 A4X 实例。
操作系统映像
A4X 实例支持基于 Arm 的公共操作系统映像。您还可以使用基于 Arm 的公共操作系统映像创建自定义映像。
C4A 机器系列
C4A 是首个基于 Arm 的虚拟机,配置了 Google 的基于 Arm64 的 Axion CPU。C4A 可提供 vCPU 多达 72 个和 DDR5-5600 内存高达 576 GB 的机器类型。C4A 在 standard
、highmem
和 highcpu
机器类型中提供。
C4A 基于 Titanium 构建,Titanium 使用网络分流,通过 gVNIC 网络接口实现每虚拟机高达 100 Gbps 的 Tier_1 网络性能。C4A 还支持 NVMe 磁盘接口并可以使用 Hyperdisk Balanced 和 Hyperdisk Extreme 磁盘。
并发多线程
对于 C4A 机器系列,每个 vCPU 均由单个核心提供支持,不支持并发多线程 (SMT)。因此,与支持 SMT 的虚拟机相比,C4A 虚拟机的每个 vCPU 可提供更高性能。虽然 SMT 可为某些工作负载提供优势,但单线程核心非常适合计算密集型工作负载,因为进程可以访问整个核心,而不是与其他进程共享核心。
操作系统映像
C4A 虚拟机支持基于 Arm 的公共操作系统映像。您还可以使用基于 Arm 的公共映像创建自定义映像。
Tau T2A 机器系列
Tau T2A Arm 机器系列以 3.0 GHz 的全核频率在 64 核 Ampere Altra Arm 处理器上运行。Tau T2A 支持运行在 Arm 上可实现最佳性能的工作负载或只在 Arm 上运行的工作负载。
Tau T2A 机器系列具有预定义的机器类型,支持多达 48 个物理核心以及每个 vCPU 4 GB 内存。Tau T2A 机器类型在单个 NUMA 节点中运行。
Tau T2A 机器类型仅支持为存储使用 NVMe 接口以及为网络使用 Google 虚拟 NIC (gVNIC)。不支持 Virtio-Net 和 SCSI 接口。所有公开提供的 Arm 操作系统映像都配置为使用 NVMe 和 gVNIC 接口。gVNIC 是专为 Compute Engine 设计的网络接口。它可以提供更好的性能,并支持更高的网络带宽和吞吐量。
对于此机器系列,每个 vCPU 均由单个核心提供支持,不支持并发多线程 (SMT)。
工作负载建议
C4A 机器系列非常适合各种扩容和计算密集型工作负载,尤其是在性价比是关键考虑因素时。在部署以下工作负载时,请考虑使用 C4A:
- 机器学习数据处理
- 机器学习推理和模型部署
- 应用服务、Web 服务和游戏服务
- 嵌入式系统开发
- Arm 上的 CI/CD 开发
- 视频和图片编码、转码和处理
- 数字广告交易和投放
- 缓存服务器
- 计算型药品研发
- Android 开发
- 自动驾驶或传统汽车软件开发
后续步骤
- 查看 A4X 机器系列的规格和功能。
- 查看 C4A 机器系列的规格。
- 了解 Google Cloud的适用CPU 平台。
- 使用 Arm 操作系统映像创建并启动 Compute Engine 实例。