安装 GPU 驱动程序

Linux Windows

创建具有一个或多个 GPU 的虚拟机 (VM) 实例后，系统需要安装 NVIDIA 设备驱动程序，以便应用可以访问设备。确保您的虚拟机 (VM) 实例具有足够的可用磁盘空间。创建新虚拟机时，您应该至少为启动磁盘选择 40 GB。

如需安装驱动程序，您有以下两种选择：

如果您需要将 GPU 用于硬件加速 3D 图形（例如远程桌面）或用于游戏，请参阅为 NVIDIA RTX 虚拟工作站 (vWS) 安装驱动程序。
对于其他工作负载，请按照本文档中的说明安装 NVIDIA 驱动程序。

专家提示：或者，您可以通过创建使用已安装驱动程序的映像的虚拟机来跳过此设置。如需了解详情，请参阅选择操作系统。

NVIDIA 驱动程序、CUDA 工具包和 CUDA 运行时版本

您的环境中可能需要使用不同版本的驱动程序和运行时。其中包括以下组件：

NVIDIA 驱动程序
CUDA 工具包
CUDA 运行时

安装这些组件时，您可以配置环境以满足您的需求。例如，如果您的某个较低版本的 Tensorflow 最适合与某个较低版本的 CUDA 工具包搭配使用，但您想要使用的 GPU 需要更高版本的 NVIDIA 驱动程序，那么您可以安装较低版本的 CUDA 工具包和较高版本的 NVIDIA 驱动程序。

但是，您必须确保 NVIDIA 驱动程序和 CUDA 工具包版本兼容。如需了解 CUDA 工具包和 NVIDIA 驱动程序的兼容性，请参阅关于 CUDA 兼容性的 NVIDIA 文档。

了解 NVIDIA 驱动程序分支

NVIDIA 提供以下三个驱动程序分支：

长期支持分支 (LTSB)：此分支优先考虑稳定性并尽可能减少维护，支持生命周期长达三年。Google 测试和验证的最新 LTSB 是 535，其支持结束日期为 2026 年 6 月。
生产分支 (PB)：此分支提供性能增强功能，并支持最新硬件。它完全支持生产工作负载，但支持生命周期较短，最长为一年。Google 测试和验证的最新 PB 为 570，该版本将于 2026 年 2 月停止支持。
新功能分支 (NFB)：此分支供尝鲜者测试新功能，不建议用于生产环境。

对于生产工作负载，请使用生产分支或长期支持分支。如需详细了解 NVIDIA 分支，请参阅 NVIDIA 文档。

机器类型	GPU 模型	最早支持的分支	推荐的分支（EOS 日期）	推荐分支的最低驱动程序
A4X	NVIDIA Blackwell GB200 超级芯片	570	570（2026 年 2 月）	Linux：`570.133.20` 或更高版本 Windows：不适用
A4	NVIDIA Blackwell B200	570	570（2026 年 2 月）	Linux：`570.124.06` 或更高版本 Windows：不适用
A3 Ultra	NVIDIA H200	R550 (EOS)	570（2026 年 2 月）	Linux：`570.124.06` 或更高版本 Windows：不适用
A3 Mega、A3 High、A3 Edge	NVIDIA H100	535	535（2026 年 6 月）	Linux：`535.230.02` 或更高版本 Windows：不适用
G2	NVIDIA L4	535	535（2026 年 6 月）	Linux：`535.230.02` 或更高版本 Windows：`538.67` 或更高版本
A2 Standard、A2 Ultra	NVIDIA A100	535	535（2026 年 6 月）	Linux：`535.230.02` 或更高版本 Windows：`538.67` 或更高版本
N1	NVIDIA V100、T4、P100、P4	R410 (EOS)	535（2026 年 6 月）	Linux：`535.230.02` 或更高版本 Windows：`538.67` 或更高版本

使用 CUDA Toolkit 指南在虚拟机上安装 GPU 驱动程序

在大多数虚拟机上安装 NVIDIA 驱动程序的一种方法是安装 CUDA 工具包。

要安装 CUDA 工具包，请完成以下步骤：

选择支持所需驱动程序版本的 CUDA 工具包版本。

机器类型	GPU 模型	推荐的 CUDA 工具包
A4X	NVIDIA Blackwell GB200 超级芯片	CUDA 12.8.1 或更高版本
A4	NVIDIA Blackwell B200	CUDA 12.8.1 或更高版本
A3 Ultra	NVIDIA H200	CUDA 12.4 或更高版本
G2	NVIDIA L4	CUDA 12.2.2 或更高版本
A3 Mega、A3 High、A3 Edge	NVIDIA H100	CUDA 12.2.2 或更高版本
A2 Standard、A2 Ultra	NVIDIA A100	CUDA 12.2.2 或更高版本
N1	NVIDIA V100、T4、P100、P4	CUDA 12.2.2 或更高版本

连接到要安装驱动程序的虚拟机。
在虚拟机上，下载并安装 CUDA 工具包。如需查找 CUDA 工具包软件包和安装说明，请参阅 NVIDIA 文档中的 CUDA 工具包文件包。

使用安装脚本在虚拟机上安装 GPU 驱动程序

您可以使用以下脚本自动执行安装过程。如需查看这些脚本，请参阅 GitHub 代码库。

Linux

按照以下说明在正在运行的虚拟机上安装 GPU 驱动程序。

支持的操作系统

Linux 安装脚本已在以下操作系统上进行测试：

Debian 12
Red Hat Enterprise Linux (RHEL) 8 和 9
Rocky Linux 8 和 9
Ubuntu 22 和 24

如果您在其他操作系统上使用此脚本，安装可能会失败。此脚本可以安装 NVIDIA 驱动程序以及 CUDA 工具包。如需安装 GPU 驱动程序和 CUDA 工具包，请完成以下步骤：

如果安装了 2.38.0 版或更高版本的 Ops Agent 来收集虚拟机上的 GPU 指标，则必须先停止代理，然后才能使用此安装脚本安装或升级 GPU 驱动程序。

如需停止 Ops Agent，请运行以下命令：
```
sudo systemctl stop google-cloud-ops-agent
```
确保您的操作系统上安装了 Python 3。

下载安装脚本。

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

运行安装脚本。
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE：安装方法。请使用下列其中一个值：
  - repo：（默认）从官方 NVIDIA 软件包库安装驱动程序。
  - binary：使用二进制安装软件包安装驱动程序。
- BRANCH：您要安装的驱动程序分支。请使用下列其中一个值：
  - prod：（默认）生产分支。此分支符合在企业和数据中心 GPU 的生产环境中使用。
  - nfb：新的功能分支。此分支包含面向尝鲜者的最新更新。对于生产环境，不建议使用此分支。
  - lts：长期支持分支。此分支的维护时间比正常的生产分支更长。
运行脚本需要一些时间。这会重启虚拟机。如果虚拟机重启，请再次运行脚本以继续安装。
验证安装。请参阅验证 GPU 驱动程序安装。
您还可以使用此工具安装 CUDA 工具包。要安装 CUDA 工具包，请运行以下命令：
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
请确保您使用的 INSTALLATION_MODE 和 BRANCH 值与驱动程序安装期间使用的值相同。

此脚本可能至少需要 30 分钟才能完成运行。这会重启虚拟机。如果虚拟机重启，请再次运行脚本以继续安装。
验证 CUDA 工具包安装。
```
python3 cuda_installer.pyz verify_cuda
```
完成 GPU 驱动程序的安装或升级后，您必须重启虚拟机。

Linux（启动脚本）

按照以下说明在虚拟机启动期间安装 GPU 驱动程序。

支持的操作系统

Linux 安装脚本已在以下操作系统上进行测试：

Debian 12
Red Hat Enterprise Linux (RHEL) 8 和 9
Rocky Linux 8 和 9
Ubuntu 22 和 24

如果您在其他操作系统上使用此脚本，安装可能会失败。此脚本可以安装 NVIDIA 驱动程序以及 CUDA 工具包。

使用以下启动脚本自动安装驱动程序和 CUDA 工具包：

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

您可以将 --installation-mode INSTALLATION_MODE 和 --installation-branch BRANCH 标志附加到安装命令，以指明安装模式和要安装的驱动程序分支。

INSTALLATION_MODE：安装方法。请使用下列其中一个值：
- repo：（默认）从官方 NVIDIA 软件包库安装驱动程序。
- binary：使用二进制安装软件包安装驱动程序。
BRANCH：您要安装的驱动程序分支。请使用下列其中一个值：
- prod：（默认）生产分支。此分支符合在企业和数据中心 GPU 的生产环境中使用。
- nfb：新的功能分支。此分支包含面向尝鲜者的最新更新。对于生产环境，不建议使用此分支。
- lts：长期支持分支。此分支的维护时间比正常的生产分支更长。

Windows

此安装脚本可用于启用了安全启动的虚拟机。

对于使用 G2 机器系列的 Windows 虚拟机，此脚本仅会安装 NVIDIA 驱动程序。
对于其他机器类型，此脚本会安装 NVIDIA 驱动程序和 CUDA 工具包。

以管理员身份打开 PowerShell 终端，然后完成以下步骤：

如果您使用的是 Windows Server 2016，请将传输层安全协议 (TLS) 版本设置为 1.2。
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

下载脚本。

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

运行脚本。
```
C:\install_gpu_driver.ps1
```
运行脚本需要一些时间。安装过程中不会提供命令提示。脚本退出后，驱动程序即会安装。

此脚本会在虚拟机上的以下默认位置安装这些驱动程序：C:\Program Files\NVIDIA Corporation\\。
验证安装。请参阅验证 GPU 驱动程序安装。