本頁面由 Cloud Translation API 翻譯而成。

安裝 GPU 驅動程式

Linux Windows

建立具有一或多個 GPU 的虛擬機器 (VM) 執行個體後，系統需有 NVIDIA 裝置驅動程式，應用程式才能存取該裝置。確認虛擬機器 (VM) 執行個體有足夠的可用磁碟空間。建立新 VM 時，請選擇至少 40 GB 的開機磁碟。

如要安裝驅動程式，可以選擇下列其中一個選項：

如需 GPU 來加速處理 3D 繪圖，例如遠端桌面或遊戲，請參閱「安裝 NVIDIA RTX 虛擬工作站 (vWS) 的驅動程式」。
如要執行其他工作負載，請按照本文中的操作說明安裝 NVIDIA 驅動程式。

專業提示：您也可以建立使用已安裝驅動程式的映像檔的 VM，略過這項設定。詳情請參閱「選擇作業系統」一文。

NVIDIA 驅動程式、CUDA Toolkit 和 CUDA 執行階段版本

您的環境可能需要不同版本的驅動程式和執行階段元件。包括下列元件：

NVIDIA 驅動程式
CUDA 工具包
CUDA 執行階段

安裝這些元件時，您可以視需求設定環境。舉例來說，如果您使用舊版 TensorFlow，而該版本最適合搭配舊版 CUDA Toolkit，但您想使用的 GPU 需要新版 NVIDIA 驅動程式，這時您可以安裝舊版 CUDA Toolkit，並搭配新版 NVIDIA 驅動程式。

不過，您必須確保 NVIDIA 驅動程式和 CUDA Toolkit 版本相容。如要瞭解 CUDA Toolkit 和 NVIDIA 驅動程式的相容性，請參閱 NVIDIA CUDA 相容性文件。

瞭解 NVIDIA 驅動程式分支版本

NVIDIA 提供下列三種驅動程式分支版本：

長期支援分支 (LTSB)：這個分支著重穩定性，並盡量減少維護作業，支援生命週期長達三年。Google 測試及驗證的最新 LTSB 是 R580，支援期限至 2028 年 8 月。
正式版分支 (PB)：這個分支提供效能提升功能，並支援最新硬體。完整支援生產工作負載，但支援生命週期較短，最長為一年。Google 測試及驗證的最新 PB 是 R570，支援期限將於 2026 年 2 月結束。
新功能分支 (NFB)：這個分支適用於搶先體驗者測試新功能，不建議用於正式版環境。

如為正式環境工作負載，請使用正式版分支或長期支援分支。如要進一步瞭解 NVIDIA 分支版本，請參閱 NVIDIA 說明文件。

建議使用的 NVIDIA 驅動程式分支版本

請參閱本節中的表格，找出最適合 GPU 機器類型的 NVIDIA 驅動程式分支版本。

下表中的 EOS 表示 NVIDIA 將該分支版本列為支援終止。N/A 表示指定作業系統 (OS) 無法在機器類型上執行。

機器類型	GPU 型號	支援的分行	建議分支版本 (EOS 日期)	建議分支的最低驅動程式
A4X	NVIDIA Blackwell GB200 Superchip	R570 以上版本	R580 (2028 年 8 月)	Linux：`580.82.07` 以上版本 Windows：不適用
A4	NVIDIA Blackwell B200	R570 以上版本	R580 (2028 年 8 月)	Linux：`580.82.07` 以上版本 Windows：不適用
A3 Ultra	NVIDIA H200	R570 以上版本	R580 (2028 年 8 月)	Linux：`580.82.07` 以上版本 Windows：不適用
A3 Mega、High、Edge	NVIDIA H100	R535 以上版本	R535 (2026 年 6 月)	Linux：`535.230.02` 以上版本 Windows：不適用
G4	NVIDIA RTX PRO 6000	R580 以上版本	R580 (2028 年 8 月)	Linux：`580.95.05` 以上版本 Windows：`581.42` 以上版本
G2	NVIDIA L4	R535 以上版本	R535 (2026 年 6 月)	Linux：`535.230.02` 以上版本 Windows：`538.67` 以上版本
A2 Standard、A2 Ultra	NVIDIA A100	R535 以上版本	R535 (2026 年 6 月)	Linux：`535.230.02` 以上版本 Windows：`538.67` 以上版本
N1	NVIDIA T4	R535 以上版本	R535 (2026 年 6 月)	Linux：`535.230.02` 以上版本 Windows：`538.67` 以上版本
N1	NVIDIA V100、P100、P4	R35 至 R580¹	R535 (2026 年 6 月)	Linux：`535.230.02` 以上版本 Windows：`538.67` 以上版本

¹NVIDIA 宣布 R580 是最後一個支援 Pascal (P4 和 P100) 和 Volta 架構 (V100) 的驅動程式分支版本。

使用 CUDA Toolkit 指南在 VM 上安裝 GPU 驅動程式

在大多數 VM 上安裝 NVIDIA 驅動程式的方法之一，是安裝 CUDA Toolkit。

如要安裝 CUDA Toolkit，請完成下列步驟：

選取支援所需驅動程式版本的 CUDA Toolkit 版本。

機器類型	GPU 型號	建議使用的 CUDA Toolkit
A4X	NVIDIA Blackwell GB200 Superchip	CUDA 12.8.1 以上版本
A4	NVIDIA Blackwell B200	CUDA 12.8.1 以上版本
A3 Ultra	NVIDIA H200	CUDA 12.4 以上版本
G4	NVIDIA RTX PRO 6000	CUDA 13.1 以上版本
G2	NVIDIA L4	CUDA 12.2.2 以上版本
A3 Mega、High、Edge	NVIDIA H100	CUDA 12.2.2 以上版本
A2 Standard、A2 Ultra	NVIDIA A100	CUDA 12.2.2 以上版本
N1	NVIDIA T4	CUDA 12.2.2 以上版本
N1	NVIDIA V100、P100、P4	CUDA 12.2.2 至 CUDA 12 (最終版本)¹

¹CUDA Toolkit 12 是最後一個支援 Pascal (P4 和 P100) 和 Volta 架構 (V100) 的版本。NVIDIA 宣布，自 CUDA Toolkit 13.0 主要版本發布後，將移除這些架構的離線編譯和程式庫支援。詳情請參閱 NVIDIA 13.0 驅動程式版本資訊。

連線至要安裝驅動程式的 VM。
在 VM 上下載並安裝 CUDA Toolkit。如要尋找 CUDA Toolkit 套件和安裝說明，請參閱 NVIDIA 說明文件中的 CUDA Toolkit Archive。

使用安裝指令碼在 VM 上安裝 GPU 驅動程式

您可以使用下列指令碼自動執行安裝程序。如要查看這些指令碼，請參閱 GitHub 存放區。

Linux

按照這些操作說明，在執行中的 VM 上安裝 GPU 驅動程式。

支援的作業系統

Linux 安裝指令碼已在下列作業系統上測試：

Debian 12
Red Hat Enterprise Linux (RHEL) 8 和 9
Rocky Linux 8 和 9
Ubuntu 22 和 24

如果您在其他作業系統上使用這個指令碼，安裝作業可能會失敗。這個指令碼可以安裝 NVIDIA 驅動程式和 CUDA Toolkit。

如要安裝 GPU 驅動程式和 CUDA Toolkit，請完成下列步驟：

如果 VM 上有 2.38.0 以上版本的 Ops Agent 收集 GPU 指標，您必須先停止代理程式，才能使用這個安裝指令碼安裝或升級 GPU 驅動程式。

如要停止 Ops Agent，請執行下列指令：
```
sudo systemctl stop google-cloud-ops-agent
```
確認作業系統已安裝 Python 3。

下載安裝指令碼。

curl -L https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz --output cuda_installer.pyz

執行安裝指令碼。
```
sudo python3 cuda_installer.pyz install_driver --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
- INSTALLATION_MODE：安裝方法。請使用下列其中一個值：
  - repo：(預設) 從官方 NVIDIA 套件存放區安裝驅動程式。
  - binary：使用二進位安裝套件安裝驅動程式。
- BRANCH：要安裝的驅動程式分支版本。請使用下列其中一個值：
  - prod：(預設) 正式版分支。這個分支版本適用於企業和資料中心 GPU 的實際工作環境。
  - nfb：新的功能分支。這個分支版本包含早期採用者的最新更新。不建議在正式環境中使用這個分支版本。
  - lts：長期支援分支版本。這個分支的維護時間比一般正式版分支更長。
指令碼需要一段時間才能執行完畢。這會重新啟動 VM。VM 重新啟動後，請再次執行指令碼，繼續安裝程序。
驗證安裝狀態。請參閱「確認 GPU 驅動程式已順利安裝」。
您也可以使用這項工具安裝 CUDA Toolkit。如要安裝 CUDA Toolkit，請執行下列指令：
```
sudo python3 cuda_installer.pyz install_cuda --installation-mode=INSTALLATION_MODE --installation-branch=BRANCH
```
請務必使用與安裝驅動程式時相同的 INSTALLATION_MODE 和 BRANCH 值。

指令碼需要一段時間才能執行完畢。這會重新啟動 VM。VM 重新啟動後，請再次執行指令碼，繼續安裝程序。
確認 CUDA 工具包安裝完成。
```
python3 cuda_installer.pyz verify_cuda
```
安裝完成後，請務必重新啟動 VM。

Linux (開機指令碼)

按照這些指示，在 VM 啟動期間安裝 GPU 驅動程式。

支援的作業系統

Linux 安裝指令碼已在下列作業系統上測試：

Debian 12
Red Hat Enterprise Linux (RHEL) 8 和 9
Rocky Linux 8 和 9
Ubuntu 22 和 24

如果您在其他作業系統上使用這個指令碼，安裝作業可能會失敗。這個指令碼可以安裝 NVIDIA 驅動程式和 CUDA Toolkit。

使用下列開機指令碼，自動安裝驅動程式和 CUDA Toolkit：

#!/bin/bash
if test -f /opt/google/cuda-installer
then
  exit
fi

mkdir -p /opt/google/cuda-installer
cd /opt/google/cuda-installer/ || exit

if test -f cuda_installation
then
  exit
fi

curl -fSsL -O https://storage.googleapis.com/compute-gpu-installation-us/installer/latest/cuda_installer.pyz
python3 cuda_installer.pyz install_cuda

您可以在安裝指令中附加 --installation-mode INSTALLATION_MODE 和 --installation-branch BRANCH 標記，指出要安裝的模式和驅動程式分支版本。

INSTALLATION_MODE：安裝方法。請使用下列其中一個值：
- repo：(預設) 從官方 NVIDIA 套件存放區安裝驅動程式。
- binary：使用二進位安裝套件安裝驅動程式。
BRANCH：要安裝的驅動程式分支版本。請使用下列其中一個值：
- prod：(預設) 正式版分支。這個分支版本適用於企業和資料中心 GPU 的實際工作環境。
- nfb：新的功能分支。這個分支版本包含早期採用者的最新更新。不建議在正式環境中使用這個分支版本。
- lts：長期支援分支版本。這個分支的維護時間比一般正式版分支更長。

Windows

這個安裝指令碼可用於啟用安全啟動功能的 VM。

如果是使用 G2 系列機器的 Windows VM，這個指令碼只會安裝 NVIDIA 驅動程式。
如果是其他機型，指令碼會安裝 NVIDIA 驅動程式和 CUDA 工具包。

以系統管理員身分開啟 PowerShell 終端機，然後完成下列步驟：

如果您使用 Windows Server 2016，請將傳輸層安全標準 (TLS) 版本設為 1.2。
```
[Net.ServicePointManager]::SecurityProtocol = 'Tls12'
```

下載指令碼。

Invoke-WebRequest https://github.com/GoogleCloudPlatform/compute-gpu-installation/raw/main/windows/install_gpu_driver.ps1 -OutFile C:\install_gpu_driver.ps1

執行指令碼。
```
C:\install_gpu_driver.ps1
```
指令碼需要一段時間才能執行完畢。安裝過程中不會出現任何命令提示。指令碼結束後，驅動程式就會安裝完成。

這段指令碼會在 VM 的下列預設位置安裝驅動程式：C:\Program Files\NVIDIA Corporation\\。
驗證安裝狀態。請參閱「確認 GPU 驅動程式已順利安裝」。