Compute Engine 提供圖形處理器 (GPU),您可以將這些 GPU 加入到虛擬機器 (VM)。您可以使用這些 GPU 加速處理 VM 中的特定工作負載,例如機器學習和資料處理。
本文件概略說明如何建立附加 GPU 的 VM。
如要進一步瞭解 Compute Engine 上的 GPU,請參閱「關於 GPU」一文。
選取 GPU 型號
如需可用 GPU 型號的清單,請參閱「GPU 平台」。並記下所選 GPU 型號支援的機器類型。
針對每個模型,您也可以參考下列資訊:
限制
除了所有搭載 GPU 的 VM 的限制之外,每個搭載 GPU 的機器系列都有下列限制:
A4 VM
- 您只能使用 A4 機器類型的支援的佈建選項,才能要求容量。
- 使用 A4 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A4 機器類型。
- 您無法在使用 A4 機器類型的 VM 上使用 永久磁碟 (地區性或區域性)。
- A4 機器類型僅適用於 Emerald Rapids CPU 平台。
- 您無法變更 A4 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
- 您無法將 VM 的機器類型變更為 A4 機器類型。如果您需要使用 A4 機器類型的 VM,則必須建立新的 VM。
- A4 機器類型不支援單租戶。
- 您無法在 A4 機器類型上執行 Windows 作業系統。
A3 Ultra VM
- 您只能使用 A3 Ultra 機器類型的支援的佈建選項,要求容量。
- 使用 A3 Ultra 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區中使用 A3 Ultra 機器類型。
- 您無法在使用 A3 Ultra 機器類型的 VM 上使用 永久磁碟 (地區或區域)。
- A3 Ultra 機器類型僅適用於 Emerald Rapids CPU 平台。
- 您無法變更 A3 Ultra 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
- 您無法將 VM 的機器類型變更為 A3 Ultra 機器類型。如果您需要使用 A3 Ultra 機器類型的 VM,則必須建立新的 VM。
- A3 Ultra 機型不支援單租戶。
- 您無法在 A3 Ultra 機型上執行 Windows 作業系統。
A3 Mega VM
- 您只能使用 A3 Mega 機器類型的支援的佈建選項,才能要求容量。
- 使用 A3 Mega 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 Mega 機器類型。
- 您無法在使用 A3 Mega 機器類型的 VM 上使用地區性永久磁碟。
- A3 Mega 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法變更 A3 Mega 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
- 您無法將 VM 的機器類型變更為 A3 Mega 機器類型。如果您需要使用 A3 Mega 機器類型的 VM,則必須建立新的 VM。
- A3 Mega 機器類型不支援單租戶。
- 您無法在 A3 Mega 機器類型上執行 Windows 作業系統。
A3 High VM
- 您只能使用 A3 高效能機器類型的支援的佈建選項,要求容量。
- 使用 A3 High 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 High 機器類型。
- 您無法在採用 A3 High 機器類型的 VM 上使用地區性永久磁碟。
- A3 High 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法變更 A3 High 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
- 您無法將 VM 的機器類型變更為 A3 High 機型。如果您需要使用 A3 High 機器類型的 VM,則必須建立新的 VM。
- A3 High 機型不支援單一租戶。
- 您無法在 A3 High 機型上執行 Windows 作業系統。
- 對於
a3-highgpu-1g
、a3-highgpu-2g
和a3-highgpu-4g
機器類型,適用下列限制:-
對於這些機器類型,您必須使用 Spot VM,或是使用 動態工作負載調度器 (DWS) 的功能,例如 MIG 中的調整大小要求。如需這兩種做法的詳細操作說明,請參閱以下內容:
- 如要建立 Spot VM,請參閱「建立加速器最佳化 VM」,並記得將佈建模型設為
SPOT
- 如要在使用動態工作負載調度器的 MIG 中建立大小調整要求,請參閱「建立含 GPU VM 的 MIG」一文。
- 如要建立 Spot VM,請參閱「建立加速器最佳化 VM」,並記得將佈建模型設為
- 您無法搭配這些機器類型使用 Hyperdisk Balanced。
- 無法建立保留項目。
-
對於這些機器類型,您必須使用 Spot VM,或是使用 動態工作負載調度器 (DWS) 的功能,例如 MIG 中的調整大小要求。如需這兩種做法的詳細操作說明,請參閱以下內容:
A3 Edge VM
- 您只能使用 A3 Edge 機器類型的支援的佈建選項,才能要求容量。
- 使用 A3 Edge 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 Edge 機器類型。
- 您無法在使用 A3 Edge 機器類型的 VM 上使用地區永久磁碟。
- A3 Edge 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法變更 A3 Edge 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
- 您無法將 VM 的機器類型變更為 A3 Edge 機器類型。如果您需要使用 A3 Edge 機器類型的 VM,則必須建立新的 VM。
- A3 Edge 機器類型不支援單租戶。
- 您無法在 A3 Edge 機器類型上執行 Windows 作業系統。
A2 標準 VM
- 您只能使用 A2 標準機器類型的支援的佈建選項,才能要求容量。
- 使用 A2 Standard 機器類型的 VM 不適用續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A2 標準機器類型。
- A2 Standard 機器類型僅適用於 Cascade Lake 平台。
- 如果 VM 使用 A2 Standard 機器類型,您只能從一個 A2 Standard 機器類型切換至另一個 A2 Standard 機器類型。您無法變更為任何其他機器類型。詳情請參閱「修改加速器最佳化 VM」。
- 您無法使用 Windows 作業系統搭配 <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 Standard 機器類型。使用 Windows 作業系統時,請選擇其他 A2 Standard 機器類型。</codea2-megagpu-16g<>
- 您無法在使用 A2 Standard 機器類型的 Windows VM 上,快速格式化已連結的本機 SSD。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定
format fs=ntfs label=tmpfs
,才能進行完整格式化。 - A2 Standard 機器類型不支援單租戶。
A2 Ultra VM
- 您只能使用 A2 Ultra 機器類型的支援的佈建選項,才能要求容量。
- 使用 A2 Ultra 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區中使用 A2 Ultra 機器類型。
- A2 Ultra 機器類型僅適用於 Cascade Lake 平台。
- 如果 VM 使用 A2 Ultra 機器類型,您就無法變更機器類型。如果您需要使用其他 A2 Ultra 機器類型或任何其他機器類型,就必須建立新的 VM。
- 您無法將任何其他機器類型變更為 A2 Ultra 機器類型。如果您需要使用 A2 Ultra 機器類型的 VM,則必須建立新的 VM。
- 您無法在使用 A2 Ultra 機型類型的 Windows VM 上,對已連結的本機 SSD 進行快速格式化。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定
format fs=ntfs label=tmpfs
,才能進行完整格式化。
G2 VM
- 您只能使用 G2 機器類型的支援的佈建選項來要求容量。
- 您不會針對使用 G2 機器類型的 VM 獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區中使用 G2 機器類型。
- G2 機器類型僅適用於 Cascade Lake 平台。
- 使用 G2 標準機器類型的 VM 不支援標準永久磁碟 (
pd-standard
)。如需支援的磁碟類型,請參閱「G2 支援的磁碟類型」。 - 您無法在 G2 機器類型上建立多重執行個體 GPU。
- 如果您需要變更 G2 VM 的機器類型,請參閱「修改加速器最佳化 VM」。
- 您無法將深度學習 VM 映像檔用作使用 G2 機器類型的 VM 的開機磁碟。
- Container-Optimized OS 目前的預設驅動程式不支援在 G2 機器類型上執行的 L4 GPU。Container-Optimized OS 也只支援特定的驅動程式。如果您想在 G2 機器類型上使用 Container-Optimized OS,請參閱以下注意事項:
- 請使用支援 NVIDIA 建議最低驅動程式版本
525.60.13
或更新版本的 Container-Optimized OS 版本。詳情請參閱 Container-Optimized OS 版本資訊。 - 安裝驅動程式時,請指定適用於 L4 GPU 的最新可用版本。例如:
sudo cos-extensions install gpu -- -version=525.60.13
。
- 請使用支援 NVIDIA 建議最低驅動程式版本
- 在下列情況下,您必須使用 Google Cloud CLI 或 REST 建立 G2 VM:
- 您想指定自訂記憶體值。
- 您想自訂可見的 CPU 核心數量。
N1+GPU VM
如要瞭解搭載 GPU 的 N1 執行個體限制,請參閱 N1 機器系列的功能和 N1 機器系列的 GPU。
選擇作業系統
如果您要使用 GPU 進行機器學習,請使用下列其中一個作業系統:
- 針對 AI 工作負載最佳化的圖片。您可以使用 Ubuntu 和 Rocky 映像檔,這些映像檔可在加速器最佳化版本中使用,並預先安裝驅動程式和 CUDA 工具包。請參閱 AI 超級電腦說明文件中的「OS 映像檔」一節。
- 深度學習 VM 映像檔。每個深度學習 VM 都有 GPU 驅動程式安裝工具,並包含 TensorFlow 和 PyTorch 等套件。您也可以將深度學習 VM 用於一般 GPU 工作負載。如要進一步瞭解可用的映像檔和這些映像檔上安裝的套件,請參閱「選擇映像檔」。
您也可以使用任何公開映像檔或自訂映像檔。請注意,部分映像檔可能需要特別的驅動程式,或安裝程序超出 Compute Engine 說明文件的範圍。如要瞭解哪些驅動程式適用於您的 OS 映像檔,請參閱「安裝 GPU 驅動程式」一文。
查看 GPU 配額
為保護 Compute Engine 系統和使用者,新專案有全域的 GPU 配額。這個配額會限制您可在所有支援區域中建立的 GPU 總數量。如要查看 GPU 配額,請參閱「GPU 配額」。
如果需要更多 GPU 配額,請參閱申請增加配額的相關說明。要求 GPU 配額時,您必須為要在各個地區建立的 GPU 類型要求配額,並依據所有區域中各類 GPU 的總數要求額外的全域配額。
如果您的專案已建立帳單記錄,那麼當您提交要求之後,專案就會自動獲得配額。
GPU VM 和先占分配配額
使用預設標準佈建模式 (標準 VM) 的 VM 資源通常無法使用先占分配配額,因為這類配額是用於臨時工作負載,通常較容易取得。如果專案未取得先占配額,且您從未要求先占配額,則該專案中的所有 VM 都會使用標準分配配額。
不過,一旦您要求可搶佔的配置配額,符合下列所有條件的標準 VM 就只能使用可搶佔的配置配額。
- VM 已連接 GPU。這可以是已連接 GPU 的 N1 VM,或是加速器最佳化的 VM。
- 系統會在預先定義的 7 天或更短的執行時間過後,透過下列任一方法自動刪除 VM:
- 使用
maxRunDuration
欄位或terminationTime
欄位。詳情請參閱「限制 VM 的執行時間」或「限制 MIG 中 VM 的執行時間」。 - 使用
requestedRunDuration
欄位,這個欄位僅適用於代管執行個體群組 (MIG)。詳情請參閱「關於 MIG 中的大小調整要求」。
- 使用
- 不允許 VM 使用預留項目。詳情請參閱「防止運算執行個體使用保留項目」。
針對這類工作負載使用先占配置配額,您就能同時享有標準 VM 提供的無中斷執行時間,以及先占配置配額提供的改善取得性。
無論使用哪種配額,標準 VM 都無法享有 Spot VM 價格,也不會受到先占機制影響。
詳情請參閱「可先佔配額」。
建立已連結 GPU 的 VM
如要建立已連接 GPU 的 VM,請完成下列步驟:
建立 VM。建立 VM 的方式取決於所選的 GPU 型號。
- 如要建立已連結 NVIDIA B200 或 H200 GPU 的 VM,請參閱「建立 A3 Ultra 或 A4 VM」一文。
- 如要建立已連結 NVIDIA H100、A100 或 L4 GPU 的 VM,請參閱「建立 A3、A2 或 G2 VM」。
- 如要建立已連結 NVIDIA T4、P4、P100 或 V100 GPU 的 VM,請參閱「建立已連結 GPU 的 N1 VM」。
如要讓 VM 使用 GPU,您必須在 VM 上安裝 GPU 驅動程式。如果您已啟用 NVIDIA RTX 虛擬工作站 (舊稱 NVIDIA GRID),請為虛擬工作站安裝驅動程式。
後續步驟
進一步瞭解 GPU 平台。
進一步瞭解 使用 GPU 的功能和限制。
- 瞭解如何查看 GPU 的實際使用量和預測使用量。