建立附加 GPU 的執行個體總覽


Compute Engine 提供圖形處理器 (GPU),您可以將這些 GPU 加入到虛擬機器 (VM)。您可以使用這些 GPU 加速處理 VM 中的特定工作負載,例如機器學習和資料處理。

本文件概略說明如何建立附加 GPU 的 VM。

如要進一步瞭解 Compute Engine 上的 GPU,請參閱「關於 GPU」一文。

選取 GPU 型號

如需可用 GPU 型號的清單,請參閱「GPU 平台」。並記下所選 GPU 型號支援的機器類型。

針對每個模型,您也可以參考下列資訊:

限制

除了所有搭載 GPU 的 VM 的限制之外,每個搭載 GPU 的機器系列都有下列限制:

A4 VM

  • 您只能使用 A4 機器類型的支援的佈建選項,才能要求容量。
  • 使用 A4 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區使用 A4 機器類型。
  • 您無法在使用 A4 機器類型的 VM 上使用 永久磁碟 (地區性或區域性)。
  • A4 機器類型僅適用於 Emerald Rapids CPU 平台
  • 您無法變更 A4 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
  • 您無法將 VM 的機器類型變更為 A4 機器類型。如果您需要使用 A4 機器類型的 VM,則必須建立新的 VM。
  • A4 機器類型不支援單租戶
  • 您無法在 A4 機器類型上執行 Windows 作業系統。

A3 Ultra VM

  • 您只能使用 A3 Ultra 機器類型的支援的佈建選項,要求容量。
  • 使用 A3 Ultra 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區中使用 A3 Ultra 機器類型。
  • 您無法在使用 A3 Ultra 機器類型的 VM 上使用 永久磁碟 (地區或區域)。
  • A3 Ultra 機器類型僅適用於 Emerald Rapids CPU 平台
  • 您無法變更 A3 Ultra 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
  • 您無法將 VM 的機器類型變更為 A3 Ultra 機器類型。如果您需要使用 A3 Ultra 機器類型的 VM,則必須建立新的 VM。
  • A3 Ultra 機型不支援單租戶
  • 您無法在 A3 Ultra 機型上執行 Windows 作業系統。

A3 Mega VM

  • 您只能使用 A3 Mega 機器類型的支援的佈建選項,才能要求容量。
  • 使用 A3 Mega 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區使用 A3 Mega 機器類型。
  • 您無法在使用 A3 Mega 機器類型的 VM 上使用地區性永久磁碟
  • A3 Mega 機器類型僅適用於 Sapphire Rapids CPU 平台
  • 您無法變更 A3 Mega 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
  • 您無法將 VM 的機器類型變更為 A3 Mega 機器類型。如果您需要使用 A3 Mega 機器類型的 VM,則必須建立新的 VM。
  • A3 Mega 機器類型不支援單租戶
  • 您無法在 A3 Mega 機器類型上執行 Windows 作業系統。

A3 High VM

  • 您只能使用 A3 高效能機器類型的支援的佈建選項,要求容量。
  • 使用 A3 High 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區使用 A3 High 機器類型。
  • 您無法在採用 A3 High 機器類型的 VM 上使用地區性永久磁碟
  • A3 High 機器類型僅適用於 Sapphire Rapids CPU 平台
  • 您無法變更 A3 High 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
  • 您無法將 VM 的機器類型變更為 A3 High 機型。如果您需要使用 A3 High 機器類型的 VM,則必須建立新的 VM。
  • A3 High 機型不支援單一租戶
  • 您無法在 A3 High 機型上執行 Windows 作業系統。
  • 對於 a3-highgpu-1ga3-highgpu-2ga3-highgpu-4g 機器類型,適用下列限制:
    • 對於這些機器類型,您必須使用 Spot VM,或是使用 動態工作負載調度器 (DWS) 的功能,例如 MIG 中的調整大小要求。如需這兩種做法的詳細操作說明,請參閱以下內容:
    • 您無法搭配這些機器類型使用 Hyperdisk Balanced。
    • 無法建立保留項目。
    如果您嘗試使用標準佈建作業建立 VM,或嘗試為這些機器類型建立預訂,就會收到錯誤訊息

A3 Edge VM

  • 您只能使用 A3 Edge 機器類型的支援的佈建選項,才能要求容量。
  • 使用 A3 Edge 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區使用 A3 Edge 機器類型。
  • 您無法在使用 A3 Edge 機器類型的 VM 上使用地區永久磁碟
  • A3 Edge 機器類型僅適用於 Sapphire Rapids CPU 平台
  • 您無法變更 A3 Edge 機器類型 VM 的機器類型。如果需要變更機器類型,則必須建立新的 VM。
  • 您無法將 VM 的機器類型變更為 A3 Edge 機器類型。如果您需要使用 A3 Edge 機器類型的 VM,則必須建立新的 VM。
  • A3 Edge 機器類型不支援單租戶
  • 您無法在 A3 Edge 機器類型上執行 Windows 作業系統。

A2 標準 VM

  • 您只能使用 A2 標準機器類型的支援的佈建選項,才能要求容量。
  • 使用 A2 Standard 機器類型的 VM 不適用續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區使用 A2 標準機器類型。
  • A2 Standard 機器類型僅適用於 Cascade Lake 平台
  • 如果 VM 使用 A2 Standard 機器類型,您只能從一個 A2 Standard 機器類型切換至另一個 A2 Standard 機器類型。您無法變更為任何其他機器類型。詳情請參閱「修改加速器最佳化 VM」。
  • 您無法使用 Windows 作業系統搭配 <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 Standard 機器類型。使用 Windows 作業系統時,請選擇其他 A2 Standard 機器類型。</codea2-megagpu-16g<>
  • 您無法在使用 A2 Standard 機器類型的 Windows VM 上,快速格式化已連結的本機 SSD。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定 format fs=ntfs label=tmpfs,才能進行完整格式化。
  • A2 Standard 機器類型不支援單租戶

A2 Ultra VM

  • 您只能使用 A2 Ultra 機器類型的支援的佈建選項,才能要求容量。
  • 使用 A2 Ultra 機器類型的 VM 不會獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區中使用 A2 Ultra 機器類型。
  • A2 Ultra 機器類型僅適用於 Cascade Lake 平台
  • 如果 VM 使用 A2 Ultra 機器類型,您就無法變更機器類型。如果您需要使用其他 A2 Ultra 機器類型或任何其他機器類型,就必須建立新的 VM。
  • 您無法將任何其他機器類型變更為 A2 Ultra 機器類型。如果您需要使用 A2 Ultra 機器類型的 VM,則必須建立新的 VM。
  • 您無法在使用 A2 Ultra 機型類型的 Windows VM 上,對已連結的本機 SSD 進行快速格式化。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定 format fs=ntfs label=tmpfs,才能進行完整格式化。

G2 VM

  • 您只能使用 G2 機器類型的支援的佈建選項來要求容量。
  • 您不會針對使用 G2 機器類型的 VM 獲得續用折扣彈性承諾使用折扣
  • 您只能在特定區域和可用區中使用 G2 機器類型。
  • G2 機器類型僅適用於 Cascade Lake 平台
  • 使用 G2 標準機器類型的 VM 不支援標準永久磁碟 (pd-standard)。如需支援的磁碟類型,請參閱「G2 支援的磁碟類型」。
  • 您無法在 G2 機器類型上建立多重執行個體 GPU
  • 如果您需要變更 G2 VM 的機器類型,請參閱「修改加速器最佳化 VM」。
  • 您無法將深度學習 VM 映像檔用作使用 G2 機器類型的 VM 的開機磁碟。
  • Container-Optimized OS 目前的預設驅動程式不支援在 G2 機器類型上執行的 L4 GPU。Container-Optimized OS 也只支援特定的驅動程式。如果您想在 G2 機器類型上使用 Container-Optimized OS,請參閱以下注意事項:
    • 請使用支援 NVIDIA 建議最低驅動程式版本 525.60.13 或更新版本的 Container-Optimized OS 版本。詳情請參閱 Container-Optimized OS 版本資訊
    • 安裝驅動程式時,請指定適用於 L4 GPU 的最新可用版本。例如:sudo cos-extensions install gpu -- -version=525.60.13
  • 在下列情況下,您必須使用 Google Cloud CLI 或 REST 建立 G2 VM
    • 您想指定自訂記憶體值。
    • 您想自訂可見的 CPU 核心數量。

N1+GPU VM

如要瞭解搭載 GPU 的 N1 執行個體限制,請參閱 N1 機器系列的功能N1 機器系列的 GPU

選擇作業系統

如果您要使用 GPU 進行機器學習,請使用下列其中一個作業系統:

  • 針對 AI 工作負載最佳化的圖片。您可以使用 Ubuntu 和 Rocky 映像檔,這些映像檔可在加速器最佳化版本中使用,並預先安裝驅動程式和 CUDA 工具包。請參閱 AI 超級電腦說明文件中的「OS 映像檔」一節。
  • 深度學習 VM 映像檔。每個深度學習 VM 都有 GPU 驅動程式安裝工具,並包含 TensorFlow 和 PyTorch 等套件。您也可以將深度學習 VM 用於一般 GPU 工作負載。如要進一步瞭解可用的映像檔和這些映像檔上安裝的套件,請參閱「選擇映像檔」。

您也可以使用任何公開映像檔自訂映像檔。請注意,部分映像檔可能需要特別的驅動程式,或安裝程序超出 Compute Engine 說明文件的範圍。如要瞭解哪些驅動程式適用於您的 OS 映像檔,請參閱「安裝 GPU 驅動程式」一文。

查看 GPU 配額

為保護 Compute Engine 系統和使用者,新專案有全域的 GPU 配額。這個配額會限制您可在所有支援區域中建立的 GPU 總數量。如要查看 GPU 配額,請參閱「GPU 配額」。

如果需要更多 GPU 配額,請參閱申請增加配額的相關說明。要求 GPU 配額時,您必須為要在各個地區建立的 GPU 類型要求配額,並依據所有區域中各類 GPU 的總數要求額外的全域配額。

如果您的專案已建立帳單記錄,那麼當您提交要求之後,專案就會自動獲得配額。

GPU VM 和先占分配配額

使用預設標準佈建模式 (標準 VM) 的 VM 資源通常無法使用先占分配配額,因為這類配額是用於臨時工作負載,通常較容易取得。如果專案未取得先占配額,且您從未要求先占配額,則該專案中的所有 VM 都會使用標準分配配額。

不過,一旦您要求可搶佔的配置配額,符合下列所有條件的標準 VM 就只能使用可搶佔的配置配額。

針對這類工作負載使用先占配置配額,您就能同時享有標準 VM 提供的無中斷執行時間,以及先占配置配額提供的改善取得性。

無論使用哪種配額,標準 VM 都無法享有 Spot VM 價格,也不會受到先占機制影響。

詳情請參閱「可先佔配額」。

建立已連結 GPU 的 VM

如要建立已連接 GPU 的 VM,請完成下列步驟:

  1. 建立 VM。建立 VM 的方式取決於所選的 GPU 型號。

  2. 如要讓 VM 使用 GPU,您必須在 VM 上安裝 GPU 驅動程式。如果您已啟用 NVIDIA RTX 虛擬工作站 (舊稱 NVIDIA GRID),請為虛擬工作站安裝驅動程式

後續步驟