Google Cloud 設計了加速器最佳化機器系列,可為 GPU 加速工作負載提供所需的效能和效率,例如人工智慧 (AI)、機器學習 (ML) 和高效能運算 (HPC)。
加速器最佳化機器系列適用於下列機器系列:A4X、A4、A3、A2 和 G2。系列中的每個機器類型都連接特定型號的 NVIDIA GPU,且數量也不同。您也可以將某些 GPU 型號附加至 N1 一般用途機器類型。
依工作負載類型推薦機器系列
下一個章節將根據您的 GPU 工作負載,提供建議的機器系列。
工作負載類型 | 建議的機器類型 |
---|---|
預先訓練模型 | A4X、A4、A3 Ultra、A3 Mega、A3 High 和 A2 如要找出最合適的模型,請參閱 AI 超級電腦說明文件中的預訓練模型建議。 |
微調模型 | A4X、A4、A3 Ultra、A3 Mega、A3 High 和 A2 如要找出最合適的模型,請參閱 AI 超級電腦說明文件中的模型微調建議。 |
提供推論 | A4X、A4、A3 Ultra、A3 Mega、A3 High、A3 Edge 和 A2 如要找出最合適的選項,請參閱 AI 超級電腦說明文件中的推論服務最佳化建議。 |
大量使用圖形的工作負載 | G2 和 N1+T4 |
高效能運算 | 對於高效能運算工作負載,任何加速器最佳化機器系列都很適合。最適合的選項取決於必須卸載至 GPU 的運算量。 詳情請參閱 AI Hypercomputer 說明文件中的「高效能運算建議」。 |
定價和佈建選項
加速器最佳化機器類型會根據連接的 GPU、預先定義的 vCPU、記憶體和隨附的本機 SSD (如適用) 計費。可套用於加速器最佳化執行個體的折扣會因您使用的佈建選項而異,請參閱下表。如要進一步瞭解加速器最佳化執行個體的定價資訊,請參閱 VM 執行個體定價頁面中的「加速器最佳化機器類型系列」一節。
隨選 (預設) | Spot VM | 彈性啟動 (預覽) | 保留項目 | |
---|---|---|---|---|
支援的加速器最佳化機器系列 | A3 Mega、A3 High、A3 Edge、A2 和 G2 | A4、A3、A2 和 G2 | A4、A3、A2 和 G2 | 支援的服務因預訂類型而異:
|
折扣 | 您可以購買依資源計算的承諾產品,為部分資源獲得 承諾使用折扣 (CUD)。不過,如果您使用隨選佈建選項的 GPU 和本機 SSD 磁碟,就無法享有 CUD。如果您想為 GPU 和本機 SSD 磁碟接收 CUD,建議改用保留項目配置選項。 |
Spot VM 會根據 Spot VM 定價自動獲得折扣。 |
使用彈性啟動佈建模式佈建的 VM 會自動獲得 Dynamic Workload Scheduler 定價的折扣。 |
您可以購買依資源計算的承諾,為加速器最佳化機器類型資源取得 CUD。請注意,針對任何 GPU 和本機 SSD 磁碟的承諾, 必須附加這些資源的保留項目。 |
A4X 機器系列
A4X 機器系列採用 NVIDIA GB200 NVL72 機架規模架構,在 exascale 平台上執行,最多可搭載 140 個 vCPU 和 884 GB 記憶體。這個機器系列經過最佳化調整,適用於運算和記憶體密集型、網路受限的機器學習訓練,以及 HPC 工作負載。A4X 機器系列僅提供單一機器類型。
使用 A4X 機器類型建立的 VM 執行個體提供下列功能:
使用 NVIDIA GB200 Superchips 進行 GPU 加速:A4X 執行個體會自動連接 NVIDIA GB200 Superchips。這些超級晶片搭載 NVIDIA B200 GPU,每個 GPU 提供 180 GB 記憶體。A4X 有兩個插槽,其中包含搭載 Arm® Neoverse™ V2 核心的 NVIDIA Grace™ CPU。這些 CPU 會透過快速的晶片對晶片 (NVLink-C2C) 通訊連線至四個 B200 GPU。
NVIDIA Grace CPU 平台:A4X 執行個體會使用 NVIDIA Grace CPU 平台。如要進一步瞭解平台,請參閱「CPU 平台」。
業界領先的 NVLink 可擴充性:多節點 NVLink,可在單一網域中擴充至 72 個 GPU。NVIDIA B200 GPU 提供的 GPU NVLink 頻寬為每 GPU 1800 GBps,雙向傳輸。在系統中,4 個 GPU 之間採用全對全 NVLink 拓撲時,NVLink 總頻寬可達 130 TB/s。
透過 RoCE 提升網路效能:針對 A4X 執行個體,透過匯集式以太網路 (RoCE) 技術,結合 NVIDIA ConnectX-7 (CX-7) 網路介面卡 (NIC) 和 Google 資料中心全域四向對齊網路,提升網路效能。透過匯集式乙太網路 (RoCE) 的 RDMA,A4X 執行個體在叢集內執行個體之間的總處理量,相較於 A4 執行個體,可達到更高的效率。
CX-7 NIC 在四向軌道對齊的網路拓撲上實體隔離,可讓 A4X 執行個體以 72 個 GPU 為一組的形式進行擴充,在單一非阻斷叢集中擴充至多達數千個 GPU。
提升網路速度:與使用 A3 機器類型建立的執行個體相比,網路速度最高可提升 4 倍。
資料移轉和復原的虛擬化最佳化:A4X 執行個體的 Peripheral Component Interconnect Express (PCIe) 拓撲可提供更準確的區域資訊,工作負載可利用這些資訊來最佳化資料移轉作業。
GPU 也會公開函式層級重設 (FLR),以便在特定情況下,從失敗和原子作業支援中改善並行性。
本機 SSD 和 Hyperdisk 支援:系統會自動為 A4X 執行個體新增 12,000 GiB 的本機 SSD。本機 SSD 可用於快速的暫存磁碟,或用於將資料餵入 GPU,同時避免 I/O 瓶頸。
如果應用程式需要更高的儲存空間效能,您可以將最多 512 TiB 的 Hyperdisk 連結至 A4X 執行個體。
密集配置和拓樸支援排程:透過 Cluster Director 佈建 A4X 執行個體時,您可以要求密集配置容量的區塊。主機會以實體方式彼此靠近分配,並以資源區塊形式佈建,並透過動態 ML 網路結構相互連結,以盡可能減少網路跳躍,並盡可能縮短延遲時間。此外,叢集總監會提供節點和叢集層級的拓樸資訊,可用於工作安排。
A4X 機型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3e) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (GBps)‡ |
---|---|---|---|---|---|---|---|
a4x-highgpu-4g |
4 | 720 | 140 | 884 | 12,000 | 6 | 2,000 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A4X 限制
- 您只能使用 A4X 機器類型的支援的佈建選項,要求容量。
- 使用 A4X 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定地區和區域中使用 A4X 機器類型。
- 您無法在使用 A4X 機器類型的 VM 上使用 永久磁碟 (地區性或區域性)。
- A4X 機器類型僅適用於 NVIDIA Grace 平台。
- 您無法將現有 VM 的機器類型變更為 A4X 機器類型。您只能建立新的 A4X VM。使用 A4X 機器類型建立虛擬機後,就無法變更機器類型。
- 您無法在 A4X 機器類型上執行 Windows 作業系統。
- A4X 虛擬機器不支援下列項目:
A4X 系列支援的磁碟類型
A4X VM 可使用下列區塊儲存空間類型:
- Hyperdisk Balanced (
hyperdisk-balanced
):這是開機磁碟唯一支援的磁碟類型 - Hyperdisk Extreme (
hyperdisk-extreme
) - 本機 SSD:會自動新增至使用任何 A4X 機器類型建立的 VM
每個 VM 的磁碟數量上限* | ||||||
---|---|---|---|---|---|---|
機器類型 | 所有磁碟† | Hyperdisk Balanced | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的本機 SSD |
a4x-highgpu-4g |
128 | 128 | 不適用 | 不適用 | 8 | 32 |
*Hyperdisk 的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「Hyperdisk 定價」。
†這項限制適用於 Hyperdisk,但不適用於本機 SSD 磁碟。
磁碟和容量限制
您可以將不同類型的 Hyperdisk 混合使用於 VM,但所有磁碟類型的磁碟總容量上限 (以 TiB 為單位) 不得超過:
對於 vCPU 少於 32 個的機器類型:所有 Hyperdisk 為 257 TiB
對於具有 32 個以上 vCPU 的機器類型:所有 Hyperdisk 為 512 TiB
如要進一步瞭解容量限制,請參閱「 Hyperdisk 大小和附件限制」。
A4 機器系列
A4 機器系列提供最多 224 個 vCPU 和 3,968 GB 記憶體的機器類型。對於大多數 GPU 加速工作負載,A4 執行個體可提供前一代 GPU 執行個體類型的 3 倍效能。建議將 A4 用於大規模的機器學習訓練工作負載,例如數百或數千個 GPU。A4 機器系列僅提供單一機器類型。
使用 A4 機器類型建立的 VM 執行個體提供下列功能:
使用 NVIDIA B200 GPU 進行 GPU 加速:NVIDIA B200 GPU 會自動連接至 A4 執行個體,每個 GPU 提供 180 GB GPU 記憶體。
第五代 Intel Xeon 可擴充處理器 (Emerald Rapids):提供最高 4.0 GHz 的持續單核心最大 Turbo 時脈頻率。如要進一步瞭解此處理器,請參閱「CPU 平台」。
業界領先的 NVLink 可擴充性:NVIDIA B200 GPU 提供 GPU NVLink 頻寬,每 GPU 雙向頻寬為 1,800 GBps。
在系統中,8 個 GPU 之間的所有 NVLink 拓樸,匯總 NVLink 頻寬可達 14.4 TBps。
透過 RoCE 強化網路:透過 NVIDIA ConnectX-7 網路介面卡 (NIC) 與 Google 資料中心全域四向對齊網路,提升 RDMA 網路效能。透過利用 RDMA over Converged Ethernet (RoCE),A4 執行個體在叢集中的執行個體之間,可達到比大多數 A3 執行個體高出許多的傳輸量,但在 A3 Ultra 機器類型上執行的執行個體除外。
網路速度提升:與前一代 A2 執行個體相比,網路速度最高可提升 4 倍。
如要進一步瞭解網路,請參閱「網路頻寬和 GPU」。
資料移轉和復原的虛擬化最佳化:A4 執行個體的 Peripheral Component Interconnect Express (PCIe) 拓樸可提供更準確的區域資訊,工作負載可利用這些資訊來最佳化資料移轉作業。
GPU 也會公開函式層級重設 (FLR),以便在特定情況下,從失敗中順利復原,並支援原子作業,以改善並行性。
支援本機 SSD 和 Hyperdisk:系統會自動為 A4 執行個體新增 12,000 GiB 的本機 SSD。本機 SSD 可用於快速的暫存磁碟,或用於將資料餵入 GPU 時,防止 I/O 瓶頸。
對於需要更高儲存空間效能的應用程式,您也可以將最多 512 TiB 的 Hyperdisk 附加至 A4 執行個體。
支援密集分配和拓樸圖的排程功能:當您佈建使用 Cluster Director 提供的功能和服務的 A4 執行個體時,可以要求密集分配容量的區塊。主機電腦會以實體方式彼此靠近分配,並以資源區塊形式佈建,並與動態 ML 網路結構互連,以盡量減少網路跳躍次數,並盡可能縮短延遲時間。此外,您還可以取得節點和叢集層級的拓樸資訊,用於工作安排。
A4 機型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3e) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
a4-highgpu-8g |
8 | 1,440 | 224 | 3,968 | 12,000 | 10 | 3,600 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理需要大量圖形處理能力的工作負載所需的較高頻寬。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A4 的限制
- 您只能使用 A4 機器類型的支援的佈建選項,才能要求容量。
- 使用 A4 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A4 機器類型。
- 您無法在使用 A4 機器類型的 VM 上使用 永久磁碟 (地區性或區域性)。
- A4 機器類型僅適用於 Emerald Rapids CPU 平台。
- 您無法將現有 VM 的機器類型變更為 A4 機器類型。您只能建立新的 A4 VM。使用 A4 機器類型建立 VM 後,就無法變更機器類型。
- A4 機器類型不支援單租戶。
- 您無法在 A4 機器類型上執行 Windows 作業系統。
A4 系列支援的磁碟類型
A4 虛擬機器可使用下列區塊儲存類型:
- Hyperdisk Balanced (
hyperdisk-balanced
):這是開機磁碟唯一支援的磁碟類型 - Hyperdisk Extreme (
hyperdisk-extreme
) - 本機 SSD:會自動新增至使用任何 A4 機器類型建立的 VM
每個 VM 的磁碟數量上限* | ||||||
---|---|---|---|---|---|---|
機器類型 | 所有磁碟† | Hyperdisk Balanced | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的本機 SSD |
a4-highgpu-8g |
128 | 128 | 不適用 | 不適用 | 8 | 32 |
*Hyperdisk 的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「Hyperdisk 定價」。
†這項限制適用於 Hyperdisk,但不適用於本機 SSD 磁碟。
磁碟和容量限制
如果機器類型支援,您可以在 VM 上混合使用 Hyperdisk 和 Persistent Disk 磁碟區,但須遵守下列限制:
- 每個 VM 的 Hyperdisk 和 Persistent Disk 磁碟區總數不得超過 128 個。
所有磁碟類型的磁碟總容量上限 (以 TiB 為單位) 不得超過:
對於 vCPU 數量少於 32 的機器類型:
- 所有 Hyperdisk 或所有 Persistent Disk 的大小上限為 257 TiB
- 混合使用 Hyperdisk 和 Persistent Disk 時的大小上限為 257 TiB
對於搭載 32 個以上 vCPU 的機器類型:
- 所有 Hyperdisk 的 512 TiB
- 512 TiB (適用於 Hyperdisk 和 Persistent Disk 的混合型磁碟)
- 所有永久磁碟的總容量上限為 257 TiB
如要進一步瞭解容量限制,請參閱「 Hyperdisk 大小和附件限制」和「永久磁碟最大容量」。
A3 機器系列
A3 機器系列最多可搭載 224 個 vCPU 和 2,944 GB 記憶體。這個機器系列經過最佳化調整,適用於運算和記憶體密集型、網路受限的機器學習訓練,以及 HPC 工作負載。A3 機器系列提供 A3 Ultra、A3 Mega、A3 High 和 A3 Edge 機型。
使用 A3 機器類型建立的 VM 執行個體提供下列功能:
功能 | A3 Ultra | A3 Mega、High、Edge |
---|---|---|
GPU 加速 | 連接 NVIDIA H200 SXM GPU,每個 GPU 提供 141 GB 的 GPU 記憶體,並提供更大、更快速的記憶體,以支援大型語言模型和 HPC 工作負載。 |
連接 NVIDIA H100 SXM GPU,每個 GPU 提供 80 GB 的 GPU 記憶體,非常適合大型的轉換器式語言模型、資料庫和 HPC。 |
Intel Xeon 可擴充處理器 | 第 5 代 Intel Xeon 可擴充處理器 (Emerald Rapids),提供高達 4.0 GHz 的持續單一核心最高 Turbo 時脈頻率。如要進一步瞭解此處理器,請參閱「CPU 平台」。 |
第 4 代 Intel Xeon 可擴充處理器 (Sapphire Rapids),提供高達 3.3 GHz 的持續單一核心最高 Turbo 時脈速度。如要進一步瞭解此處理器,請參閱「CPU 平台」。 |
業界領先的 NVLink 擴充性 | NVIDIA H200 GPU 提供最高 900 GB/s 的 GPU NVLink 頻寬,且為單向頻寬。 在系統中,8 個 GPU 之間採用全對全 NVLink 拓撲時,NVLink 總頻寬可達 7.2 TB/s。 |
NVIDIA H100 GPU 提供的 GPU NVLink 頻寬峰值為 450 GB/s,單向傳輸。 在系統中,8 個 GPU 之間採用全對全 NVLink 拓撲時,NVLink 總頻寬可達 7.2 TB/s。 |
加強型網路 | 針對這個機器類型,透過匯集乙太網路的 RDMA (RoCE) 技術,可將 NVIDIA ConnectX-7 網路介面卡 (NIC) 與資料中心全域四向軌道對齊網路相結合,提升網路效能。透過利用 RDMA over Converged Ethernet (RoCE),a3-ultragpu-8g 機器類型在叢集內的執行個體之間,可獲得比其他 A3 機器類型高出許多的處理量。
|
|
網路速度提升 | 與前一代 A2 機器系列相比,網路速度最高可提升 4 倍。 如要進一步瞭解網路,請參閱「網路頻寬和 GPU」。 |
與前一代 A2 機器系列相比,網路速度最高可達 2.5 倍。 如要進一步瞭解網路,請參閱「網路頻寬和 GPU」。 |
虛擬化最佳化 | A3 執行個體的 Peripheral Component Interconnect Express (PCIe) 拓撲可提供更準確的區域資訊,工作負載可利用這些資訊來最佳化資料傳輸。 GPU 也會公開函式層級重設 (FLR),以便從失敗中順利復原,並支援原子作業,在特定情況下改善並行性。 |
|
支援本機 SSD、永久磁碟和 Hyperdisk |
本機 SSD 可用於快速的暫存磁碟,或用於將資料餵入 GPU 時,防止 I/O 瓶頸。本機 SSD 的連接方式如下:
您也可以將最多 512 TiB 的永久磁碟和 Hyperdisk 連接至這些系列中的機器類型,以便為需要更高儲存空間效能的應用程式提供服務。部分機器類型也支援最多 257 TiB 的永久磁碟。 |
|
密集配置政策支援 | 可讓您進一步控管執行個體在資料中心內的實際位置。 這可讓位於單一可用區內的執行個體享有更低的延遲時間和更高的頻寬。 詳情請參閱「 關於密集配置政策」。 |
A3 Ultra 機型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3e) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-ultragpu-8g |
8 | 1128 | 224 | 2,952 | 12,000 | 10 | 3,600 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A3 Ultra 限制
- 您只能使用 A3 Ultra 機器類型的支援的佈建選項,要求容量。
- 使用 A3 Ultra 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區中使用 A3 Ultra 機器類型。
- 您無法在使用 A3 Ultra 機器類型的 VM 上使用 永久磁碟 (地區性或區域性)。
- A3 Ultra 機器類型僅適用於 Emerald Rapids CPU 平台。
- 您無法將現有 VM 的機器類型變更為 A3 Ultra 機器類型。您只能建立新的 A3-ultra VM。使用 A3 Ultra 機器類型建立 VM 後,就無法變更機器類型。
- A3 Ultra 機型不支援單租戶。
- 您無法在 A3 Ultra 機型上執行 Windows 作業系統。
A3 Mega 機型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 9 | 1,800 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A3 Mega 限制
- 您只能使用 A3 Mega 機器類型的支援的佈建選項,才能要求容量。
- 使用 A3 Mega 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 Mega 機器類型。
- 您無法在使用 A3 Mega 機器類型的 VM 上使用地區性永久磁碟。
- A3 Mega 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法將現有 VM 的機器類型變更為 A3 Mega 機器類型。您只能建立新的 A3 級別 VM。使用 A3 Mega 機器類型建立虛擬機器後,就無法變更機器類型。
- A3 Mega 機器類型不支援單租戶。
- 您無法在 A3 Mega 機器類型上執行 Windows 作業系統。
A3 High 機型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1,500 | 1 | 50 |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3,000 | 1 | 100 |
a3-highgpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 5 | 1,000 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A3 High 限制
- 您只能使用 A3 高效能機器類型的支援的佈建選項,要求容量。
- 使用 A3 High 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 High 機器類型。
- 您無法在採用 A3 High 機器類型的 VM 上使用地區性永久磁碟。
- A3 High 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法將現有 VM 的機器類型變更為 A3 High 機器類型。您只能建立新的 A3-high VM。使用 A3 High 機器類型建立 VM 後,就無法變更機器類型。
- A3 High 機型不支援單一租戶。
- 您無法在 A3 High 機型上執行 Windows 作業系統。
- 對於
a3-highgpu-1g
、a3-highgpu-2g
和a3-highgpu-4g
機器類型,適用下列限制:-
針對這些機器類型,您必須使用 Spot VM 或使用動態工作負載排程器 (DWS) 的功能 (例如 MIG 中的大小調整要求) 建立 VM。如需這兩種選項的詳細操作說明,請參閱以下內容:
- 如要建立 Spot VM,請在建立加速器最佳化 VM 時,將佈建模型設為
SPOT
。 - 如要在使用 DWS 的 MIG 中建立調整大小要求,請參閱「建立含 GPU VM 的 MIG」一文。
- 如要建立 Spot VM,請在建立加速器最佳化 VM 時,將佈建模型設為
- 您無法搭配這些機器類型使用 Hyperdisk Balanced。
- 無法建立保留項目。
-
針對這些機器類型,您必須使用 Spot VM 或使用動態工作負載排程器 (DWS) 的功能 (例如 MIG 中的大小調整要求) 建立 VM。如需這兩種選項的詳細操作說明,請參閱以下內容:
A3 Edge 機器類型
機型 | GPU 數量 | GPU 記憶體* (GB HBM3) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 實體 NIC 數量 | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1,872 | 6,000 | 5 |
|
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A3 Edge 限制
- 您只能使用 A3 Edge 機器類型的支援的佈建選項,才能要求容量。
- 使用 A3 Edge 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A3 Edge 機器類型。
- 您無法在使用 A3 Edge 機器類型的 VM 上使用地區永久磁碟。
- A3 Edge 機器類型僅適用於 Sapphire Rapids CPU 平台。
- 您無法將現有 VM 的機器類型變更為 A3 Edge 機器類型。您只能建立新的 A3-edge VM。使用 A3 Edge 機器類型建立 VM 後,就無法變更機器類型。
- A3 Edge 機器類型不支援單租戶。
- 您無法在 A3 Edge 機器類型上執行 Windows 作業系統。
A3 系列支援的磁碟類型
A3 Ultra
A3 Ultra 虛擬機器可使用下列區塊儲存類型:
- Hyperdisk Balanced (
hyperdisk-balanced
):這是開機磁碟唯一支援的磁碟類型 - Hyperdisk Balanced High Availability (
hyperdisk-balanced-high-availability
) - Hyperdisk Extreme (
hyperdisk-extreme
) - 本機 SSD:會自動新增至使用任何 A3 機器類型建立的 VM
每個 VM 的磁碟數量上限* | |||||||
---|---|---|---|---|---|---|---|
機器 類型 |
所有磁碟† | Hyperdisk Balanced | Hyperdisk Balanced High Availability | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的 本機 SSD 磁碟 |
a3-ultragpu-8g |
128 | 128 | 128 | 不適用 | 不適用 | 8 | 32 |
*Hyperdisk 的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「Hyperdisk 定價」。
†這項限制適用於 Hyperdisk,但不適用於本機 SSD 磁碟。
A3 Mega
A3 Mega VM 可使用下列區塊儲存空間類型:
- 已平衡的永久磁碟 (
pd-balanced
) - SSD (效能) 永久磁碟 (
pd-ssd
) - Hyperdisk Balanced (
hyperdisk-balanced
) - Hyperdisk Balanced High Availability (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisk Extreme (
hyperdisk-extreme
) - Hyperdisk Throughput (
hyperdisk-throughput
) - 本機 SSD:會自動新增至使用任何 A3 機器類型建立的 VM
每個 VM 的磁碟數量上限* | |||||||
---|---|---|---|---|---|---|---|
機器 類型 |
所有磁碟† | Hyperdisk Balanced | Hyperdisk Balanced High Availability | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的 本機 SSD 磁碟 |
a3-megagpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
*Hyperdisk 和永久磁碟的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「永久磁碟和 Hyperdisk 定價」。
†這項限制適用於 Persistent Disk 和 Hyperdisk,但不適用於本機 SSD 磁碟。
A3 高
A3 High 虛擬機器可使用下列區塊儲存類型:
- 已平衡的永久磁碟 (
pd-balanced
) - SSD (效能) 永久磁碟 (
pd-ssd
) - Hyperdisk Balanced (
hyperdisk-balanced
):僅支援a3-highgpu-8g
- Hyperdisk Balanced High Availability (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisk Extreme (
hyperdisk-extreme
) - Hyperdisk Throughput (
hyperdisk-throughput
) - 本機 SSD:會自動新增至使用任何 A3 機器類型建立的 VM
每個 VM 的磁碟數量上限* | |||||||
---|---|---|---|---|---|---|---|
機器 類型 |
所有磁碟† | Hyperdisk Balanced | Hyperdisk Balanced High Availability | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的 本機 SSD 磁碟 |
a3-highgpu-1g |
128 | 不適用 | 32 | 64 | 64 | 不適用 | 2 |
a3-highgpu-2g |
128 | 不適用 | 32 | 64 | 64 | 不適用 | 4 |
a3-highgpu-4g |
128 | 不適用 | 32 | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
*Hyperdisk 和永久磁碟的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「永久磁碟和 Hyperdisk 定價」。
†這項限制適用於 Persistent Disk 和 Hyperdisk,但不適用於本機 SSD 磁碟。
A3 Edge
A3 Edge VM 可使用下列區塊儲存空間類型:
- 已平衡的永久磁碟 (
pd-balanced
) - SSD (效能) 永久磁碟 (
pd-ssd
) - Hyperdisk Balanced (
hyperdisk-balanced
) - Hyperdisk Balanced High Availability (
hyperdisk-balanced-high-availability
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisk Extreme (
hyperdisk-extreme
) - Hyperdisk Throughput (
hyperdisk-throughput
) - 本機 SSD:會自動新增至使用任何 A3 機器類型建立的 VM
每個 VM 的磁碟數量上限* | |||||||
---|---|---|---|---|---|---|---|
機器類型 | 所有磁碟† | Hyperdisk Balanced | Hyperdisk Balanced High Availability | Hyperdisk Throughput | Hyperdisk ML | Hyperdisk Extreme | 已連結的本機 SSD |
a3-edgegpu-8g |
128 | 32 | 32 | 64 | 64 | 8 | 16 |
*Hyperdisk 和永久磁碟的使用費用會分開計算,不包含在機器類型定價中。如需磁碟定價資訊,請參閱「永久磁碟和 Hyperdisk 定價」。
†這項限制適用於 Persistent Disk 和 Hyperdisk,但不適用於本機 SSD 磁碟。
磁碟和容量限制
如果機器類型支援,您可以在 VM 上混合使用 Hyperdisk 和 Persistent Disk 磁碟區,但須遵守下列限制:
- 每個 VM 的 Hyperdisk 和 Persistent Disk 磁碟區總數不得超過 128 個。
所有磁碟類型的磁碟總容量上限 (以 TiB 為單位) 不得超過:
對於 vCPU 數量少於 32 的機器類型:
- 所有 Hyperdisk 或所有 Persistent Disk 的大小上限為 257 TiB
- 混合使用 Hyperdisk 和 Persistent Disk 時的大小上限為 257 TiB
對於搭載 32 個以上 vCPU 的機器類型:
- 所有 Hyperdisk 的 512 TiB
- 512 TiB (適用於 Hyperdisk 和 Persistent Disk 的混合型磁碟)
- 所有永久磁碟的總容量上限為 257 TiB
如要進一步瞭解容量限制,請參閱「 Hyperdisk 大小和附件限制」和「永久磁碟最大容量」。
A2 機器系列
A2 機器系列提供 A2 Standard 和 A2 Ultra 機器類型。這些機器類型可搭載 12 到 96 個 vCPU,最多可提供 1,360 GB 記憶體。
使用 A2 機器類型建立的 VM 執行個體提供下列功能:
GPU 加速:每個 A2 執行個體都搭載 NVIDIA A100 GPU。這兩種選項分別適用於 A100 40GB 和 A100 80GB。
業界領先的 NVLink 規模,可提供 600 GBps 的 GPU 對 GPU NVLink 頻寬。舉例來說,配備 16 個 GPU 的系統,其總 NVLink 頻寬可達 9.6 TBps。這 16 個 GPU 可做為單一高效能加速器使用,並提供統一記憶體空間,提供最高 10 petaFLOPS 的運算效能,以及最高 20 petaFLOPS 的推論運算效能,可用於人工智慧、深度學習和機器學習工作負載。
提升運算速度:相較於前一代 NVIDIA V100 GPU,連接的 NVIDIA A100 GPU 可將運算速度提升至最高 10 倍。
使用 A2 機器系列,您最多可獲得 100 Gbps 的網路頻寬。
本機 SSD、Persistent Disk 和 Hyperdisk 支援:如要使用快速的暫存磁碟,或在防止 I/O 瓶頸的同時將資料餵入 GPU,A2 機器類型支援本機 SSD,如下所示:
- 對於 A2 Standard 機器類型,您可以在建立執行個體時,新增高達 3,000 GiB 的本機 SSD。
- 對於 A2 Ultra 機器類型,本機 SSD 會在您建立執行個體時自動連接。
對於需要更高儲存空間效能的應用程式,您也可以將最多 257 TiB 的永久磁碟和 512 TiB 的 Hyperdisk 磁區連接至 A2 執行個體。
密集配置政策支援:讓您進一步控管執行個體在資料中心內的實際位置。這樣一來,位於單一可用區的執行個體就能享有更低的延遲時間和更高的頻寬。詳情請參閱「使用密集配置政策減少延遲時間」。
下列機器類型適用於 A2 機器系列。
A2 Ultra 機型
這些機器類型連接固定數量的 A100 80GB GPU。本機 SSD 會自動連接至使用 A2 Ultra 機器類型建立的執行個體。
機型 | GPU 數量 | GPU 記憶體* (GB HBM3) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1,500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1,360 | 3,000 | 100 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與執行個體的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A2 Ultra 限制
- 您只能使用 A2 Ultra 機器類型的支援的佈建選項,才能要求容量。
- 使用 A2 Ultra 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定地區和區域中使用 A2 Ultra 機器類型。
- A2 Ultra 機器類型僅適用於 Cascade Lake 平台。
- 如果 VM 使用 A2 Ultra 機器類型,您就無法變更機器類型。如果您需要使用其他 A2 Ultra 機器類型或任何其他機器類型,就必須建立新的 VM。
- 您無法將任何其他機器類型變更為 A2 Ultra 機器類型。如果您需要使用 A2 Ultra 機器類型的 VM,則必須建立新的 VM。
- 您無法在使用 A2 Ultra 機型類型的 Windows VM 上,對已連結的本機 SSD 進行快速格式化。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定
format fs=ntfs label=tmpfs
,才能進行完整格式化。
A2 標準機型
這些機器類型連接固定數量的 A100 40GB GPU。
機型 | GPU 數量 | GPU 記憶體* (GB HBM3) |
vCPU 數量† | VM 記憶體 (GB) | 已連結的本機 SSD (GiB) | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | 是 | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | 是 | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | 是 | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | 是 | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1,360 | 是 | 100 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與執行個體的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
A2 Standard 限制
- 您只能使用 A2 標準機器類型的支援的佈建選項,要求容量。
- 使用 A2 Standard 機器類型的 VM 不會獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區使用 A2 標準機器類型。
- A2 Standard 機器類型僅適用於 Cascade Lake 平台。
- 如果 VM 使用 A2 Standard 機器類型,您只能從一個 A2 Standard 機器類型切換至另一個 A2 Standard 機器類型。您無法變更為任何其他機器類型。詳情請參閱「修改加速器最佳化 VM」。
- 您無法使用 Windows 作業系統搭配 <codea2-megagpu-16g< code="" dir="ltr" translate="no"> A2 Standard 機器類型。使用 Windows 作業系統時,請選擇其他 A2 標準機器類型。</codea2-megagpu-16g<>
- 您無法在使用 A2 Standard 機器類型的 Windows VM 上,快速格式化已連結的本機 SSD。如要格式化這些本機 SSD,您必須使用 diskpart 公用程式並指定
format fs=ntfs label=tmpfs
,才能進行完整格式化。 - A2 Standard 機器類型不支援單租戶。
A2 系列支援的磁碟類型
A2 執行個體可使用下列區塊儲存類型:
- Hyperdisk ML (
hyperdisk-ml
) - 已平衡的永久磁碟 (
pd-balanced
) - SSD (效能) 永久磁碟 (
pd-ssd
) - 標準永久磁碟 (
pd-standard
) - 本機 SSD:會自動連接至使用 A2 Ultra 機型建立的執行個體。
如果機器類型支援,您可以在 VM 上混合使用 Hyperdisk 和 Persistent Disk 磁碟區,但須遵守下列限制:
- 每個 VM 的 Hyperdisk 和 Persistent Disk 磁碟區總數不得超過 128 個。
所有磁碟類型的磁碟總容量上限 (以 TiB 為單位) 不得超過:
對於 vCPU 數量少於 32 的機器類型:
- 所有 Hyperdisk 或所有 Persistent Disk 的大小上限為 257 TiB
- 混合使用 Hyperdisk 和 Persistent Disk 時的大小上限為 257 TiB
對於搭載 32 個以上 vCPU 的機器類型:
- 所有 Hyperdisk 的 512 TiB
- 512 TiB (適用於 Hyperdisk 和 Persistent Disk 的混合型磁碟)
- 所有永久磁碟的總容量上限為 257 TiB
如要進一步瞭解容量限制,請參閱「 Hyperdisk 大小和附件限制」和「永久磁碟最大容量」。
G2 機器系列
G2 機器系列可用於具備 4 到 96 個 vCPU 和最多 432 GB 記憶體的標準機器類型。這個機器系列已針對推論和圖形工作負載進行最佳化。G2 機器系列提供單一標準機器類型,可搭配多種設定使用。
使用 G2 機器類型建立的 VM 執行個體提供下列功能:
GPU 加速:每個 G2 機器類型都配備 NVIDIA L4 GPU。
改善推論率:G2 機器類型支援 FP8 (8 位元浮點) 資料類型,可加快 ML 推論率並降低記憶體需求。
新一代圖形效能:NVIDIA L4 GPU 採用第三代 RT 核心和 NVIDIA DLSS 3 (深度學習超級取樣) 技術,可將圖形效能提升至最高 3 倍。
高效能網路頻寬:使用 G2 機器類型時,您可以獲得最高 100 Gbps 的網路頻寬。
支援本機 SSD、永久磁碟和 Hyperdisk:您最多可在 G2 執行個體中新增 3,000 GiB 的本機 SSD。這可用於快速的暫存磁碟,或用於將資料提供至 GPU 時,防止 I/O 瓶頸。
您也可以將 Hyperdisk 和 Persistent Disk 磁碟區連接至 G2 執行個體,以便應用程式使用更多永久儲存空間。儲存空間容量上限取決於 VM 的 vCPU 數量。詳情請參閱「支援的磁碟類型」。
密集配置政策支援:讓您進一步控管執行個體在資料中心內的實際位置。這樣一來,位於單一可用區的執行個體就能享有更低的延遲時間和更高的頻寬。詳情請參閱「使用密集配置政策減少延遲時間」。
G2 機型
每個 G2 機器類型連接固定數量的 NVIDIA L4 GPU 和 vCPU。每個 G2 機型也都有預設記憶體和自訂記憶體範圍。自訂記憶體範圍會定義您可為每個機器類型分配給 VM 的記憶體容量。您可以在建立 VM 時指定自訂記憶體。
機型 | GPU 數量 | GPU 記憶體* (GB GDDR6) | vCPU 數量† | 預設的 VM 記憶體 (GB) | 自訂 VM 記憶體範圍 (GB) | 支援的最大本機 SSD (GB) | 網路頻寬上限 (Gbps)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | 16 到 32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | 32 至 54 歲 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | 48 到 54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | 54 至 64 歲 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | 96 到 108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | 96 到 128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | 192 至 216 | 1,500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | 384 到 432 | 3,000 | 100 |
*GPU 記憶體是 GPU 裝置上的記憶體,可用於暫時儲存資料。它與 VM 的記憶體分開,專門用於處理圖像密集型工作負載的較高頻寬需求。
†在其中一個可用的 CPU 平台上,我們會以單一硬體超執行緒的形式提供 vCPU。
‡最大傳出頻寬不得超過指定數字。實際輸出頻寬取決於目的地 IP 位址和其他因素。請參閱「網路頻寬」。
G2 限制
- 您只能使用 G2 機器類型的支援的佈建選項來要求容量。
- 您不會針對使用 G2 機器類型的 VM 獲得續用折扣和彈性承諾使用折扣。
- 您只能在特定區域和可用區中使用 G2 機器類型。
- G2 機器類型僅適用於 Cascade Lake 平台。
- 使用 G2 標準機器類型的 VM 不支援標準永久磁碟 (
pd-standard
)。如要瞭解支援的磁碟類型,請參閱「G2 支援的磁碟類型」。 - 您無法在 G2 機器類型上建立多重執行個體 GPU。
- 如果您需要變更 G2 VM 的機器類型,請參閱「修改加速器最佳化 VM」。
- 您無法將深度學習 VM 映像檔用作使用 G2 機器類型的 VM 的開機磁碟。
- Container-Optimized OS 目前的預設驅動程式不支援在 G2 機器類型上執行的 L4 GPU。Container-Optimized OS 也只支援特定的驅動程式。如果您想在 G2 機器類型上使用 Container-Optimized OS,請參閱以下注意事項:
- 請使用支援 NVIDIA 建議最低驅動程式版本
525.60.13
或更新版本的 Container-Optimized OS 版本。詳情請參閱 Container-Optimized OS 版本資訊。 - 安裝驅動程式時,請指定適用於 L4 GPU 的最新可用版本。例如:
sudo cos-extensions install gpu -- -version=525.60.13
。
- 請使用支援 NVIDIA 建議最低驅動程式版本
- 在下列情況下,您必須使用 Google Cloud CLI 或 REST 建立 G2 VM:
- 您想指定自訂記憶體值。
- 您想自訂可見的 CPU 核心數量。
G2 系列支援的磁碟類型
G2 執行個體可使用下列區塊儲存類型:
- 已平衡的永久磁碟 (
pd-balanced
) - SSD (效能) 永久磁碟 (
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Hyperdisk Throughput (
hyperdisk-throughput
) - 本機 SSD
如果機器類型支援,您可以在 VM 上混合使用 Hyperdisk 和 Persistent Disk 磁碟區,但須遵守下列限制:
- 每個 VM 的 Hyperdisk 和 Persistent Disk 磁碟區總數不得超過 128 個。
所有磁碟類型的磁碟總容量上限 (以 TiB 為單位) 不得超過:
對於 vCPU 數量少於 32 的機器類型:
- 所有 Hyperdisk 或所有 Persistent Disk 的大小上限為 257 TiB
- 混合使用 Hyperdisk 和 Persistent Disk 時的大小上限為 257 TiB
對於搭載 32 個以上 vCPU 的機器類型:
- 所有 Hyperdisk 的 512 TiB
- 512 TiB (適用於 Hyperdisk 和 Persistent Disk 的混合型磁碟)
- 所有永久磁碟的總容量上限為 257 TiB
如要進一步瞭解容量限制,請參閱「 Hyperdisk 大小和附件限制」和「永久磁碟最大容量」。