本文說明如何在附加 GPU 的虛擬機器 (VM) 執行個體群組 (MIG) 中建立調整大小要求。如要進一步瞭解大小調整要求,請參閱「關於 MIG 中的大小調整要求」。
建立 MIG 大小調整要求有助於您取得 GPU 等需求量高的資源,並一次建立確切數量的 VM,以便降低成本。如要建立可使用 Cluster Director 提供的功能和服務的 MIG 調整大小要求,請參閱 AI Hypercomputer 說明文件中的「建立 MIG 和調整大小要求」。
事前準備
- 如要確保您有足夠的 GPU 配額可用於要求的資源,請查看 GPU 配額。
-
如果尚未設定,請先設定驗證機制。「驗證」是指驗證身分,以便存取 Google Cloud 服務和 API 的程序。如要從本機開發環境執行程式碼或範例,請選取下列任一選項,以便對 Compute Engine 進行驗證:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
如要建立執行個體範本:
compute.instanceTemplates.create
在專案中 -
如要建立可用區 MIG,請按照下列步驟操作:
compute.instanceGroupManagers.create
在專案中 -
如要建立 MIG 大小調整要求,請按照下列步驟操作:
compute.instanceGroupManagers.update
在專案中 前往 Google Cloud 控制台的「Instance Templates」(執行個體範本) 頁面。
按一下「建立執行個體範本」。「Create an instance template」(建立執行個體範本) 頁面隨即開啟。
在「Name」欄位中,輸入執行個體範本的名稱。
在「位置」部分中,選取下列其中一個選項:
如要建立區域執行個體範本,請選取「Regional (recommended)」(區域 (建議),然後選取要建立範本的區域。
如要建立全域執行個體範本,請選取「Global」。
在「機器設定」部分中,執行下列操作:
按一下「GPU」分頁標籤。
在「GPU type」清單中選取 GPU 類型。
在「Number of GPUs」(GPU 數量) 清單中,選取 GPU 數量。
選用:如果 GPU 型號支援NVIDIA RTX 虛擬工作站 (vWS),用於處理圖形工作負載,且您打算執行需要大量圖形的工作負載,請選取「啟用虛擬工作站 (NVIDIA GRID)」。
在「Machine type」(機器類型) 部分中,選取機器類型。
在「Provisioning model」(佈建模型) 部分執行下列操作:
在「VM 佈建模型」清單中,選取「彈性啟動」。
如要為透過執行個體範本建立的 VM 設定執行時間長度,請在「輸入小時數」欄位中輸入小時數。這個值必須介於一小時 (
1
) 和七天 (168
) 之間。
選用步驟:如要變更預設值開機磁碟類型或映像檔,請在「Boot disk」(開機磁碟) 部分中按一下「Change」(變更)。然後按照提示變更啟動磁碟。
按一下 [建立]。
--maintenance-policy
標記設為TERMINATE
。--instance-termination-action
標記設為DELETE
。--max-run-duration
標記。--provisioning-model
標記設為FLEX_START
。--reservation-affinity
標記設為none
。INSTANCE_TEMPLATE_NAME
:要建立的執行個體範本名稱。IMAGE_PROJECT
:包含圖片的圖片專案,例如debian-cloud
。如要進一步瞭解支援的圖像專案,請參閱「公開圖像」。IMAGE_FAMILY
:圖片群組。這會指定最新的非淘汰 OS 映像檔。舉例來說,如果您指定debian-12
,系統會使用 Debian 12 映像檔系列中的最新版本。如要進一步瞭解如何使用映像檔系列,請參閱「映像檔系列最佳做法」。REGION
:要建立執行個體範本的區域。MACHINE_TYPE
:GPU 機器類型。如果您指定 N1 機器類型,請加入--accelerator
標記,以定義要連結至 VM 的 GPU 數量和類型。RUN_DURATION
:您希望要求的 VM 執行多久。您必須將值格式化為天數、小時、分鐘或秒數,後面分別加上d
、h
、m
和s
。舉例來說,如果要指定 30 分鐘,請指定30m
;如果要指定一天、兩小時、三分鐘和四秒,請指定1d2h3m4s
。值必須介於 10 分鐘至七天。如要建立地區執行個體範本,請使用
beta.regionInstanceTemplates.insert
方法:如要建立全域執行個體範本,請使用
beta.instanceTemplates.insert
方法:scheduling.onHostMaintenance
欄位設為TERMINATE
。scheduling.instanceTerminationAction
欄位設為DELETE
。scheduling.maxRunDuration
欄位。scheduling.provisioningModel
欄位設為FLEX_START
。reservationAffinity.consumeReservationType
欄位設為NO_RESERVATION
。PROJECT_ID
:建立執行個體範本的專案 ID。REGION
:要建立執行個體範本的區域。INSTANCE_TEMPLATE_NAME
:要建立的執行個體範本名稱。IMAGE_PROJECT
:包含圖片的圖片專案,例如debian-cloud
。如要進一步瞭解支援的圖像專案,請參閱「公開圖像」。IMAGE
:指定下列其中一個值:MACHINE_TYPE
:GPU 機器類型。如果您指定 N1 機器類型,請在要求主體中加入guestAccelerators
欄位,藉此定義要附加至 VM 的 GPU 數量和類型。RUN_DURATION
:您希望要求的 VM 執行的時間長度,以秒為單位。這個值必須介於600
(600 秒,即 10 分鐘) 和604800
(604,800 秒,即 7 天) 之間。將 MIG 的更新類型設為投機 (預設)。
如果您已在 MIG 中設定自動調度資源,請刪除自動調度資源設定。
如果您使用區域性 MIG,請將目標分配型態設為
ANY_SINGLE_ZONE
。前往 Google Cloud 控制台的「Instance groups」(執行個體群組) 頁面。
按一下「建立執行個體群組」。「Create instance group」(建立執行個體群組) 頁面隨即開啟。
在「Name」 欄位中,輸入 MIG 的名稱。
選取執行個體範本前,您必須刪除自動調度資源設定並關閉修復功能,步驟如下:
如要刪除自動調度資源設定,請按照下列步驟操作:
在「Autoscaling」部分,按一下「Autoscaling mode」清單,然後點選「Delete autoscaling configuration」。
在確認對話方塊中按一下「刪除」。
如要關閉修復功能,請在「VM 執行個體生命週期」部分中,按一下「發生錯誤時的預設動作」清單,然後選取「不執行任何動作」。
返回「Instance template」欄位。在「Instance template」清單中,選取您在先前章節中建立的執行個體範本。如果選取區域執行個體範本,系統會將「區域」清單設為範本的區域。
執行下列其中一個步驟:
如要在建立 MIG 時建立大小調整要求,請執行下列操作:
在「Number of instances」欄位中,輸入要一次建立的 VM 數量。
勾選「透過大小調整要求一次建立多個 VM」核取方塊。
選用步驟:如要為 VM 指定與執行個體範本中設定的不同執行時間長度,請在「Requested run duration」欄位和「Unit」清單中指定時間長度。時長必須介於 1 小時至 7 天之間。
如要在建立 MIG 後建立大小調整要求,請在「執行個體數量」欄位中輸入
0
。
在「Location」(位置) 部分中,指定要建立區域性或地區性 MIG,如下所示:
如要建立可用區 MIG,請選取「單一可用區」。或者,如要建立區域性 MIG,請選取「多可用區」。
選取 MIG 的「Region」(區域)和「Zone」(可用區)。
如果您要建立區域性 MIG,請執行下列步驟:
在「Target distribution shape」(目標分配型態) 欄位中,選取「Any single zone」(任何單一可用區)。
在隨即顯示的對話方塊中,按一下「Disable instance redistribution」(停用執行個體重新分配)。
按一下 [建立]。
如要建立區域 MIG,請執行下列指令:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
如要建立地區 MIG,請執行下列指令:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --region=REGION \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none \ --default-action-on-vm-failure=do_nothing
INSTANCE_GROUP_NAME
:要建立的 MIG 名稱。INSTANCE_TEMPLATE_URL
:您在先前章節建立的執行個體範本部分網址。如果您想使用區域執行個體範本建立 MIG,則只能在範本的區域內建立 MIG。請指定下列其中一個值:區域執行個體範本:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
全域執行個體範本:
INSTANCE_TEMPLATE_NAME
ZONE
:建立 MIG 的可用區。REGION
:要建立 MIG 的區域。如要建立區域 MIG,請使用
instanceGroupManagers.insert
方法傳送POST
要求,如下所示:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
如要建立區域性 MIG,請使用
regionInstanceGroupManagers.insert
方法傳送POST
要求,如下所示:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE" }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
PROJECT_ID
:您在上一節中建立的執行個體範本所在專案的 ID。INSTANCE_TEMPLATE_URL
:您在先前章節建立的執行個體範本的部分網址。如果您想使用區域執行個體範本建立 MIG,則只能在範本的區域內建立 MIG。請指定下列其中一個值:區域執行個體範本:
regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
全域執行個體範本:
global/instanceTemplates/INSTANCE_TEMPLATE_NAME
ZONE
:建立 MIG 的可用區。REGION
:要建立 MIG 的區域。INSTANCE_GROUP_NAME
:要建立的 MIG 名稱。前往 Google Cloud 控制台的「Instance groups」(執行個體群組) 頁面。
在「Name」欄中,按一下要建立調整大小要求的 MIG 名稱。
MIG 的總覽頁面隨即開啟。
在「大小調整要求」列中,按一下
「編輯大小調整要求」。按一下
「新調整大小要求」。畫面上會顯示「New resize requests」窗格。
在「名稱」欄位中輸入調整大小要求的名稱。
在「Number of additional instances needed」(額外需要的執行個體數量) 欄位中,輸入要一次新增至 MIG 的 VM 數量。
選用:如要為 VM 指定與執行個體範本中設定的時間長度不同的執行時間長度,請在「Requested run duration」和「Unit」欄位中指定時間長度。時間範圍必須介於一小時至七天。
按一下 [建立]。
如要在區域 MIG 中建立調整大小要求,請使用
instance-groups managed resize-requests create
指令。gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
如要在區域性 MIG 中建立調整大小要求,請使用
beta instance-groups managed resize-requests create
指令。gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
INSTANCE_GROUP_NAME
:在 MIG 中設定用於建立大小調整要求的名稱。RESIZE_REQUEST_NAME
:大小調整要求的名稱,在指定的 MIG 中不得重複。否則,建立調整大小要求會失敗。COUNT
:一次新增至 MIG 的 VM 數量。ZONE
:MIG 所在的可用區。REGION
:MIG 所在的區域。如果您想為 VM 指定的執行時間長度與 MIG 執行個體範本中設定的不同,請加入
--requested-run-duration
標記。如果工作負載需要特定的 VM 名稱,您可以使用
beta instance-groups managed resize-requests create
指令指定要建立的 VM 名稱清單。在指令中,將--resize-request
旗標替換為--instances
旗標。如要在區域 MIG 中建立調整大小要求,請使用
instanceGroupManagerResizeRequests.insert
方法傳送POST
要求。POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
如要在區域 MIG 中建立調整大小要求,請使用
beta.regionInstanceGroupManagerResizeRequests.insert
方法傳送POST
要求。PROJECT_ID
:指定 MIG 所在專案的 ID。ZONE
:MIG 所在的可用區。REGION
:MIG 所在的區域。INSTANCE_GROUP_NAME
:在 MIG 中設定用於建立調整大小要求的名稱。RESIZE_REQUEST_NAME
:大小調整要求的名稱,在指定的 MIG 中不得重複。否則,建立大小調整要求會失敗。COUNT
:一次新增至 MIG 的 VM 數量。如果您想為 VM 指定與 MIG 執行個體範本中設定的不同執行時間長度,請在要求主體中加入
requestedRunDuration
欄位。如果工作負載需要特定的 VM 名稱,您可以指定要建立的 VM 名稱清單。如要這麼做,請針對區域 MIG 向
beta.regionInstanceGroupManagerResizeRequests.insert
方法傳送POST
要求,或針對區域 MIG 向beta.instanceGroupManagerResizeRequests.insert
方法傳送要求。在要求主體中,將resizeBy
欄位替換為instanceNames
欄位。瞭解如何查看 MIG 和受管理 VM 的相關資訊。
REST
如要在本機開發環境中使用本頁的 REST API 範例,請使用您提供給 gcloud CLI 的憑證。
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
詳情請參閱 Google Cloud 驗證說明文件中的「驗證以使用 REST」。
必要的角色
如要取得建立 MIG 調整大小要求所需的權限,請要求管理員為您授予專案的 Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) IAM 角色。如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」。這個預先定義的角色包含建立 MIG 大小調整要求所需的權限。如要查看確切的必要權限,請展開「必要權限」部分:
所需權限
您必須具備下列權限,才能建立 MIG 調整大小要求:
為大小調整要求準備 MIG
如要建立 MIG 大小調整要求,您必須按照下列各節所述設定執行個體範本和 MIG。
建立執行個體範本
如要建立已設定為建立 MIG 大小調整要求的執行個體範本,請在範本中指定下列項目:
如要建立設為建立 MIG 大小調整要求的執行個體範本,請選取下列任一選項:
主控台
gcloud
如要建立設定為建立 MIG 大小調整要求的執行個體範本,請使用
beta instance-templates create
指令搭配下列旗標:以下指令會建立區域執行個體範本。如要建立全球執行個體範本,請使用相同指令,但不含
--instance-template-region
旗標。gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-termination-action=DELETE \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --max-run-duration=RUN_DURATION \ --provisioning-model=FLEX_START \ --reservation-affinity=none
更改下列內容:
REST
如要建立在 MIG 中建立調整大小要求的執行個體範本,請向下列任一方法提出
POST
要求:在要求主體中加入下列欄位:
舉例來說,如要建立區域執行個體範本,請提出以下
POST
要求:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "instanceTerminationAction": "DELETE", "maxRunDuration": { "seconds": RUN_DURATION }, "onHostMaintenance": "TERMINATE", "provisioningModel": "FLEX_START" } } }
更改下列內容:
如要進一步瞭解如何建立執行個體範本,請參閱「建立執行個體範本」。
建立或更新 MIG
按照上一節所述建立執行個體範本後,請使用該執行個體範本建立 MIG,或更新 MIG。此外,您必須執行下列操作,為 MIG 準備調整大小要求:
如要建立與調整大小要求相容的 MIG,請選取下列任一選項:
主控台
gcloud
使用
instance-groups managed create
指令,並將--default-action-on-vm-failure
旗標設為do_nothing
。如果您要建立區域性 MIG,則必須將--target-distribution-shape
旗標設為any-single-zone
,並將--instance-redistribution-type
旗標設為none
。更改下列內容:
REST
更改下列內容:
在 MIG 中建立大小調整要求
建立 MIG 調整大小要求前,請確認您已按照上一節所述準備 MIG。
建立大小調整要求後,當所有要求的資源都已可用時,MIG 就會一次建立所要求的 VM 數量。在指定的執行時間結束後,MIG 會刪除 VM,或是您刪除 VM 之前,VM 會持續執行。
如要在 MIG 中建立調整大小要求,請選取下列任一選項。如要透過大小調整要求,將具有特定名稱的 VM 新增至 MIG,請使用 gcloud CLI 或 REST API。
主控台
gcloud
更改下列內容:
您也可以採取下列做法:
REST
在要求主體中加入下列內容:
{ "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
更改下列內容:
您也可以採取下列做法:
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-06-16 (世界標準時間)。
-