关于 MIG 中的调整大小请求


本文档介绍托管式实例组 (MIG) 中请求调整大小的工作原理及其限制。使用调整大小请求,在 MIG 中一次性创建具有 GPU 的虚拟机 (VM) 实例。

在以下场景中,通过调整大小请求在 MIG 中一次性创建虚拟机非常有用:

  • 如果您希望 GPU 虚拟机仅在特定时间运行,调整大小请求会增加获得这些需求量很高的资源的几率。

  • 如果您希望使用确切数量的虚拟机来运行作业,调整大小请求可帮助您一次性创建所有虚拟机。这有助于避免为 Compute Engine 在您等待所有资源可用期间创建的部分容量支付不必要的费用。

调整大小请求的工作原理

以下部分概要介绍了调整大小请求的工作原理。

创建时

创建调整大小请求时,您必须指定以下属性:

  • resizeBy:您希望在请求中一次性创建的虚拟机数量。

  • requestedRunDuration:作为请求一部分创建的虚拟机必须运行的时长。运行时长必须介于 10 分钟到 7 天之间。在运行时长结束时,MIG 会自动删除创建的虚拟机。

创建之后

您创建调整大小请求后,Compute Engine 会按如下方式更改其状态:

  • CREATING:Compute Engine 正在创建调整大小请求,MIG 的目标大小会增加请求中指定的虚拟机数量,并且 MIG 会创建状态为 CREATING 的托管式实例。这些托管式实例代表 MIG 在调整大小请求成功时创建的虚拟机。

  • ACCEPTED:请求已创建并已接受。底层调度器机制(动态工作负载调度器 [DWS])会根据资源可用性和请求中指定的运行时长来调度请求的资源创建。如果您缺少所请求资源的配额或资源暂时不可用,则 DWS 会保留请求,直到您有足够的配额且资源可用。

  • SUCCEEDED:MIG 同时创建了请求的虚拟机数量。虚拟机会一直运行,直到 MIG 在指定运行时长结束后删除它们或直到您删除它们。

  • FAILED:由于技术错误,大小调整请求失败,并且 Compute Engine 会按请求的虚拟机数量减少 MIG 的目标大小。

  • CANCELLED:用户取消了调整大小请求。取消调整大小请求会阻止 MIG 创建请求的资源。取消调整大小请求后,Compute Engine 会按请求的虚拟机数量减小 MIG 的目标大小,并会在 14 天后自动删除该请求。(可选)您可以在 Compute Engine 自动删除调整大小请求之前删除调整大小请求

如果您删除包含调整大小请求的 MIG,此操作还会删除 MIG 中的所有调整大小请求和虚拟机。但是,如果您在 MIG 创建虚拟机以满足大小调整请求时删除 MIG,则 Compute Engine 将等待该 MIG 创建完请求的虚拟机数量以及大小调整请求的状态转换为 SUCCEEDED,然后再删除 MIG。

限制

以下部分概述了在 MIG 中创建调整大小请求时的限制。

对于调整大小请求

对于调整大小请求,存在以下限制:

  • 您只能使用调整大小请求获取 GPU 虚拟机。

  • 您只能取消已接受 (ACCEPTED) 的调整大小请求。

  • 只有在调整大小请求成功 (SUCCEEDED)、失败 (FAILED) 或用户取消该请求 (CANCELLED) 后,您才能将其删除。

对于实例模板

对于您要创建调整大小请求的 MIG 中使用的实例模板,存在以下限制:

对于 MIG

对于您要创建调整大小请求的 MIG,存在以下限制:

针对请求的运行时长的 GPU 虚拟机的配额

配置为在预定义的运行时间(7 天或更短时间)后自动删除的 GPU 虚拟机可以使用抢占式分配配额或标准分配配额。此行为旨在帮助您提高临时但不中断的工作负载的分配配额的可获取性。如需详细了解此行为,请参阅 GPU 虚拟机和抢占式分配配额

价格

创建、取消或删除调整大小请求不会产生任何费用。您只需为通过调整大小请求创建的虚拟机支付费用,从 MIG 创建虚拟机的那一刻起,到 MIG 在其运行时长结束时自动删除虚拟机或您手动删除虚拟机为止。

如果 MIG 仅创建了部分请求的虚拟机,而未能创建其余虚拟机,那么在 MIG 自动删除这些虚拟机之前,您可能仍需为已创建的虚拟机支付费用。

后续步骤