Compute Engine 实例预配模型


本文档介绍了 Compute Engine 实例的预配模型。如需详细了解部署选项,请参阅为工作负载选择 Compute Engine 部署策略

预配模型决定了实例的可用性、生命周期和价格。了解这些模型后,您可以为自己的工作负载选择最佳方案。

可用的预配模型

创建计算实例时,您可以指定以下预配模型之一。如果您未指定预配模型,Compute Engine 将默认使用标准预配模型。

  • 标准

  • Spot

  • 灵活启动(预览版

  • 受预留约束

下表可帮助您比较每种预配模型的用例和价格:

标准 Spot 灵活启动(预览版 受预留约束
摘要
  • 根据资源可用性,您可以立即创建实例。
  • 您可以控制何时停止或删除实例。
  • 根据资源可用性,您可以立即创建实例。
  • 您可以控制何时停止或删除实例。不过,Compute Engine 也可能会随时停止或删除实例以回收容量。
  • 创建可用区级托管式实例组 (MIG) 后,您可以请求 Compute Engine 添加挂接了 GPU 的实例到该组中。Compute Engine 会根据资源可用性安排实例的预配。
  • 您可以控制何时删除实例。不过,您无法停止、暂停或重新创建这些实例。实例最多运行 7 天。然后,Compute Engine 会自动删除这些实例。
  • 您可以请求在未来某个日期预留容量,以便创建挂接了 GPU 或 TPU 的实例。如果 Google Cloud 批准了您的请求,则会创建一个预留,您可以在指定的日期开始使用该预留。
  • 在预留批准期间,您可以根据需要停止、重启、删除并重新创建实例,以使用预留。预留期限结束后,Compute Engine 会自动删除预留以及使用该预留的所有实例。
使用场景 非常适合需要稳定性和持续运行的工作负载,例如:
  • 网络服务器
  • 数据库
  • 企业应用
  • 开发和测试
非常适合可容忍中断的工作负载,例如:
  • 批处理
  • 高性能计算 (HPC)
  • 持续集成和持续部署 (CI/CD)
  • 数据分析
  • 媒体编码
  • 在线推理
需要稳定性且运行时间不超过 7 天的工作负载,例如:
  • 小型模型预训练
  • 模型微调
  • HPC 模拟
  • 批量推理
非常适合需要稳定性和特定运行时的工作负载,例如:
  • 对于持续时间不超过 90 天的工作负载
    • 模型预训练作业
    • 模型微调作业
    • HPC 模拟工作负载
    • 预计短期内会增加的推理工作负载
  • 对于超过 90 天的工作负载
    • 训练工作负载
    • 推理工作负载
价格 您需要按标准价格付费。如需了解详情,请参阅虚拟机实例价格 大多数 vCPU、GPU 和本地 SSD 可享受 60-91% 的折扣。如需了解详情,请参阅 Spot 虚拟机价格 根据实例使用的机器家族或 TPU 版本,您可以获得高达 53% 的 vCPU、GPU 和 TPU 折扣。请参阅动态工作负载调度器 (DWS) 价格 根据实例使用的机器家族,您可以获得高达 53% 的 vCPU 和 GPU 折扣。如需了解详情,请参阅加速器优化虚拟机的价格
配额 创建实例时,系统会消耗标准配额。 创建实例时,系统会消耗抢占式配额。如果您的项目缺少抢占式配额,则会使用标准配额。Google Cloud 免费层级赠金不适用于 Spot 虚拟机。 当 MIG 向该组添加实例时,抢占型配额会被消耗。如果您的项目缺少抢占式配额,则会使用标准配额。 配额不适用于预留绑定预配模型。

实例可用性和生命周期

下表显示了每种预配模型的计算实例可用性和生命周期:

标准 Spot 灵活启动(预览版 受预留约束
创建前提条件 无创建前提条件。 无创建前提条件。 无创建前提条件。 如需创建实例,您必须先通过创建针对多个块的未来预留请求来预留容量。在您指定的日期和时间,Compute Engine 会预配您请求的容量。然后,您可以通过创建实例来开始使用该容量。
支持的机器系列 您可以使用任何机器系列,但 A4 和 A3 Ultra 除外。 您可以使用任何机器系列,但以下机器系列除外:
  • M2 和 M3
  • 裸金属实例
您只能使用以下机器系列:
根据您预留容量以创建虚拟机的方式,您只能使用以下机器系列:
实例可用性 只要您请求的资源可用,就可以随时创建实例。 只要您请求的资源可用,就可以随时创建实例。 您只能通过在 MIG 中创建调整大小请求来创建实例。Compute Engine 会使用 DWS 来根据资源可用性安排预配您请求的容量。DWS 有助于确保您可以获得 GPU 等高需求资源。 仅在为未来日期预留容量后,您才能创建实例。在您指定的日期,Compute Engine 会提供您请求的容量,然后您可以使用这些容量创建实例。 如果您预留 TPU,Compute Engine 会使用 DWS 来预配您请求的容量。DWS 有助于确保您可以获得 TPU 等高需求资源。
实例生命周期 您可以控制何时停止或删除实例,但在以下情况下除外:
  • 如果实例使用的机器类型不支持实时迁移,则 Compute Engine 会在主机维护事件期间停止您的实例。
  • 在极少数情况下,实例可能会因主机错误而停止。
您可以控制何时停止或删除实例,但在以下情况下除外:
  • Compute Engine 可能会随时停止或删除实例以收回容量。此过程称为抢占
  • 如果实例使用的机器类型不支持实时迁移,则 Compute Engine 会在主机维护事件期间停止您的实例。
  • 在极少数情况下,实例可能会因主机错误而停止。
预配的实例会在您选择的运行时长内运行,最长可达七天。您无法停止、暂停或重新创建实例。

Compute Engine 会在发生以下任一情况时删除实例:
  • 您请求删除实例。
  • 实例达到运行时长。
您可以控制何时停止或删除实例,但在以下情况下除外:
  • Compute Engine 会在主机维护事件期间停止您的实例。
  • 用于预配您请求容量的自动创建预留到达其承诺预留期的结束时间。届时,Compute Engine 会自动删除该预留以及使用该预留的所有实例。
  • 在极少数情况下,实例可能会因主机错误而停止。

后续步骤