请求未来预留(最长 90 天,日历模式)

如需针对特定开始时间和时长(介于 1 到 90 天之间)预留 TPU,请请求日历模式下的未来预留。在此模式下,您可以在动态工作负载调度器的支持下,提前最多 120 天查看 TPU 可用性,并根据自己的安排请求容量。您可以使用 Compute Engine API 或 Google Cloud 控制台请求日历模式下的未来预留。如果获得批准,Compute Engine 会自动在您选择的日期和时间创建预留。然后,您可以使用 Create Node APIQueued Resources API 预配 TPU,从而使用预留。在预留期结束时,Compute Engine 会自动删除该预留以及使用该预留的所有 TPU。

请求未来预留(最长 90 天,采用日历模式)非常适合需要精确开始时间且具有明确时长的训练和实验工作负载。

如需了解详情,请参阅日历模式下的未来预留请求简介

查看 TPU 的未来可用性

您可以提前 1 到 120 天查看 TPU 的可用性。如需了解详情,请参阅查看资源的未来可用性

在日历模式下创建未来预留请求

您可以使用 Compute Engine API 或 Google Cloud 控制台以日历模式请求未来预留。如需了解详情,请参阅在日历模式下创建未来预留请求

限制

在日历模式下为 TPU 请求未来预留时,需要遵循以下限制:

  • 您无法修改、取消或删除未来预留请求。
  • 您必须指定预留时长,最短为 1 天,最长为 90 天。
  • 您只能在指定可用区预留以下 TPU 版本:
    • TPU v6e:asia-northeast1-b、us-east5-a、us-east5-b
    • TPU v5p:us-east5-a
    • TPU v5e:us-west4-b (BATCH)、us-central1-a (SERVING)

如需了解每个请求允许的 TPU 芯片数量,请参阅 Compute Engine 文档中的限制

后续步骤