Cloud TPU 使用选项

本文档介绍了 Cloud TPU 支持的使用选项。使用选项是用于请求容量的方法。选择使用选项时，请考虑以下因素：

您需要容量的速度
您需要容量的时长
您需要固定还是灵活时间段的容量
您的容量是否可能被抢占
价格

如果您使用的是 Cloud TPU API，则对于每种使用方法，您都需要为要使用的 Cloud TPU 核心数设置按需配额或抢占式配额。每个 TPU 版本的默认按需配额和抢占式配额各不相同。如需了解详情，请参阅 Cloud TPU 配额。

如果您将 TPU 与 Google Kubernetes Engine (GKE) 搭配使用，则使用 Compute Engine API 配额，这是一种不同的配额。如需详细了解您为 GKE 中的 TPU 使用的配额，请参阅确保您有 TPU 配额。

使用选项	工作原理	最佳用途	支持的 TPU 版本和可用区	Cloud TPU API 的配额类型
为期一年或更长时间的未来预留	您提前请求一年或更长时间的 TPU 资源。在该时间段内，这些资源会预留供您专门使用。预留可极高地保障容量，经济高效，价格低于按需资源。 TPU 的未来预留附加了承诺使用折扣 (CUD)。CUD 提供折扣价格，以换取购买承诺使用合约。如需了解详情，请参阅申请为期一年或更长时间的未来预留。	未来预留（期限为一年或更长时间）非常适合长时间运行的训练作业和推理工作负载。	所有 TPU 版本：请参阅 TPU 区域和可用区	按需配额
最长 90 天的未来预留（日历模式下）（预览版）	您可以针对特定开始时间和时长（介于 1 到 90 天之间）请求 TPU 资源。在该时间段内，这些资源会预留供您专门使用。预留可极高地保障容量，经济高效，价格低于按需资源。如需了解详情，请参阅在日历模式下请求最长 90 天的未来预留。	日历模式下的未来预留非常适合需要精确开始时间且具有明确时长的训练和实验工作负载。	用于训练和服务的 v6e (Trillium)：asia-northeast1-b、us-east5-a 用于训练和服务的 v5p：us-east5-a 用于训练的 v5e：us-west4-a 用于服务的 v5e：us-central1-a	无需配额
按需	您请求的 TPU 资源可尽快使用，并且可使用多长时间由您决定。按需的灵活性最高。按需资源不会被抢占，但无法保证有足够的可用 TPU 资源来满足您的请求。创建 TPU 资源时，按需是默认的。如需详细了解如何创建和使用按需 TPU，请参阅管理 TPU 资源。	按需非常适合需要灵活结束时间的紧急作业和工作负载。	所有 TPU 版本：请参阅 TPU 区域和可用区	按需配额
灵活启动（预览版）	您可以针对特定时长（最长 7 天）请求 TPU 资源，而无需提前预留容量。 TPU 灵活启动虚拟机来自专用容量池，因此这些资源的可用性高于按需。如需详细了解如何使用 TPU 灵活启动虚拟机，请参阅请求 TPU 灵活启动虚拟机。如需详细了解如何将 TPU 灵活启动虚拟机与 Google Kubernetes Engine (GKE) 搭配使用，请参阅关于使用灵活启动预配模式进行 GPU 和 TPU 预配。	灵活启动非常适合实验、小规模测试、为推理工作负载动态预配 TPU、模型微调以及运行时间不到 7 天的工作负载。	v6e (Trillium)：asia-northeast1-b、us-east5-a v5p：us-east5-a v5e：us-west4-a	抢占式配额
Spot	您请求的 TPU 资源可能会被抢占。 Spot 虚拟机的价格远低于按需资源。与按需资源相比，Spot 虚拟机可能更容易获得，但可能随时被抢占（关停）。运行时时长没有限制。如需详细了解 TPU Spot 虚拟机，请参阅管理 TPU Spot 虚拟机。	Spot 非常适合调度优先级较低的工作负载，例如模型预训练、模型微调，以及对可用性中断具有容忍性的模拟作业。	所有 TPU 版本：请参阅 TPU 区域和可用区	抢占式配额

后续步骤

通过以下资源开始使用 TPU：