使用预留
如果您有 TPU 预留,则可以使用预留的资源创建与预留的属性匹配的 TPU。此操作称为“消耗预订”。如需了解在使用 GKE 时如何使用 TPU 预留,请参阅 GKE 文档中的 TPU 预留。
使用特定预留
使用 gcloud alpha compute tpus queued-resources
create
命令创建资源时,请使用 --reservation
标志指定要使用的预留的名称。对于在日历模式下创建的未来预订,您还必须将 --provisioning-model
标志设置为 reservation-bound
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
替换以下占位符变量:
- QUEUED_RESOURCE_ID:已排队的资源请求的用户分配 ID。
- TPU_NAME:用户为 TPU 分配的 ID(名称),该 ID 是在分配已排队的资源请求时创建的。
- ZONE:要在其中创建 TPU 虚拟机的可用区。如需详细了解支持的可用区,请参阅区域和可用区。
- ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本。
- SOFTWARE_VERSION:Cloud TPU 软件版本。
- RESERVATION_URL:预订的网址。请指定以下某个值:
- 如果预订在您的项目中:
RESERVATION_NAME
- 如果预留位于其他项目中,并且您的项目可以消耗它:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- 如果预订在您的项目中:
使用任何匹配的预留
您可以使用 --reserved
标志根据加速器类型、项目 ID 和区域自动确定要使用的预留。
CreateNode
如需使用 CreateNode API 消耗任何匹配的预留,请使用带有 --reserved
标志的 gcloud
alpha compute tpus tpu-vm create
命令:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
替换以下占位符变量:
- TPU_NAME:TPU 的名称。
- ZONE:要用于创建 TPU VM 的可用区,该可用区必须与预订的可用区一致。
- ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本。
- SOFTWARE_VERSION:Cloud TPU 软件版本。
已排队的资源
如需使用队列化资源消耗任何匹配的预留,请将 gcloud alpha compute tpus
queued-resources create
命令与 --reserved
标志结合使用:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
替换以下占位符变量:
- QUEUED_RESOURCE_ID:已排队的资源请求的用户分配 ID。
- TPU_NAME:用户为 TPU 分配的 ID(名称),该 ID 是在分配已排队的资源请求时创建的。
- ZONE:要用于创建 TPU VM 以及预订所在的可用区。
- ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本。
- SOFTWARE_VERSION:Cloud TPU 软件版本。
查看预留使用情况
您只能通过其所有者项目查看共享预留的使用情况。如果您位于使用方项目中,则必须切换到所有者项目才能查看预留用量。
如需查看预留的使用情况,请使用 gcloud compute
reservations describe
命令:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
替换以下占位符变量:
- RESERVATION_NAME:预订的名称。
- PROJECT_ID:包含预留的项目的 ID。
- ZONE:预留所在的可用区。
如需列出项目中的所有预订,请使用 gcloud compute reservations
list
命令:
gcloud compute reservations list --project=PROJECT_ID
替换以下占位符变量:
- PROJECT_ID:项目的 ID。