使用预留

如果您有 TPU 预留,则可以使用预留的资源创建与预留的属性匹配的 TPU。此操作称为“消耗预订”。如需了解在使用 GKE 时如何使用 TPU 预留,请参阅 GKE 文档中的 TPU 预留

使用特定预留

使用 gcloud alpha compute tpus queued-resources create 命令创建资源时,请使用 --reservation 标志指定要使用的预留的名称。对于在日历模式下创建的未来预订,您还必须将 --provisioning-model 标志设置为 reservation-bound

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

替换以下占位符变量:

  • QUEUED_RESOURCE_ID:已排队的资源请求的用户分配 ID。
  • TPU_NAME:用户为 TPU 分配的 ID(名称),该 ID 是在分配已排队的资源请求时创建的。
  • ZONE:要在其中创建 TPU 虚拟机的可用区。如需详细了解支持的可用区,请参阅区域和可用区
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本
  • RESERVATION_URL:预订的网址。请指定以下某个值:
    • 如果预订在您的项目中:RESERVATION_NAME
    • 如果预留位于其他项目中,并且您的项目可以消耗它:projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

使用任何匹配的预留

您可以使用 --reserved 标志根据加速器类型、项目 ID 和区域自动确定要使用的预留。

CreateNode

如需使用 CreateNode API 消耗任何匹配的预留,请使用带有 --reserved 标志gcloud alpha compute tpus tpu-vm create 命令

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

替换以下占位符变量:

  • TPU_NAME:TPU 的名称。
  • ZONE:要用于创建 TPU VM 的可用区,该可用区必须与预订的可用区一致。
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本

已排队的资源

如需使用队列化资源消耗任何匹配的预留,请将 gcloud alpha compute tpus queued-resources create 命令--reserved 标志结合使用:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

替换以下占位符变量:

  • QUEUED_RESOURCE_ID:已排队的资源请求的用户分配 ID。
  • TPU_NAME:用户为 TPU 分配的 ID(名称),该 ID 是在分配已排队的资源请求时创建的。
  • ZONE:要用于创建 TPU VM 以及预订所在的可用区。
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本

查看预留使用情况

您只能通过其所有者项目查看共享预留的使用情况。如果您位于使用方项目中,则必须切换到所有者项目才能查看预留用量。

如需查看预留的使用情况,请使用 gcloud compute reservations describe 命令

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

替换以下占位符变量:

  • RESERVATION_NAME:预订的名称。
  • PROJECT_ID:包含预留的项目的 ID。
  • ZONE:预留所在的可用区。

如需列出项目中的所有预订,请使用 gcloud compute reservations list 命令

gcloud compute reservations list --project=PROJECT_ID

替换以下占位符变量:

  • PROJECT_ID:项目的 ID。

后续步骤