カレンダー モードを使用して短期間の予約をリクエストする

特定の開始時間から特定の期間(1~90 日間)TPU を予約するには、カレンダー モードで将来の予約をリクエストします。このモードは Dynamic Workload Scheduler をベースにしており、最大 120 日前から TPU の可用性を確認し、スケジュールに基づいて容量をリクエストできます。カレンダー モードで将来の予約をリクエストするには、Compute Engine API または Google Cloud コンソールを使用します。承認されると、選択した日時に対する予約が Compute Engine によって自動的に作成されます。その後、Create Node API または Queued Resources API を使用して TPU をプロビジョニングすることで、予約を使用できます。Compute Engine は、予約期間の終了時に予約と、その予約を使用する TPU を自動的に削除します。

カレンダー モードで将来の予約をリクエストすることは、正確な開始時間と定義された期間が必要なトレーニング ワークロードとテスト ワークロードに適しています。

詳細については、カレンダー モードでの将来の予約リクエストについてをご覧ください。

TPU の今後の提供状況を確認する

TPU の可用性は 1~120 日前に確認できます。詳細については、リソースの将来の可用性を確認するをご覧ください。

カレンダー モードで将来の予約リクエストを作成する

カレンダー モードで将来の予約をリクエストするには、Compute Engine API または Google Cloud コンソールを使用します。詳細については、カレンダー モードで将来の予約リクエストを作成するをご覧ください。

制限事項

TPU のカレンダー モードで将来の予約をリクエストする場合、次の制限があります。

  • 将来の予約リクエストを変更、キャンセル、削除することはできません。
  • 予約期間は 1~90 日間にする必要があります。
  • 指定されたゾーンで予約できるのは、次の TPU バージョンのみです。
    • TPU v6e: asia-northeast1-b、us-east5-a
    • TPU v5p: us-east5-a
    • TPU v5e: us-west4-b(BATCH)、us-central1-a(SERVING

リクエストあたりの TPU チップの許容数については、Compute Engine ドキュメントの制限事項をご覧ください。

次のステップ