カレンダー モードでの将来の予約リクエストについて


このドキュメントでは、カレンダー モードでの将来の予約リクエストの概要について説明します。Compute Engine でリソースを予約するさまざまな方法については、予約タイプを選択するをご覧ください。

GPU または TPU が接続された仮想マシン(VM)インスタンスを作成するための容量を取得するには、カレンダー モードで将来の予約リクエストを使用します。 Google Cloudがリクエストを承認すると、Compute Engine は選択した日時と期間で予約済みリソースをプロビジョニングします。予約したリソースを使用して、次のワークロードを実行する GPU VM または TPU VM を作成できます。

  • モデルの事前トレーニング ジョブ

  • モデルのファインチューニング ジョブ

  • ハイ パフォーマンス コンピューティング(HPC)シミュレーション ワークロード

  • 推論ワークロードの短期的な増加の見込み

カレンダー モードでリクエストを作成する

以降のセクションでは、リソースの可用性を表示する方法と、カレンダー モードで将来の予約リクエストを作成するときに指定する詳細について説明します。

リソースの将来の可用性を確認する

カレンダー モードで将来の予約リクエストを作成する前に、リージョン内の次のリソースの将来の可用性を確認できます。

  • GPU VM の場合、最大 60 日前

  • TPU の場合: 最大 120 日前

Compute Engine は、Dynamic Workload Scheduler(DWS)を使用して、リクエストされたリソースがいつ使用可能になるかを確認します。リクエストを作成するときに、使用可能であることを確認したリソースの数、タイプ、予約期間を指定します。この情報を提供すると、 Google Cloud がリクエストを承認する可能性が高くなります。

リクエストのプロパティを定義する

カレンダー モードで将来の予約リクエストを作成する場合は、次のプロパティを指定する必要があります。

  • [自動削除] をクリックします。このプロパティは、予約が完全に使用されていない場合でも、リクエストの自動作成(自動作成)予約を終了時間に Compute Engine が削除するかどうかを決定します。カレンダー モードでリクエストを作成するには、自動削除オプションを有効にする必要があります。

  • 消費タイプ。このプロパティは、VM が自動作成された予約を使用する方法を定義します。カレンダー モードでリクエストを作成する場合は、明示的に対象となる予約を作成することを指定する必要があります。この設定は、予約をターゲットとする VM のみが予約を使用できることを意味します。

  • デプロイタイプ。このプロパティは、予約済みリソースのコロケーションを定義します。カレンダー モードでリクエストを作成する場合は、リソースを密にデプロイするように指定する必要があります。このタイプのデプロイでは、ネットワーク レイテンシを最小限に抑えるために、リソースが互いに近い場所に配置されます。

  • name:リクエストの名前。プロジェクト内で一意である必要があります。

  • リソース数。リクエストされた開始時間に予約する GPU VM または TPU の数。

  • 計画ステータス。このプロパティは、リクエストをすぐに Google Cloud に送信して審査を受けるか、下書きとして保存して後で送信するかを定義します。カレンダー モードでリクエストを作成する場合は、審査のためにリクエストをすぐに送信するように指定する必要があります。

  • 予約モード。このプロパティは、リソースを予約する方法を定義します。カレンダー モードのリクエストでは、CALENDAR に設定する必要があります。

  • 予約名。 Google Cloud がリクエストを承認した場合に Compute Engine が自動的に作成する予約の名前。

  • 共有タイプ。このプロパティは、組織内の他のプロジェクトが承認済みリクエスト用に自動作成された予約を使用できるかどうかを定義します。次のいずれかのオプションを指定できます。

    • 単一プロジェクト。予約済みの容量を使用できるのは、プロジェクトのみです。

    • 共有。予約した容量は、組織内の他の最大 100 個のプロジェクトと共有できます。このオプションを指定する場合は、自動作成された予約を共有するプロジェクトを指定する必要があります。詳細については、共有予約のベスト プラクティスをご覧ください。

  • 予約期間。Compute Engine がリクエストされた容量をプロビジョニングし、使用できる日時。予約期間には次のものが含まれます。

    • 開始時刻。予約済み容量の使用を開始するタイミング。予約するリソースに基づいて、開始時間はリクエストの作成と送信の時点から次のいずれかの値以上にする必要があります。

      • GPU VM の場合: 87 時間(3 日と 15 時間)

      • TPU の場合: 24 時間

    • 終了時間。リクエストした容量が予約されなくなった場合。このとき、Compute Engine は自動作成された予約を削除し、VM に指定した終了アクションに基づいて、予約を使用する VM を停止または削除します。

  • リソース プロパティ。予約する GPU VM または TPU のハードウェア要件。VM は、プロパティが予約のプロパティと一致する場合にのみ、予約を使用できます。詳細については、予約を使用するための要件をご覧ください。

  • ワークロード タイプTPU v5e を予約する場合は、ワークロード タイプに基づいて容量を予約する方法を指定する必要があります。

    • バッチ。機械学習(ML)トレーニング ワークロードなど、単一または複数のオペレーションで大量のデータを処理するワークロード。

    • 処理中。同時リクエストを処理し、ネットワーク レイテンシを最小限に抑える必要があるワークロード(ML 推論ワークロードなど)。

  • ゾーン。容量を予約するゾーン。

審査リクエスト プロセス

カレンダー モードで将来の予約リクエストを使用して容量を予約するには、リクエストを作成して Google Cloud に送信し、審査を受ける必要があります。リクエストを作成して送信すると、 Google Cloud が 1 分以内にリクエストを審査し、次のいずれかの処理が行われます。

  • Google Cloud がリクエストを承認する: Compute Engine はリクエストされたリソースを予約し、承認後 1 分以内に空の予約を自動的に作成します。リクエストの開始時に、Compute Engine は予約内の TPU の数を増やして、リクエストされた容量をプロビジョニングします。

  • エラーが発生する。リクエストのゾーンに十分なリソースがないため、リクエストは失敗します。将来のリソースの空き状況を再度確認し、新しいリクエストを作成して審査に提出することをおすすめします。

リクエストのライフサイクル

次の図は、Compute Engine がカレンダー モードの将来の予約リクエストを設定できるさまざまな状態を示しています。

カレンダー モードの将来の予約リクエストが移行するさまざまな状態を示すフローチャート。

上の図に示されている状態とイベントのフローは次のとおりです。

  • PENDING_APPROVAL: 審査のリクエストを作成して送信しました。1 分以内に、 Google Cloud がリクエストを承認します。

  • APPROVED: Google Cloud がリクエストを承認しました。1 分以内に、Compute Engine は空の予約を自動的に作成し、リクエストの状態を PROCURING に変更します。

  • PROCURING: Compute Engine は、予約済みリソースのプロビジョニングをスケジュールします。リクエストの開始時刻より前に、リクエストの状態が PROVISIONING に変わります。

  • PROVISIONING: Compute Engine は、自動作成された予約で予約済み TPU の数を増やして、予約済みリソースをプロビジョニングしています。リクエストの開始時刻になると、リクエストの状態が FULFILLED に変わります。

  • FULFILLED: Compute Engine は予約済みリソースをプロビジョニングし、その料金が請求されます。リクエストの終了時間まで VM を作成することで、自動作成された予約を使用できます。

リクエストの終了時に、Compute Engine はリクエストと自動作成された予約を削除します。また、VM に指定した終了アクションに基づいて、予約を消費している VM を停止または削除します。

プロビジョニングされた容量を使用する

Google Cloud がカレンダー モードで将来の予約リクエストを承認すると、Compute Engine は次の特性を持つ予約を自動的に作成します。

  • 自動作成された予約には予約済みの GPU VM または TPU がありません。まだ使用できません。

  • 自動作成された予約は、リクエストで指定された VM または TPU のプロパティを継承します。

リクエストの開始時間に、Compute Engine は自動作成された予約で GPU VM または TPU の数を増やして、リクエストされた容量をプロビジョニングします。その後、次のすべての条件を満たす GPU VM または TPU VM を作成して、予約を使用できます。

予約が完全に消費されるか、リクエストの終了時間まで VM を作成できます。リクエストの終了時に、Compute Engine は自動作成された予約を削除し、予約を使用する VM を停止または削除します。

割り当て

カレンダー モードの将来の予約リクエストでは、予約バインド プロビジョニング モデルを使用する必要があります。このモデルでは、リソースを予約するために Compute Engine の割り当ては必要ありません。ただし、リクエストを作成する前に、VM の作成時に予約の一部ではないリソース(ディスクや IP アドレスなど)に十分な割り当てがあることを確認してください。

料金

カレンダー モードで将来の予約リクエストを作成しても、料金は発生しません。代わりに、次の状況で料金が発生します。

  • Compute Engine がリクエストされた容量をプロビジョニングします。リクエストが FULFILLED 状態になると、DWS の料金に従って、プロビジョニングされたリソースに対して課金されます。この料金モデルでは、vCPU、GPU、TPU を割引価格で提供します。

  • 予約の対象外のリソースを使用する。自動作成された予約を使用する VM を作成する場合、使用されたリソースに対して再度課金されることはありません。ディスクや IP アドレスなど、予約の一部ではないリソースに対してのみ課金されます。

リクエストの終了時刻に課金が停止します。この時点で、Compute Engine は自動作成された予約を削除し、予約を使用する VM を停止または削除します。

制限事項

以降のセクションでは、カレンダー モードでの将来の予約リクエストの制限事項について説明します。

すべてのリクエストの制限事項

カレンダー モードの将来の予約リクエストには、次の制限があります。

  • リソースは 1 ~ 90 日間の期間で予約できます。

  • リクエストを作成して送信した後は、リクエストをキャンセル、削除、変更することはできません。

GPU VM のリクエストの制限事項

GPU VM は次のようにのみ予約できます。

  • リクエストごとに 1 ~ 80 個の GPU VM を予約できます。

  • 次のマシンシリーズを予約できます。

  • GPU VM を予約できるのは、特定のゾーンのみです。

TPU のリクエストに関する制限事項

TPU を予約できるのは、次の方法のみです。

  • リクエストごとに 1、4、8、16、32、64、128、256、512、1,024 個の TPU チップを予約できます。

  • 次の TPU バージョンを予約できます。

  • サービング(SERVING)ワークロード タイプ用に予約できる TPU v5e チップは 1 個、4 個、8 個のみです。

  • TPU を予約できるのは、次のゾーンのみです。

    • TPU v6e の場合:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • TPU v5p の場合:

      • us-east5-a
    • TPU v5e の場合:

      • バッチ(BATCH)ワークロード タイプの場合: us-west4-b

      • サービング(SERVING)ワークロード タイプの場合: us-central1-a

自動作成されたすべての予約の制限事項

リクエスト用に自動作成された予約には、次の制限があります。

  • 予約を変更できるのは、次の場合に限られます。

    • Vertex AI ジョブが予約を使用することを許可または禁止します。

    • 予約開始時間後。

  • 確約利用割引(CUD)または継続利用割引(SUD)を予約に適用することはできません。

  • 予約を削除することはできません。Compute Engine は予約の終了時に予約を削除します。

次のステップ