このドキュメントでは、Compute Engine インスタンスの容量を予約するために使用できるさまざまな予約タイプについて説明します。インスタンスの作成に使用できるリソースの詳細については、Compute Engine インスタンスをご覧ください。
予約を使用すると、必要なときに同じハードウェア(メモリと vCPU)とオプションのリソース(GPU、TPU、ローカル SSD ディスク)を使用してインスタンスを作成するためのリソースを確保できます。予約には次の利点があります。
容量の確実性が高い: 次のような将来の需要の増加に対応するためにリソースを予約します。
成長
計画的または想定外の使用量の急増
大規模な移行
バックアップと障害復旧
独占的アクセス: 予約すると、他のユーザーが予約済みリソースを使用できなくなります。
継承されたプロパティ: 予約は、選択したマシン ファミリーと同じプロパティを継承します。
容量を予約したら、その予約と一致するインスタンスを作成できます。これらのインスタンスを作成しても追加料金は発生しません。料金は、予約の一部ではないリソース(ディスクや IP アドレスなど)に対してのみ発生します。
制限事項
すべての予約タイプには次の制限があります。
予約はゾーン固有のリソースです。
予約済み容量を使用して、次の Compute Engine リソースを作成することはできません。
Spot VM またはプリエンプティブル インスタンス
単一テナントノード
予約の種類を選択する
次の図は、ワークロードのニーズに最適な Compute Engine 予約タイプを選択するのに役立ちます。
上の図の質問は次のとおりです。
容量がすぐに必要ですか?
「はい」の場合: 次の質問に進みます。
いいえ: 質問 3 に進みます。
容量を保持する期間の柔軟性が必要ですか?
はい: オンデマンド予約を使用するをご覧ください。
いいえ: 次の質問に進みます。
GPU などの需要の高いリソースが必要ですか?
「はい」の場合: 次の質問に進みます。
いいえ: 将来の予約を使用するをご覧ください。
90 日以上リソースが必要ですか?
はい: AI ハイパーコンピュータで容量を予約するをご覧ください。
いいえ: カレンダー モードで将来の予約を使用するをご覧ください。
オンデマンド予約を使用する
オンデマンド予約を使用すると、コンピューティング インスタンスの容量を予約し、予約するとすぐに使用できます。オンデマンド予約を作成した後、必要に応じて使用、変更、削除できます。
詳細については、予約についてをご覧ください。
将来の予約を使用する
一定期間インスタンスを予約するには、将来の予約を使用します。予約リクエストを作成したら、審査を受けるために Google Cloud に送信する必要があります。通常、Google Cloud がリクエストを審査するまでに 5 日かかります。リクエストが承認されると、Compute Engine は選択した日時にリクエストされた容量でオンデマンド予約を作成します。これらの予約を使用するには、予約を使用するコンピューティング インスタンスを作成します。予約期間が終了すると、予約を変更または削除できます。
詳細については、将来の予約リクエストについてをご覧ください。
カレンダー モードで将来の予約を使用する
GPU インスタンスまたは TPU を最大 90 日間予約するには、カレンダー モードで将来の予約を使用します。このタイプの予約を作成するには、まず、選択した数とタイプのリソースがリージョンで使用可能になる日時を確認します。次に、使用可能であることを確認したプロパティを使用して、予約リクエストを作成して送信します。リクエストを正常に作成できると、Google Cloud が 1 分以内に承認します。リクエストが承認されると、Compute Engine は次の処理を行います。
Compute Engine がオンデマンド予約を作成します。
Compute Engine は、ネットワーク レイテンシを最小限に抑えるために、リクエストされたリソースをできるだけ近くに予約します。
予約期間の開始時に、GPU インスタンスまたは TPU インスタンスを作成して予約を使用できます。予約期間の終了時に、Compute Engine は予約を削除し、インスタンスに指定した終了アクションに基づいて、予約を使用するインスタンスを停止または削除します。
詳細については、カレンダー モードでの将来の予約リクエストについてをご覧ください。
AI Hypercomputer で容量を予約する
アカウント チームに連絡して、大規模な AI と ML のワークロード用に GPU インスタンスの予約をリクエストします。Google が予約リクエストのドラフトを作成したら、すべてが正しいことを確認して審査に提出します。 Google Cloud はリクエストを直ちに承認し、Compute Engine は次の処理を行います。
Compute Engine がオンデマンド予約を作成します。
Compute Engine は、ネットワーク レイテンシを最小限に抑えるために、リクエストされたリソースをできるだけ近くに予約します。
Compute Engine は、トポロジ対応のスケジューリング、高度なモニタリング、メンテナンスを使用してリソースを予約します。
予約期間の開始時に、GPU インスタンスを作成して予約を使用できます。予約期間の終了時に、Compute Engine は予約を削除し、インスタンスに指定した終了アクションに基づいて、予約を使用するインスタンスを停止または削除します。
詳細については、AI Hypercomputer のドキュメントで容量を予約するをご覧ください。