Compute Engine インスタンスのプロビジョニング モデル


このドキュメントでは、Compute Engine インスタンスのプロビジョニング モデルについて説明します。デプロイ オプションの詳細については、ワークロードに対する Compute Engine のデプロイ戦略を選択するをご覧ください。

プロビジョニング モデルは、インスタンスの可用性、存続期間、料金を決定します。これらのモデルを理解することで、ワークロードに最適なオプションを選択できます。

使用可能なプロビジョニング モデル

コンピューティング インスタンスを作成するときに、次のいずれかのプロビジョニング モデルを指定できます。プロビジョニング モデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニング モデルを使用します。

次の表は、各プロビジョニング モデルのユースケースと料金を比較するのに役立ちます。

標準 スポット Flex-start(プレビュー 予約で制限
概要
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。ただし、Compute Engine がいつでもインスタンスを停止または削除して容量を再利用できるようにすることもできます。
  • ゾーン マネージド インスタンス グループ(MIG)を作成したら、GPU がアタッチされたインスタンスを MIG に追加するよう Compute Engine にリクエストします。Compute Engine は、リソースの可用性に基づいてインスタンスのプロビジョニングをスケジュールします。
  • インスタンスの削除タイミングを制御できます。ただし、停止、一時停止、再作成はできません。インスタンスは最大 7 日間実行されます。その後、Compute Engine によって自動的に削除されます。
  • GPU または TPU が接続されたインスタンスを作成するために、将来の日付に容量を予約するようリクエストできます。 Google Cloud がリクエストを承認すると、指定した日に使用を開始できる予約が作成されます。
  • 承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約と、その予約を使用するインスタンスを自動的に削除します。
ユースケース 次のワークロードなど、安定性と継続的な運用が必要なワークロードに最適です。
  • ウェブサーバー
  • データベース
  • エンタープライズ アプリケーション
  • 開発とテスト
次のようなワークロードなど、中断に耐えられるワークロードに最適です。
  • バッチ処理
  • ハイ パフォーマンス コンピューティング(HPC)
  • 継続的インテグレーションと継続的デプロイ(CI / CD)
  • データ分析
  • メディアのエンコード
  • オンライン推論
安定性が求められ、7 日以内に実行する必要があるワークロード。次のワークロードなどです。
  • 小規模モデルの事前トレーニング
  • モデルの微調整
  • HPC シミュレーション
  • バッチ推論
安定性と特定の実行時間を必要とするワークロードに最適です。たとえば、次のようなワークロードです。
  • 最大 90 日間続くワークロードの場合:
    • モデルの事前トレーニング ジョブ
    • モデルのファインチューニング ジョブ
    • HPC シミュレーション ワークロード
    • 短期的な推論ワークロードの増加が予想される
  • 90 日を超えるワークロードの場合:
    • トレーニング ワークロード
    • 推論ワークロード
料金 インスタンスに対して標準料金が請求されます。詳細については、VM インスタンスの料金をご覧ください。 ほとんどの vCPU、GPU、ローカル SSD は 60 ~ 91% の割引で利用できます。詳細については、Spot VM の料金をご覧ください。 インスタンスで使用しているマシンファミリーまたは TPU のバージョンに基づいて、vCPU、GPU、TPU が最大 53% 割引されます。Dynamic Workload Scheduler(DWS)の料金をご覧ください。 インスタンスが使用するマシン ファミリーに基づいて、vCPU と GPU で最大 53% の割引が適用されます。詳細については、アクセラレータ最適化 VM の料金をご覧ください。
割り当て インスタンスを作成すると、標準割り当てが消費されます。 インスタンスを作成すると、プリエンプティブル クォータ が消費されます。プロジェクトにプリエンプティブル割り当てがない場合、標準割り当てが消費されます。Google Cloud 無料枠クレジットは Spot VM には適用されません。 MIG がグループにインスタンスを追加すると、プリエンプティブル 割り当てが消費されます。プロジェクトにプリエンプティブル割り当てがない場合、標準割り当てが消費されます。 割り当ては、予約にバインドされたプロビジョニング モデルには適用されません。

インスタンスの可用性と存続期間

次の表に、各プロビジョニング モデルのコンピューティング インスタンスの可用性と存続期間を示します。

標準 スポット Flex-start(プレビュー 予約で制限
作成の前提条件 作成の前提条件はありません。 作成の前提条件はありません。 作成の前提条件はありません。 インスタンスを作成するには、まず複数のブロックの将来の予約リクエストを作成して容量を予約する必要があります。指定した日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して使用を開始できます。
サポートされているマシンシリーズ A4 と A3 Ultra を除く任意のマシンシリーズを使用できます。 次のマシンシリーズを除く任意のマシンシリーズを使用できます。
  • M2 と M3
  • ベアメタル インスタンス
使用できるマシンシリーズは次のとおりです。
VM を作成するために容量を予約する方法に基づいて、次のマシンシリーズのみを使用できます。
インスタンスの可用性 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。 インスタンスを作成できるのは、 MIG でサイズ変更リクエストを作成する方法のみです。Compute Engine は DWS を使用して、リソースの可用性に基づいてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを確実に取得できます。 インスタンスを作成できるのは、将来の日付の容量を予約した後のみです。リクエストされた日付に、Compute Engine はリクエストされた容量を提供します。この容量を使用してインスタンスを作成できます。TPU を予約すると、Compute Engine は DWS を使用して、リクエストされた容量をプロビジョニングします。DWS は、TPU などの需要の高いリソースを確実に取得できるようにします。
インスタンスの存続期間 インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーが原因でインスタンスが停止することがあります。
インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • Compute Engine は、キャパシティを再利用するために、インスタンスをいつでも停止または削除する場合があります。このプロセスはプリエンプションと呼ばれます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーが原因でインスタンスが停止することがあります。
プロビジョニングされたインスタンスは、選択した実行時間(最大 7 日間)間実行されます。インスタンスの停止、一時停止、再作成はできません。

Compute Engine は、次のいずれかが発生するとインスタンスを削除します。
  • インスタンスの削除をリクエストします。
  • インスタンスの実行時間が終了する。
インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。
  • Compute Engine は、ホスト メンテナンス イベント中にインスタンスを停止します。
  • リクエストされた容量をプロビジョニングするために自動作成された予約が、コミットされた予約期間の終了に達します。その時点で、Compute Engine は予約と、その予約を使用しているインスタンスを自動的に削除します。
  • まれに、ホストエラーが原因でインスタンスが停止することがあります。

次のステップ