このページは Cloud Translation API によって翻訳されました。

Compute Engine インスタンスのプロビジョニングモデル

Linux Windows

このドキュメントでは、Compute Engine インスタンスのプロビジョニングモデルについて説明します。デプロイオプションの詳細については、ワークロードに対する Compute Engine のデプロイ戦略を選択するをご覧ください。

プロビジョニングモデルにより、インスタンスの可用性、ライフサイクル、料金が決まります。これらのモデルを理解していれば、ワークロードに最適なオプションを選択できます。

利用可能なプロビジョニングモデル

コンピューティングインスタンスを作成するときに、次のいずれかのプロビジョニングモデルを指定できます。プロビジョニングモデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニングモデルを使用します。

標準
スポット
Flex Start
予約で制限

次の表は、各プロビジョニングモデルのユースケースと料金を比較するのに役立ちます。

	標準	スポット	Flex Start	予約で制限
概要	リソースの可用性に基づいて、インスタンスをすぐに作成できます。インスタンスの停止または削除のタイミングを制御できます。	リソースの可用性に基づいて、インスタンスをすぐに作成できます。インスタンスの停止または削除のタイミングを制御できます。ただし、容量を再利用するために Compute Engine がインスタンスを任意のタイミングで停止または削除できるようにします。	ゾーンマネージドインスタンスグループ（MIG）を作成したら、Compute Engine にリクエストして、GPU が割り当てられたインスタンスを MIG に追加します。Compute Engine は、リソースの可用性に基づいてインスタンスのプロビジョニングをスケジュールします。インスタンスを削除するタイミングを制御できます。ただし、停止、一時停止、再作成はできません。インスタンスは最大 7 日間実行されます。その後、Compute Engine はそれらを削除します。	GPU が割り当てられたインスタンスを作成するために、将来の日付で容量を予約できます。 Google Cloud がリクエストを承認すると、Compute Engine は予約を作成します。予約期間の開始時に、予約と一致する GPU インスタンスを作成して予約を消費できます。承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約を削除し、予約を消費するインスタンスを停止または削除します。
ユースケース	安定性と継続的な運用が必要なワークロードに適しています。たとえば、次のようなワークロードに最適です。ウェブサーバーデータベースエンタープライズアプリケーション開発とテスト	中断を許容できるワークロードに適しています。たとえば、次のようなワークロードに最適です。バッチ処理ハイパフォーマンスコンピューティング（HPC）継続的インテグレーションと継続的デプロイ（CI / CD）データ分析メディアのエンコードオンライン推論	安定性が求められ、7 日間以内に実行する必要があるワークロード。たとえば、次のようなワークロードに適しています。小規模モデルの事前トレーニングモデルのファインチューニング HPC シミュレーションバッチ推論	安定性と特定の実行時間を必要とするワークロードに適しています。たとえば、次のようなワークロードに最適です。最大 90 日間続くワークロードの場合: モデルの事前トレーニングジョブモデルのファインチューニングジョブ HPC シミュレーションワークロード推論ワークロードの短期的な増加の見込み 90 日を超えるワークロードの場合: トレーニングワークロード推論ワークロード
料金	インスタンスに対して標準料金が請求されます。VM インスタンスの料金をご覧ください。インスタンスの作成に使用するメソッドに応じて料金が発生します。インスタンスをすぐに作成する場合は、従量課金制（PAYG）で支払います。オンデマンド予約または将来の予約用に自動作成された予約を使用してインスタンスを作成すると、予約が存在する限り課金されます。詳細については、予約の課金をご覧ください。	ほとんどの vCPU、メモリ、GPU で 60 ～ 91% の割引が適用されます。また、A4 または A3 マシンタイプ、GPU、ローカル SSD ディスク、外部 IP アドレス、Tier_1 ネットワーキングの費用にも、割引率は低くなりますが割引が適用されます。詳細については、Spot VM の料金をご覧ください。 PAYG。	インスタンスで使用するマシンシリーズに応じて、次のように割引が適用されます。 A4、A3、A2 マシンシリーズの場合、vCPU、メモリ、GPU の割引率は 53% です。 H4D マシンシリーズの場合、vCPU とメモリの割引率は 25% です。サポートされている他のマシンシリーズは割引の対象外です。詳細については、Dynamic Workload Scheduler（DWS）の料金をご覧ください。 PAYG。	インスタンスの作成用に容量を予約する方法に応じて、次のように料金が発生します。 AI Hypercomputer で容量を予約すると、アクセラレータ最適化 VM の料金に基づいて課金されます。1 年以上リソースを予約する場合は、リソースベースのコミットメントを購入して、予約したリソースに関連付ける必要があります。カレンダーモードで将来の予約を使用して容量を予約すると、 Dynamic Workload Scheduler（DWS）の料金に基づいて料金が発生します。予約期間に対して料金が発生します。詳細については、予約の課金をご覧ください。
割り当て	インスタンスを作成すると、標準の割り当てが消費されます。	インスタンスを作成すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。Google Cloud の無料枠クレジットは Spot VM に適用されません。	MIG がグループにインスタンスを追加すると、プリエンプティブルな割り当てが消費されます。プロジェクトにプリエンプティブルな割り当てがない場合は、標準の割り当てが使用されます。	割り当ては、予約で制限されたプロビジョニングモデルには適用されません。

インスタンスの可用性とライフサイクル

次の表に、各プロビジョニングモデルのコンピューティングインスタンスの可用性と存続期間を示します。

	標準	スポット	Flex Start	予約で制限
作成の前提条件	作成の前提条件はありません。	作成の前提条件はありません。	作成の前提条件はありません。	インスタンスを作成するには、まず次のいずれかの方法で容量を予約する必要があります。長時間実行されるワークロードの容量を予約するには、AI Hypercomputer の将来の予約を使用します。最大 90 日間実行されるワークロードの容量を予約するには、カレンダーモードの将来の予約を使用します。選択した配信日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して容量を消費できます。
サポートされているマシンシリーズ	A4X、A4 と A3 Ultra を除く任意のマシンシリーズを使用できます。	A4X、X4、ベアメタルインスタンスを除く任意のマシンシリーズを使用できます。	使用できるマシンシリーズは次のとおりです。 A4、A3、A2、G2 マシンシリーズ GPU が割り当てられた N1 仮想マシン（VM）インスタンス H4D マシンシリーズ	VM を作成するための容量を予約する方法に応じて、次のマシンシリーズのみを使用できます。 AI Hypercomputer で容量を予約する場合は、A4X、A4、A3 Ultra マシンシリーズのみを使用できます。カレンダーモードで将来の予約を作成する場合は、A4 マシンシリーズと A3 Ultra マシンシリーズのみを使用できます。
インスタンスの可用性	リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。	リクエストしたリソースが使用可能な限り、インスタンスはいつでも作成できます。	次のようにインスタンスを作成できます。スタンドアロンインスタンスを作成する。 MIG のサイズ変更リクエストを作成します。 Compute Engine は、 DWS を使用して、リソースの可用性に基づいてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。	インスタンスを作成できるのは、将来の日付の容量を予約した後です。リクエストされた日になると、Compute Engine はリクエストされた容量を配信します。この容量を使用してインスタンスを作成できます。カレンダーモードで将来の予約を使用してリソースを予約すると、Compute Engine は DWS を使用してリクエストされた容量をプロビジョニングします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。
容量保証	作成方法に基づく。容量保証は、インスタンスの作成に使用する方法に応じて次のように異なります。インスタンスをすぐに作成すると、Compute Engine はリクエストされた容量をプロビジョニングするためにベストエフォートで試行します。オンデマンド予約または将来の予約の自動作成された予約を使用してインスタンスを作成する場合、予約に予約済み容量が使用可能であれば、Compute Engine がリクエストされた容量をプロビジョニングする可能性は非常に高くなります。	ベストエフォート。Spot VM を作成すると、Compute Engine はリクエストされた容量をプロビジョニングするためにベストエフォートで試行します。	ベストエフォート。MIG のサイズ変更リクエストを作成すると、Compute Engine はリクエストされた容量のプロビジョニングをスケジュールするためにベストエフォートで試行します。	非常に高い。 Google Cloud が予約リクエストを承認すると、Compute Engine が選択した配信日時に予約済み容量をプロビジョニングする可能性が非常に高くなります。予約期間中は、予約した容量に排他的にアクセスできます。
インスタンスの存続期間	インスタンスの停止または削除のタイミングを制御できます。ただし、インスタンスが使用するマシンタイプがライブマイグレーションをサポートしていない場合、Compute Engine はホストメンテナンスイベント中にインスタンスを停止します。	インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、容量を再利用するためにインスタンスを停止または削除します。このプロセスはプリエンプションと呼ばれます。インスタンスが使用するマシンタイプがライブマイグレーションをサポートしていない場合、Compute Engine はホストメンテナンスイベント中にインスタンスを停止します。	インスタンスが実行時間の終了に達する前に、次の操作を行うことができます。インスタンスを停止する: スタンドアロンインスタンスとして作成された場合にのみ、いつでもインスタンスを停止できます。インスタンスを削除する: インスタンスはいつでも削除できます。インスタンスの実行時間が終了すると、Compute Engine はインスタンスを削除します。	インスタンスの停止または削除のタイミングは、次のケースを除き、制御できます。 Compute Engine は、ホストメンテナンスイベント中にインスタンスを停止します。リクエストされた容量をプロビジョニングするために自動的に作成された予約に対して、確約された予約期間が終了します。その時点で、Compute Engine は予約を削除し、構成で指定された終了アクションに基づいて、予約を消費するインスタンスを停止または削除します。

次のステップ

Compute Engine インスタンスの作成の概要を確認する。
Spot プロビジョニングモデルを使用してインスタンスを作成するには、Spot VM をご覧ください。
プロビジョニングモデルを使用するスタンドアロンインスタンスを作成するには、Flex Start VM についてをご覧ください。
Flex Start プロビジョニングモデルを使用して複数のインスタンスを作成するには、MIG のサイズ変更リクエストについてをご覧ください。
予約にバインドされたモデルを使用してインスタンスを作成するために容量を予約するには、次のいずれかのオプションをご覧ください。
- カレンダーモードでの将来の予約リクエストについて
- AI Hypercomputer で容量を予約する

Compute Engine インスタンスのプロビジョニング モデル

利用可能なプロビジョニング モデル

インスタンスの可用性とライフサイクル

次のステップ

Compute Engine インスタンスのプロビジョニングモデル

利用可能なプロビジョニングモデル